Red de Bibliotecas Virtuales de Ciencias Sociales en
América Latina y el Caribe

logo CLACSO

Por favor, use este identificador para citar o enlazar este ítem: https://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/22367
Título : Propuesta, validación y prueba de una arquitectura para modelado de portales WEB semánticos basados en interacción por voz
Proposal, validation and testing of an architecture for modeling semantic WEB portals based on voice interaction
Autor : Carrillo Zambrano, Eduardo
https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000068560
https://scholar.google.es/citations?hl=es&user=kYG-lPUAAAAJ
https://orcid.org/0000-0002-0868-940X
https://www.scopus.com/authid/detail.uri?authorId=15622921600
https://www.researchgate.net/profile/Eduardo_Carrillo_Zambra
Instituto Tecnológico de Estudios Superiores de Monterrey (ITESM)
Grupo de Investigación Preservación e Intercambio Digital de Información y Conocimiento - Prisma
Palabras clave : Computational linguistics;Information storage systems;Information retrieval systems;Automatic speech recognition;Human-machine interaction;Systems engineering;Computer science;Investigations;Analysis;Web architecture;Voice interaction;Speech recognition;Rules of inference;Semantic web;Lingüística computacional;Sistemas de almacenamiento de información;Sistemas de recuperación de información;Reconocimiento automático de voz;Interacción hombre-máquina;Ingeniería de sistemas;Ciencias computacionales;Investigaciones;Análisis;Arquitectura web;Interacción por voz;Reconocimiento de Voz;Reglas de Inferencia;Web semántica
Editorial : Universidad Autónoma de Bucaramanga UNAB
Facultad Ingeniería
Maestría en Ciencias Computacionales
Descripción : El objetivo principal de este trabajo es el desarrollo de una propuesta de arquitectura software para la implementación de portales Web semánticos basados en interacción por voz. Este trabajo plantea, los componentes software requeridos para el modelado de portales semánticos tomando como punto de partida la arquitectura genérica propuesta por Tim Berners-Lee, con la cual se identifican elementos con mayor granularidad de detalle. Por otra parte se hace una revisión de los componentes software y consideraciones requeridas para incluir una interface de interacción vocal con un portal Web semántico, para realizar búsquedas usando lenguaje hablado. Como aporte al proyecto se implementó reglas de inferencia usando, SWRL y JESS.
Instituto Tecnológico y de Estudios Superiores de Monterrey
RESUMEN.............................................................................................................16 1. INTRODUCCION...............................................................................................17 1.1 OBJETIVO GENERAL.....................................................................................19 1.2 OBJETIVOS ESPECÍFICOS............................................................................19 2. WEB SEMANTICA.............................................................................................21 2.1 ¿QUÉ ES UNICODE?......................................................................................22 2.2 URI, URL, URN................................................................................................24 2.2.2 URL Uniform Resource Locutor....................................................................25 2.2.3 URN Uniform Resource Names....................................................................26 2.3 XML (Extensive Markup Language).................................................................26 2.3.3 Documentos XML bien formados.................................................................27 2.3.4 Espacios de Nombres (NameSpaces)..........................................................27 2.3.5 XML Schema................................................................................................27 2.4 RDF (RESOURCE DESCRIPTION FRAMEWORK)........................................28 2.4.1 Rdf básico.....................................................................................................29 2.4.1.3 Sentencias.................................................................................................29 2.4.2 Metadatos.....................................................................................................30 2.4.3 Rdf Esquema (Rdf Schema).........................................................................30 2.5 CAPA DE ONTOLOGÍA...................................................................................31 2.6 Capa Lógica.....................................................................................................34 2.7 CAPAS PROOF Y TRUST...............................................................................37 2.7.1 Firmas Digitales y “redes de confianza”........................................................37 2.7.2 ¿Qué es la Seguridad?.................................................................................39 2.7.3 ¿Para qué sirve?...........................................................................................39 3. EL PROBLEMA DEL RECONOCIMIENTO DE VOZ.........................................41 3.1 CONCEPTOS FUNDAMENTALES..................................................................41 3.2 FACTORES PRINCIPALES EN LA PROBLEMÁTICA DEL RECONOCIMIENTO DEL HABLA.........................................................................42 3.2.1 El Locutor......................................................................................................42 3.2.2 La forma de hablar........................................................................................42 3.2.3 El Vocabulario...............................................................................................43 3.2.4 La Gramática................................................................................................43 3.2.5 EL Entorno Físico.........................................................................................44 3.3 MODOS FUNDAMENTALES DE HABLAR FRENTE A UN SISTEMA DE RECONOCIMIENTO..............................................................................................44 3.3.2 Habla Conectada..........................................................................................44 3.3.3 Habla Continua.............................................................................................45 3.4 LA CONVERSIÓN TEXTO-VOZ.....................................................................45 4. TECNOLOGIAS PARA EL RECONOCIMIENTO DE VOZ.................................47 4.1 Técnicas para el reconocimiento de fonemas y palabras................................47 4.1.1 Técnicas Topológicas...................................................................................47 4.1.2 Técnicas Probabilísticas...............................................................................48 4.1.3 Redes Neuronales........................................................................................49 4.2 APLICACIONES TECNOLÓGICAS PARA EL RECONOCIMIENTO DE VOZ.50 4.2.1 Motor SDK (Software Development Kit).......................................................50 4.2.3 Philips:..........................................................................................................52 4.2.4 Sistemas Telefónicos de AT&T:....................................................................52 4.2.5 IBM Vía Voice...............................................................................................52 4.2.6 Dragón Naturally Speaking:..........................................................................52 4.2.7 Java Speech API..........................................................................................5 4.2.7.1 Objetivos de Diseño...................................................................................5 4.2.7.2 El Paquete Javax.speech...........................................................................55 4.2.8 Microsoft Speech Api....................................................................................55 4.3 VOICE XML....................................................................................................57 4.3.1 Ejemplos VoiceXML......................................................................................58 4.3.2 Observación Tecnológica.............................................................................60 4.3.3 Objetivos de VoiceXML.................................................................................60 4.3.4 Principios de Diseño.....................................................................................60 4.3.5 Conceptos Fundamentales...........................................................................61 5. METADATOS PARA INFORMACIÓN AUDIBLE...............................................62 5.1 VOICE EXTENSIBLE MARKUP LANGUAGE (VOICEXML)............................63 5.1.1 Observación..................................................................................................65 5.1.2 Entrada del Usuario......................................................................................65 5.1.3 Elementos de XML para SGRS....................................................................66 5.1.4 Interpretación Semántica de la Entrada........................................................66 5.1.5 Información de Metadatos.............................................................................66 5.1.6 Elemento <meta>..........................................................................................67 5.1.7 Elemento metadata.......................................................................................69 5.2 SPEECH RECOGNITION GRAMMAR SPECIFICATION (SRGS)....................71 5.2.1 Interpretación Semántica..............................................................................71 5.2.2 Meta Datos....................................................................................................73 5.2.3 Elementos Meta y HTTP-Equiv.....................................................................73 5.2.4 XML Metadata (XML Unicamente)................................................................74 5.3 SPEECH SYNTHESIS MARKUP LANGUAGE (SSML) Version 1.0...............76 5.3.1 Elemento meta..............................................................................................77 5.3.2 Elemento metadata.......................................................................................78 5.4 SEMANTIC INTERPRETATION FOR SPEECH RECOGNITION (SISR)........80 5.4.1 Principios Básicos.........................................................................................81 5.4.2 Reglas de Variables y Valores Semánticos..................................................82 5.6 CALL CONTROL EXTENSIBLE MARKUP LANGUAGE.................................84 5.6.1 Elementos META y METADATA...................................................................86 5.6.2 Elemento <metadata>...................................................................................87 6. DESCRIPCIÓN DE LA ARQUITECTURA PROPUESTA Y CASO DE ESTUDIO: LABORATORIO DE CÓMPUTO ESPECIALIZADO DE LA UNIVERSIDAD AUTÓNOMA DE BUCARAMANGA.......................................................................89 6.1 CAPA DE USUARIO........................................................................................90 6.2 CAPA NAVEGADOR.......................................................................................90 6.3 ZONA INTERNET............................................................................................90 6.4 SERVIDOR WEB-VOZ....................................................................................91 6.5 CAPA SEMÁNTICA........................................................................................92 6.6 DESCRIPCIÓN DEL PROTOTIPO..................................................................93 6.6.1 Definición de la Base de conocimiento.........................................................93 6.6.2 Definición del manejador de la Ontología.....................................................94 6.6.3 Definición de las Reglas...............................................................................96 6.6.4 Inferencia de conocimiento por medio de las Reglas....................................97 6.6.5 Definición y Diseño de Interfaces..................................................................98 6.6.5.1 Interface Visual..........................................................................................98 6.6.5.2 Interface de Voz.......................................................................................105 7. Conclusiones Y Trabajo Futuro.......................................................................113 REFERENCIAS...................................................................................................116
Maestría
In this article we describe the proposal for a software architecture to the semantic portal Web implementation based in voice interaction. This work shows the required software components for the semantic portal modeling, taking as the starting point the generic architecture proposed by Tim Berners-Lee, by which they identify elements with greater detail information. By the other side we make a re-examination of the software components and the required considerations to include a vocal interaction interface with a semantic portal Web, to realize searches using spoken language. As a contribution we applied inference rules using SWRL and JESS.
URI : http://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/22367
Otros identificadores : http://hdl.handle.net/20.500.12749/3317
instname:Universidad Autónoma de Bucaramanga - UNAB
reponame:Repositorio Institucional UNAB
Aparece en las colecciones: Instituto de Estudios Políticos - IEP - Cosecha

Ficheros en este ítem:
No hay ficheros asociados a este ítem.


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.