Repositorio Dspace

Propuesta, validación y prueba de una arquitectura para modelado de portales WEB semánticos basados en interacción por voz

Mostrar el registro sencillo del ítem

dc.contributor Carrillo Zambrano, Eduardo
dc.contributor https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000068560
dc.contributor https://scholar.google.es/citations?hl=es&user=kYG-lPUAAAAJ
dc.contributor https://orcid.org/0000-0002-0868-940X
dc.contributor https://www.scopus.com/authid/detail.uri?authorId=15622921600
dc.contributor https://www.researchgate.net/profile/Eduardo_Carrillo_Zambra
dc.contributor Instituto Tecnológico de Estudios Superiores de Monterrey (ITESM)
dc.contributor Grupo de Investigación Preservación e Intercambio Digital de Información y Conocimiento - Prisma
dc.creator Méndez Ortíz, Freddy
dc.creator Vecino Pico, Hugo
dc.date 2020-06-26T21:32:18Z
dc.date 2020-06-26T21:32:18Z
dc.date 2006-04-17
dc.date.accessioned 2022-03-14T20:13:55Z
dc.date.available 2022-03-14T20:13:55Z
dc.identifier http://hdl.handle.net/20.500.12749/3317
dc.identifier instname:Universidad Autónoma de Bucaramanga - UNAB
dc.identifier reponame:Repositorio Institucional UNAB
dc.identifier.uri http://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/22367
dc.description El objetivo principal de este trabajo es el desarrollo de una propuesta de arquitectura software para la implementación de portales Web semánticos basados en interacción por voz. Este trabajo plantea, los componentes software requeridos para el modelado de portales semánticos tomando como punto de partida la arquitectura genérica propuesta por Tim Berners-Lee, con la cual se identifican elementos con mayor granularidad de detalle. Por otra parte se hace una revisión de los componentes software y consideraciones requeridas para incluir una interface de interacción vocal con un portal Web semántico, para realizar búsquedas usando lenguaje hablado. Como aporte al proyecto se implementó reglas de inferencia usando, SWRL y JESS.
dc.description Instituto Tecnológico y de Estudios Superiores de Monterrey
dc.description RESUMEN.............................................................................................................16 1. INTRODUCCION...............................................................................................17 1.1 OBJETIVO GENERAL.....................................................................................19 1.2 OBJETIVOS ESPECÍFICOS............................................................................19 2. WEB SEMANTICA.............................................................................................21 2.1 ¿QUÉ ES UNICODE?......................................................................................22 2.2 URI, URL, URN................................................................................................24 2.2.2 URL Uniform Resource Locutor....................................................................25 2.2.3 URN Uniform Resource Names....................................................................26 2.3 XML (Extensive Markup Language).................................................................26 2.3.3 Documentos XML bien formados.................................................................27 2.3.4 Espacios de Nombres (NameSpaces)..........................................................27 2.3.5 XML Schema................................................................................................27 2.4 RDF (RESOURCE DESCRIPTION FRAMEWORK)........................................28 2.4.1 Rdf básico.....................................................................................................29 2.4.1.3 Sentencias.................................................................................................29 2.4.2 Metadatos.....................................................................................................30 2.4.3 Rdf Esquema (Rdf Schema).........................................................................30 2.5 CAPA DE ONTOLOGÍA...................................................................................31 2.6 Capa Lógica.....................................................................................................34 2.7 CAPAS PROOF Y TRUST...............................................................................37 2.7.1 Firmas Digitales y “redes de confianza”........................................................37 2.7.2 ¿Qué es la Seguridad?.................................................................................39 2.7.3 ¿Para qué sirve?...........................................................................................39 3. EL PROBLEMA DEL RECONOCIMIENTO DE VOZ.........................................41 3.1 CONCEPTOS FUNDAMENTALES..................................................................41 3.2 FACTORES PRINCIPALES EN LA PROBLEMÁTICA DEL RECONOCIMIENTO DEL HABLA.........................................................................42 3.2.1 El Locutor......................................................................................................42 3.2.2 La forma de hablar........................................................................................42 3.2.3 El Vocabulario...............................................................................................43 3.2.4 La Gramática................................................................................................43 3.2.5 EL Entorno Físico.........................................................................................44 3.3 MODOS FUNDAMENTALES DE HABLAR FRENTE A UN SISTEMA DE RECONOCIMIENTO..............................................................................................44 3.3.2 Habla Conectada..........................................................................................44 3.3.3 Habla Continua.............................................................................................45 3.4 LA CONVERSIÓN TEXTO-VOZ.....................................................................45 4. TECNOLOGIAS PARA EL RECONOCIMIENTO DE VOZ.................................47 4.1 Técnicas para el reconocimiento de fonemas y palabras................................47 4.1.1 Técnicas Topológicas...................................................................................47 4.1.2 Técnicas Probabilísticas...............................................................................48 4.1.3 Redes Neuronales........................................................................................49 4.2 APLICACIONES TECNOLÓGICAS PARA EL RECONOCIMIENTO DE VOZ.50 4.2.1 Motor SDK (Software Development Kit).......................................................50 4.2.3 Philips:..........................................................................................................52 4.2.4 Sistemas Telefónicos de AT&T:....................................................................52 4.2.5 IBM Vía Voice...............................................................................................52 4.2.6 Dragón Naturally Speaking:..........................................................................52 4.2.7 Java Speech API..........................................................................................5 4.2.7.1 Objetivos de Diseño...................................................................................5 4.2.7.2 El Paquete Javax.speech...........................................................................55 4.2.8 Microsoft Speech Api....................................................................................55 4.3 VOICE XML....................................................................................................57 4.3.1 Ejemplos VoiceXML......................................................................................58 4.3.2 Observación Tecnológica.............................................................................60 4.3.3 Objetivos de VoiceXML.................................................................................60 4.3.4 Principios de Diseño.....................................................................................60 4.3.5 Conceptos Fundamentales...........................................................................61 5. METADATOS PARA INFORMACIÓN AUDIBLE...............................................62 5.1 VOICE EXTENSIBLE MARKUP LANGUAGE (VOICEXML)............................63 5.1.1 Observación..................................................................................................65 5.1.2 Entrada del Usuario......................................................................................65 5.1.3 Elementos de XML para SGRS....................................................................66 5.1.4 Interpretación Semántica de la Entrada........................................................66 5.1.5 Información de Metadatos.............................................................................66 5.1.6 Elemento <meta>..........................................................................................67 5.1.7 Elemento metadata.......................................................................................69 5.2 SPEECH RECOGNITION GRAMMAR SPECIFICATION (SRGS)....................71 5.2.1 Interpretación Semántica..............................................................................71 5.2.2 Meta Datos....................................................................................................73 5.2.3 Elementos Meta y HTTP-Equiv.....................................................................73 5.2.4 XML Metadata (XML Unicamente)................................................................74 5.3 SPEECH SYNTHESIS MARKUP LANGUAGE (SSML) Version 1.0...............76 5.3.1 Elemento meta..............................................................................................77 5.3.2 Elemento metadata.......................................................................................78 5.4 SEMANTIC INTERPRETATION FOR SPEECH RECOGNITION (SISR)........80 5.4.1 Principios Básicos.........................................................................................81 5.4.2 Reglas de Variables y Valores Semánticos..................................................82 5.6 CALL CONTROL EXTENSIBLE MARKUP LANGUAGE.................................84 5.6.1 Elementos META y METADATA...................................................................86 5.6.2 Elemento <metadata>...................................................................................87 6. DESCRIPCIÓN DE LA ARQUITECTURA PROPUESTA Y CASO DE ESTUDIO: LABORATORIO DE CÓMPUTO ESPECIALIZADO DE LA UNIVERSIDAD AUTÓNOMA DE BUCARAMANGA.......................................................................89 6.1 CAPA DE USUARIO........................................................................................90 6.2 CAPA NAVEGADOR.......................................................................................90 6.3 ZONA INTERNET............................................................................................90 6.4 SERVIDOR WEB-VOZ....................................................................................91 6.5 CAPA SEMÁNTICA........................................................................................92 6.6 DESCRIPCIÓN DEL PROTOTIPO..................................................................93 6.6.1 Definición de la Base de conocimiento.........................................................93 6.6.2 Definición del manejador de la Ontología.....................................................94 6.6.3 Definición de las Reglas...............................................................................96 6.6.4 Inferencia de conocimiento por medio de las Reglas....................................97 6.6.5 Definición y Diseño de Interfaces..................................................................98 6.6.5.1 Interface Visual..........................................................................................98 6.6.5.2 Interface de Voz.......................................................................................105 7. Conclusiones Y Trabajo Futuro.......................................................................113 REFERENCIAS...................................................................................................116
dc.description Maestría
dc.description In this article we describe the proposal for a software architecture to the semantic portal Web implementation based in voice interaction. This work shows the required software components for the semantic portal modeling, taking as the starting point the generic architecture proposed by Tim Berners-Lee, by which they identify elements with greater detail information. By the other side we make a re-examination of the software components and the required considerations to include a vocal interaction interface with a semantic portal Web, to realize searches using spoken language. As a contribution we applied inference rules using SWRL and JESS.
dc.format application/pdf
dc.format application/pdf
dc.format application/octet-stream
dc.format application/octet-stream
dc.language spa
dc.publisher Universidad Autónoma de Bucaramanga UNAB
dc.publisher Facultad Ingeniería
dc.publisher Maestría en Ciencias Computacionales
dc.relation Méndez Ortiz, Freddy, Vecino Pico, Hugo (2006). Propuesta, validación y prueba de una arquitectura para modelado de portales WEB semánticos basados en interacción por voz. Bucaramanga (Colombia) : Universidad Autónoma de Bucaramanga UNAB, Instituto Tecnológico y de Estudios Superiores de Monterrey
dc.relation [ARC98] Fabio Arciniegas, Extensible Markup Language (XML), 1999, cosultado en octubre de 2005, disponible en http://www.sidar.org/recur/desdi/traduc/es/xml/xml1/index.html
dc.relation [AGU94] Lourdes Aguilar, Josep M. Fernández, Juan M. Garrido, Joaquim, Llisterri, Diseño de pruebas para la evaluación de habla sintetizada en español y su aplicación a un sistema de conversión de texto a habla, 1994, consultado en Agosto de 2005, disponible en http://liceu.uab.es/~joaquim/publicacions/cordoba_94.html
dc.relation [BER06] The World Wide Web: Past, Present and Future, Tim Berners-Lee, 1996, consultado en Agosoto de 2004, disponible en http://www.w3.org/People/Berners-Lee/1996/ppf.ht
dc.relation [CAS04] Carlos Castillo, URI y URL, 2004, consultado en octubre de 2005, disponible en http://www.tejedoresdelWeb.com/307/article-5671.html#h2_2
dc.relation [CLO03] Cloud Garden JSAPI. Mayo de 2’’3, visitado en Septiembre de 2005, disponible en http://www.cloudgarden.com/JSAPI/index.html
dc.relation [CLE06] Clearing House, Nacional de Datos Geográficos, visitado en Enero de 2006, disponible en, http://www.clearinghouse.com.uy/datos/quees.aspx
dc.relation [DUC05] Dubling Core, disponible en, http://dublincore.org/ visitado en septiembre de 2005.
dc.relation [DRA99] DRAGON Corporation. Dragon Naturally speaking. 1999. Ayuda del software. Pagina empresarial http://www.nuance.com/
dc.relation [ENT05] Software de Reconocimiento de vos y conversores de voz, 2005, disponible en http://www.entrebits.com/descargas/Utilidades/Reconocimiento_de_Voz_y_Conversores/
dc.relation [EUS03] Reconocimiento de Voz Automático. Febrero de 2003, visitado en Julio de 2005, disponible en http://www.euskalnet.net/iosus/speech/recog.html
dc.relation [GAR02] Carolina García Cataño, David Arroyo Menéndez, Biblioteca Digital y Web Semántica, 2002, consultado en noviembre de 2005, disponible en http://www.sindominio.net/biblioWeb/telematica/bibdigWebsem.html
dc.relation [GON02] César González Ferreras, Prototipo de Navegador Vocal, 2002, consultado en julio de 2005, disponible en http://verbo.dcs.fi.uva.es/~cesargf/Personal/prototipo/proyVXMLlagm.pdf [GRU93] T. Gruber, “Toward Principles for the Design of Ontologies Used for Knowledge Sharing”. Technical Report KSL-93-04, Knowledge Systems Laboratory, Stanford University, CA, 1993
dc.relation [HER01] Estado del arte en Tecnología del Habla, L. Hernández Gómez, F. J. Caminero Gil, UNIVERSIDAD POLITÉCNICA DE MADRID, C. de la Torre Munilla, L. Villarrubia Grande, TELEFÓNICA INVESTIGACIÓN Y DESARROLLO
dc.relation [HER03] E.Peis. Herrera; Y. Hassan; J.C. Herrera, , “análisis de la Web semántica: estado actual y requisitos futuros”, revista el profesional de la información vol 12 numero 5 septiembre a octubre de 2003.
dc.relation [IBM03] IBM. IBM Vía voice. WebSphere Application Server for Telecom. Ayuda del software, se puede visiar http://www-306.ibm.com/software/info1/Websphere/index.jsp?tab=products/mobilespeech
dc.relation [ISO 8879] ISO (International Organization for Standardization). ISO 8879:1986(E). Information processing -- Text and Office Systems -- Standard Generalized Markup Language (SGML). First edition -- 1986-10-15. [Geneva]: International Organization for Standardization, 1986.
dc.relation [JES05] Jess the Rule Engine for the JavaTM Platform, jessrules, Noviembre de 2005, disponible en http://www.jessrules.com/jess/index.shtml
dc.relation [JMO03] J. Moreno. Arquitectura de la Interfaz Microsoft Speech Api 4.0 , Mayo de 2003, visitado en Septiembre de 2005, disponible en http://www.infor.uva.es/~descuder/proyectos/sapi/Arquit.html#
dc.relation [MAR015] W3C Semantic Web Activity, Marja-Riitta Koivunen and Eric Millar, Noviembre de 2001, disponible en http://www.w3.org/2001/12/semWeb-fin/w3csw
dc.relation [MAR03] María de los A. Martín, M. F. Bertoa, A. Vallecillo, L. Olsina, Hacia un Enfoque Semántico para la Catalogación de Métricas, GIDIS, Departamento de Informática, UNLPam, 2003, disponible en http://www.lcc.uma.es/~av/Publicaciones/02/CACIC02.pdf
dc.relation [MAR04] Juan Julian Merelo Cuervos, Introducción al lenguaje XML, 2004, consultada en octubre de 2005, disponible en http://geneura.ugr.es/~jmerelo/xml/
dc.relation [MART04] María de los Angeles Martin, Sistema de Catalogación de metricas e indicadores con potencia de Web, Universidad Nacional de la Pampa, Argentina, 2004, disponible en http://gidis.ing.unlpam.edu.ar/home/downloads/Tesis-Martin.pdf
dc.relation [MEN00] Eva Méndez Rodríguez, Metadatos y Tesauros: Aplicación de XML/RDF a los sistemas de organización del conocimiento en intranets, Universidad Carlos III, Madrid, 2000.
dc.relation [MEN00a] Eva Méndez Rodríguez, RDF: UN MODELO DE METADATOS FLEXIBLE PARA LASBIBLIOTECAS DIGITALES DEL PRÓXIMO MILENIO, Universidad Carlos III, Madrid, 2000, disponible en http://www.cobdc.org/jornades/7JCD/1.pdf
dc.relation [MEN01] Eva Mendez, Resource Description Framework(RDF), Especificación del Modelo y la Sintaxis, 2001, visitado en octubre de 2005, disponible en http://www.sidar.org/recur/desdi/traduc/es/rdf/rdfesp.htm
dc.relation [MEN99] Eva Méndez Rodriguez, Metadatos, XML/RDF, 1999, visitado en noviembre de 2005, disponible en http://rayuela.uc3m.es/~mendez/cursos/xml/RDF.pp
dc.relation [MOR00] Michael Morrison, XML al descubierto, pág. 13, Prentice Hall, 200
dc.relation [MOR00a] Michael Morrison, XML al descubierto, pág. 26, Prentice Hall, 2000.
dc.relation [NWG05] Network Working Group, T. Berners-Lee, disponible en, http://www.gbiv.com/protocols/uri/rfc/rfc3986.html
dc.relation [PEI03] Peis Redondo, Eduardo, Hassan Montero, Yusef, Herrera Viedma, Enrique, Herrera, Juan Carlos, Universidad de Granada, España, Ontologías, metadatos y agentes: recuperación “semántica” de la información,2003, disponible en http://www.nosolousabilidad.com/hassan/jotri2003.pdf
dc.relation [QUA04] Quantum Technology, Nuevo Equipo Multifunción Mountbatten Pro, Visitdo en Julio de 2005, disponible en http://www.quantech.com.au/products/quantum_products/foreignlanguages/spanishmb.htm
dc.relation [ROL02] N. Moreno Vergara, M. M. Roldán García, J. F. Aldana Montes, Compromiso entre Expresividad y Capacidad de Inferencia en Lenguajes para el Procesamiento de Consultas Basado en Ontologías, Dpto. Lenguajes y Ciencias de la Computación, Universidad de Málaga, 2002, disponible en http://kybele.escet.urjc.es/RedBD/Articulos/Art_05.pdf
dc.relation [RDF04] Resource Description Framework (RDF): Concepts and Abstract Syntax, W3C Recommendation 10 February, 2004disponible en http://www.w3.org/TR/rdf-concepts/
dc.relation [SAL02] Joaquin Salvachua Rodríguez, Jxta_Edutella_El_Web_Semantico_Distribuido, Universidad Politecnica de Madrid, 2002.
dc.relation [SAN03] Ismael Sanz, Juan Manuel Pérez, Rafael Berlanga, Hacia una arquitectura de referencia para la integración semántica de información, Universidad Jaime I de Castellon, 2003, disponible en http://kybele.escet.urjc.es/RedBD/Articulos/Art_10.pdf
dc.relation [SPE03] Speech Links. Mayo de 2003, visitado en Septiembre de 2005, disponible en http://www.o2a.com/Sp_Links.htm#Articles/Publications
dc.relation [SPE05] Speech Recognition Ware (SRW), Febrero. 2003, visitado en Agosto de 2005, disponible en, http://speechware.be/english/index.htm
dc.relation [STU98] S. Studer, R. Benjamins, D. Fensel, “Knowledge Engineering: Principles and Methods” Data and knowledge Engineering, 25, 161-197, 1998
dc.relation [SUN03] Sun Microsystems. What is the Java Speech Api?, Marzo. 2003. visitado en Agosto de 2005, disponible en, http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide-0.7/Introduction.html#780
dc.relation [SUN03a] Sun Microsystems. Guía de JSAPI, Marzo de 2003, visitado en Agosot de 2005, disponible en http://java.sun.com/products/java-media/speech/forDevelopers/jsapi-guide-0.7/7408
dc.relation [SUN03b] Sun Microsystems. Speech Recognition: Javax.speech.recognition. Marzo de 2003, visitado en Septiembre de 2005, disponible en http://java.sun.com/products/java-mediaspeech/forDevelopers/jsapi-guide-0.7/Recognition.html#7408
dc.relation [SWL03] SWRL: A Semantic Web Rule Language Combining OWL and RuleML, dalm.org, Noviembre de 2003, disponible en http://www.daml.org/2003/11/swrl/
dc.relation [TBL02] Tim Berners Lee, Japon 2002, disponible, http://www.w3.org/2002/Talks/04-sWeb/slide1-0.html
dc.relation [TEJ04] Tejedores del Web, URIs: Identificadores Universales de Recursos, visitado en Agosto de 2005, dispoible en http://www.tejedoresdelWeb.com/307/article-5671.html#h2_3
dc.relation [TEL05] Telefónica de España, I+D, Articulos y Conferencias, 2005, visitado en Octubre de 2005, disponible en http://www.tid.es/html/articulos_conferencias.html
dc.relation [UNI91] Unicode.org, ¿Qué es Unicode?, 1991-2006, consultado en octubre de 2005, disponible en http://www.unicode.org/standard/translations/spanish.html
dc.relation [W3C04] W3C Forum VoiceXML, 2004, visitado en Agosto de 2005, disponible en http://www.w3.org/TR/2004/PR-voicexml20-20040203/#dml1.2
dc.relation [W3C04a] W3C Forum VoiceXML, 2004, visitado en Agosto de 2005, disponible en http://www.w3.org/TR/2004/PR-voicexml20-20040203/#dmlAAudioFormats
dc.relation [W3C04b] W3C Forum VoiceXML, 2004, visitado en Agosto de 2005, disponible en http://www.w3.org/TR/2004/PR-voicexml20-20040203/#dml1.3.3
dc.relation [W3C04V] Voice Extensible Markup Language (VoiceXML) Version 2.0 W3C Recommendation 16 March 2004, Consultado en Julio de 2005, disponible en http://www.w3.org/TR/2004/REC-voicexml20-20040316/
dc.relation [W3C05] W3C Oficina Española,Guía Breve de Seguridad, 2005, Consultada en Septiembre de 2005, disponible en http://www.w3c.es/divulgacion/guiasbreves/Seguridad
dc.relation [W3C05r] RDF Sintaxis, disponible en,http://www.w3.org/TR/REC-rdf-syntax/ visitado en septiembre de 22005
dc.relation [W3C05s] Speech Grammar, disponible en, http://www.w3.org/TR/speech-grammar/, visitado en septiembre de 2005.
dc.relation [W3C05t] Semantic Interpretation, disponible en, http://www.w3.org/TR/semantic-interpretation/, visitado en septiembre de 2005
dc.relation [W3C05u]Speech Síntesis, disponible en, http://www.w3.org/TR/speech-synthesis/, visitado en Octubre de 2005.
dc.relation [W3C05v] CCXML, disponible en, http://www.w3.org/TR/ccxml/, visitado en Octubre de 2005.
dc.relation [WIK05a] Wikipedia.org, UTF-8, 2005, consultado en octubre de 2005, disponible en http://es.wikipedia.org/wiki/UTF-8
dc.relation [WIK05b] Wikipedia.org, URI, 2005, consultado en octubre de 2005, disponible en http://es.wikipedia.org/wiki/URI
dc.relation [WIK06a] Wikipedia.org, Unicode, 2005, consultado en octubre de 2005, disponible en http://es.wikipedia.org/wiki/Unicode
dc.rights http://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.rights Abierto (Texto Completo)
dc.rights info:eu-repo/semantics/openAccess
dc.rights http://purl.org/coar/access_right/c_abf2
dc.rights Atribución-NoComercial-SinDerivadas 2.5 Colombia
dc.subject Computational linguistics
dc.subject Information storage systems
dc.subject Information retrieval systems
dc.subject Automatic speech recognition
dc.subject Human-machine interaction
dc.subject Systems engineering
dc.subject Computer science
dc.subject Investigations
dc.subject Analysis
dc.subject Web architecture
dc.subject Voice interaction
dc.subject Speech recognition
dc.subject Rules of inference
dc.subject Semantic web
dc.subject Lingüística computacional
dc.subject Sistemas de almacenamiento de información
dc.subject Sistemas de recuperación de información
dc.subject Reconocimiento automático de voz
dc.subject Interacción hombre-máquina
dc.subject Ingeniería de sistemas
dc.subject Ciencias computacionales
dc.subject Investigaciones
dc.subject Análisis
dc.subject Arquitectura web
dc.subject Interacción por voz
dc.subject Reconocimiento de Voz
dc.subject Reglas de Inferencia
dc.subject Web semántica
dc.title Propuesta, validación y prueba de una arquitectura para modelado de portales WEB semánticos basados en interacción por voz
dc.title Proposal, validation and testing of an architecture for modeling semantic WEB portals based on voice interaction
dc.type info:eu-repo/semantics/masterThesis
dc.type Tesis
dc.type http://purl.org/coar/resource_type/c_bdcc
dc.type info:eu-repo/semantics/acceptedVersion
dc.type http://purl.org/redcol/resource_type/TM
dc.coverage Bucaramanga (Colombia)


Ficheros en el ítem

Ficheros Tamaño Formato Ver

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta