Repositorio Dspace

Proposal for an automatic extraction for medical term candidates processing linguistic information. Description and evaluation of results

Mostrar el registro sencillo del ítem

dc.creator Koza Orellana, Walter
dc.date 2015-02-23
dc.date.accessioned 2023-03-28T19:51:37Z
dc.date.available 2023-03-28T19:51:37Z
dc.identifier https://periodicos.fclar.unesp.br/alfa/article/view/6440
dc.identifier 10.1590/1981-5794-1502-5
dc.identifier.uri https://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/244077
dc.description The description of a method for automatic extraction of term candidates from the medical field by applying linguistic information is presented. Lexicography, morphological and syntactic rules were used. First, the detection was performed by applying a standard dictionary that assigned the tag ‘MED’ (‘MEDICAL’) to the words that could be considered terms. Morphological and syntactic rules were used to try to deduce the part of speech of the words that were not considered in the dictionary (WNCD). Afterwards, nominal phrases that included WNCD and MED were gathered to extract them as term candidates of the field. Smorph, Post Smorph Module (MPS) – both working in groups – and Xfst were the software used. Smorph performs the morphological analysis of character strings and MPS works on local grammar. Xfst is a finite state tool that works on character strings assigning previously stated categories to allow the automatic analysis of expressions. This method was tested on a section of the corpus of clinical cases collected by Burdiles (CCCM - 2009) containing 217,258 words. The results showed 92.58% of precision, 95.02% of recall and 93.78% of F-measure. en-US
dc.description Se presenta la descripción de un método de extracción automática de candidatos a términos del área médica a partir del procesamiento de información lingüística. Para ello, se trabajó con reglas en el nivel léxico, morfológico y sintáctico. En primer lugar, se realizó la detección aplicando un diccionario estándar, el cual asignó a las palabras consideradas términos, la etiqueta MED (MÉDICO). Luego, para las palabras que no estaban contempladas en el diccionario (PNCD), se dedujeron las categorías gramaticales apelando a reglas morfológicas y sintácticas. Posteriormente, se procedió a la conformación de sintagmas nominales que involucraban PNCD y MED, para extraerlos como candidatos a términos del dominio. Se utilizaron los softwares Smorph y Módulo Post Smorph (MPS), que trabajan en bloque, y Xfst. Smoprh realiza el análisis morfológico y MPS trabaja sobre gramáticas locales. Xfst, por su parte, es una herramienta de estados finitos que opera sobre cadenas de caracteres, a las que asigna categorías previamente declaradas. El método se probó en una parte del corpus de casos clínicos compilado por Burdiles (2012), que contenía 217258 palabras, y los resultados arrojaron una precisión de 92,58%, una cobertura de 95,02% y una medida f de 93,78%. pt-BR
dc.format application/pdf
dc.format application/pdf
dc.language por
dc.language eng
dc.publisher UNESP pt-BR
dc.relation https://periodicos.fclar.unesp.br/alfa/article/view/6440/5252
dc.relation https://periodicos.fclar.unesp.br/alfa/article/view/6440/5260
dc.rights Copyright (c) 2015 ALFA: Revista de Linguística pt-BR
dc.source ALFA: Revista de Linguística; v. 59 n. 1 (2015) pt-BR
dc.source 1981-5794
dc.subject Medical terminology en-US
dc.subject Automatic extraction en-US
dc.subject Linguistic information en-US
dc.subject Terms candidate en-US
dc.subject Terminología médica pt-BR
dc.subject Extracción automática pt-BR
dc.subject Información lingüística pt-BR
dc.subject Candidatos a término pt-BR
dc.title Proposal for an automatic extraction for medical term candidates processing linguistic information. Description and evaluation of results en-US
dc.title Propuesta de extracción automática de candidatos a término del dominio médico procesando información lingüística. Descripción y evaluación de resultados pt-BR
dc.type info:eu-repo/semantics/article
dc.type info:eu-repo/semantics/publishedVersion


Ficheros en el ítem

Ficheros Tamaño Formato Ver

No hay ficheros asociados a este ítem.

Este ítem aparece en la(s) siguiente(s) colección(ones)

Mostrar el registro sencillo del ítem

Buscar en DSpace


Búsqueda avanzada

Listar

Mi cuenta