Red de Bibliotecas Virtuales de Ciencias Sociales en
América Latina y el Caribe

logo CLACSO

Por favor, use este identificador para citar o enlazar este ítem: https://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/244146
Registro completo de metadatos
Campo DC Valor Lengua/Idioma
dc.creatorSouza, Jackson Wilke da Cruz-
dc.creatorFelippo, Ariani Di-
dc.date2018-04-25-
dc.date.accessioned2023-03-28T19:51:44Z-
dc.date.available2023-03-28T19:51:44Z-
dc.identifierhttps://periodicos.fclar.unesp.br/alfa/article/view/9204-
dc.identifier10.1590/1981-5794-1804-6-
dc.identifier.urihttps://biblioteca-repositorio.clacso.edu.ar/handle/CLACSO/244146-
dc.descriptionComplementarity is a usual multi-document phenomenon that commonly occurs among news texts about the same event. From a set of sentence pairs (in Portuguese) manually annotated with CST (Cross-Document Structure Theory) relations (Historical background and Follow-up) that make explicit the temporal complementary among the sentences, we identified a potential set of linguistic attributes of such complementary. Using Machine Learning algorithms, we evaluate the capacity of the attributes to discriminate between Historical background and Follow-up. JRip learned a small set of rules with high accuracy. Based on a set of 5 rules, the classifier discriminates the CST relations with 80% of accuracy. According to the rules, the occurrence of temporal expression in sentence 2 is the most discriminative feature in the task. As a contribution, the JRip classifier can improve the performance of the CST-discourse parsers for Portuguese.en-US
dc.descriptionA complementaridade é um fenômeno multidocumento comumente observado entre notícias que versam sobre um mesmo evento. A partir de um corpus em português composto por um conjunto de pares de sentenças manualmente anotadas com as relações da Cross-Document Structure Theory (CST) que explicitam a complementaridade temporal (Historical background e Follow-up), identificou-se um conjunto potencial de atributos linguísticos desse tipo de complementaridade. Por meio de algoritmos de Aprendizado de Máquina, testou-se o potencial dos atributos em distinguir as referidas relações. O classificador simbólico gerado pelo algoritmo JRip obteve o melhor desempenho ao se considerar a precisão e o tamanho reduzido do conjunto de regras. Somente com base em 5 regras, tal classificador identificou Follow-up e Historical background com precisão aproximada de 80%. Ademais, as regras do classificador indicam que o atributo ocorrência de expressão temporal na sentença 2 é o mais relevante para a tarefa. Como contribuição, salienta-se que o classificador JRip aqui gerado pode ser utilizado nos analisadores discursivos multidocumento para o português do Brasil que são baseados na CST.pt-BR
dc.formatapplication/pdf-
dc.formatapplication/pdf-
dc.languagepor-
dc.languageeng-
dc.publisherUNESPpt-BR
dc.relationhttps://periodicos.fclar.unesp.br/alfa/article/view/9204/7223-
dc.relationhttps://periodicos.fclar.unesp.br/alfa/article/view/9204/7233-
dc.rightsCopyright (c) 2018 ALFA: Revista de Linguísticapt-BR
dc.sourceALFA: Revista de Linguística; v. 62 n. 1 (2018)pt-BR
dc.source1981-5794-
dc.subjectLinguistic descriptionen-US
dc.subjectComplementarityen-US
dc.subjectCSTen-US
dc.subjectMulti-document Summarizationen-US
dc.subjectNatural Language Processingen-US
dc.subjectDescrição linguísticapt-BR
dc.subjectComplementaridadept-BR
dc.subjectCSTpt-BR
dc.subjectSumarização Multidocumentopt-BR
dc.subjectProcessamento Automático de Língua Naturalpt-BR
dc.titleCharacterization of temporal complementarity: fundamentals for multi-document summarizationen-US
dc.titleCaracterização da complementaridade temporal: subsídios para sumarização automática multidocumentopt-BR
dc.typeinfo:eu-repo/semantics/article-
dc.typeinfo:eu-repo/semantics/publishedVersion-
Aparece en las colecciones: Faculdade de Ciências e Letras-Unesp - FCL/CAr - Cosecha

Ficheros en este ítem:
No hay ficheros asociados a este ítem.


Los ítems de DSpace están protegidos por copyright, con todos los derechos reservados, a menos que se indique lo contrario.