Artículo
El algoritmo Stanford Multi Sieve Pass (propuesto por Raghunathan et al. 2010) realiza secuencialmente una serie de pasos de reconocimiento que de manera incremental terminan proponiendo correferencias entre las entidades candidatas identificadas en el texto. En este artículo, presentamos brevemente los trabajos de adaptación de este algoritmo y de otras herramientas de análisis (p. e., OpeNER) a textos en español (Agerri et al. 2013; Bermúdez 2013). A fin de avanzar en el desarrollo de estas herramientas para el Procesamiento del Lenguaje Natural, aplicamos estas directrices manualmente sobre un corpus experimental extraído de Wikipedia, con los que se pueden configurar textos breves (como por ejemplo tuits u otro tipo de microcontenidos) con sentido pleno. Como resultado, se ofrece un ejemplo de análisis manual que será automatizado en etapas posteriores de la investigación The algorithm (proposed by Raghunathan et al. 2010) sequentially performs a series of pass of recognition, and allows to go incrementally proposing candidates to coreferenced between named entities in the text. The article briefly presents the work of adapting the algorithm Stanford Multi Pass Sieve and other analysis tools (OpeNer) to texts in Spanish (and other Agerri 2013, Bermúdez 2013). The result is a fragmented speech in sentences with full sense, that even being independent of the speech have not lost the discursive framework they belong (to inherit metadata documentaries). This can feed the event-based knowledge systems, or be linked to deposits of open data, or published independently (vg. as tweets). As a result, the article offers an example of manual analysis that, in further research, will be automatic.
Resolución de correferencias para la captura de eventos
Título:
Coreference resolution for capture of events
Cantamutto, Lucía Marina
; Abaitua Odriozola, Joseba K.; Carballal, David Buján; Díaz Labrador, José Luis; Bermúdez, Josu
Fecha de publicación:
08/2015
Editorial:
Universidad Nacional del Comahue. Centro Universitario Regional Zona Atlántica
Revista:
Pilquen
ISSN:
1851-3123
Idioma:
Español
Tipo de recurso:
Artículo publicado
Clasificación temática:
Resumen
Archivos asociados
Licencia
Identificadores
Colecciones
Articulos(CCT - BAHIA BLANCA)
Articulos de CTRO.CIENTIFICO TECNOL.CONICET - BAHIA BLANCA
Articulos de CTRO.CIENTIFICO TECNOL.CONICET - BAHIA BLANCA
Citación
Cantamutto, Lucía Marina; Abaitua Odriozola, Joseba K.; Carballal, David Buján; Díaz Labrador, José Luis; Bermúdez, Josu; Resolución de correferencias para la captura de eventos; Universidad Nacional del Comahue. Centro Universitario Regional Zona Atlántica; Pilquen; 18; 2; 8-2015; 40-49
Compartir