Extracci´on autom´atica de estructuras argumentativas en textos de opini´on cubanos mediante proyecci´on de etiquetas y aprendizaje profundo

Contenido principal del artículo

Damian Valdés Santiago
Luis Ernesto Ibarra Va´zquez

Resumen

LaExtracci´ondeArgumentosserealizatradicionalmentemedianteanotaci´onmanualdeexpertosenling¨ u´ıstica, lo que demora mucho tiempo. Este art´ıculo propone aplicar algoritmos de aprendizaje profundo al campo delaExtracci´ondeArgumentosentextosdelaprensacubana,constituyendoelprimerodesutipopublicado, hasta donde los autores conocen. Para ello, 1) se crean conjuntos de datos a partir de provenientes del idioma ingl´es, 2) se proponen y entrenan losmodelos y3) se anotan autom´aticamente las estructuras argumentativas. Los atributos utilizados para la representaciones de los textos son aprendidos en el proceso de entrenamiento paraajustarsealcriterioargumentativodelosdatos.Delosconjuntosdedatosdisponibles,serealiz´ounan´alisis de las ventajas y deficiencias de cada uno para la anotaci´on de las “Cartas a la Direcci´on” del peri´odico cubano Granma. Los resultados obtenidos en la extracci´on de UDAs alcanzaron valores de F1 = 0,82 comparados con 0,85 del estado del arte. En las dem´as tareas, los resultados no son directamente comparables con los del estado del arte, los mejores valores F1 obtenidos fueron 0,56 en la clasificaci´on de UDAs, 0,74 en la predicci´on de enlaces y 0,39 en la clasificaci´on de enlaces.

Detalles del artículo

Biografía del autor/a

Damian Valdés Santiago, Universidad de La Habana

Departamento de Matemática Aplicada, Facultad de Matemática y Computación, Universidad de La Habana