Descubrimiento de conocimientos en los comentarios que realizan los usuarios en un sistema de noticias digital

Camila González Nápoles, Eliana Bárbara Ril Valentín, Héctor Raúl González Diez, Vladimir Milián Núñez, Julio Camejo Corona

Resumen


La minería de opinión es un proceso de extracción de nuevos conocimientos y datos textuales no estructurados mediante los métodos automáticos de detección y extracción de opiniones. Ha mostrado en los últimos años un gran auge, debido a la necesidad de analizar gran cantidad de opiniones y comentarios que se publican diariamente. El principal problema de los datos que se recopilan de un sistema de noticias web, es que se encuentran en forma no estructurada, lo que dificulta la identificación de la opinión pública y a su vez el sentimiento que transmiten en ella. El objetivo de esta investigación se centró en descubrir conocimientos para determinar la intencionalidad de los usuarios a través de sus comentarios sobre artículos de diferentes temáticas de la sociedad. Con el fin de realizar el procesamiento de datos y transformación de los mismos, se creó inicialmente un dataset con los comentarios de 5 artículos seleccionados por mayor nivel de comentarios. Dicha fuente de datos se utilizó como entrenamiento para el aprendizaje automático. Para ello, luego de realizar un estudio sobre los principales algoritmos de procesamiento del lenguaje natural y minería de opinión para el análisis de sentimientos se escogió específicamente máquina de soporte vectorial. Se obtuvo como resultado, mediante los métodos de clasificación, si los usuarios tenían valoraciones positivas, negativas o neutras respecto a los artículos publicados.


Palabras clave


análisis de sentimiento, descubrimiento de conocimiento, minería de opinión, procesamiento del lenguaje natural.

Texto completo:

PDF

Enlaces refback

  • No hay ningún enlace refback.




_________________________________________________________________________________________________________

La Universidad de las Ciencias Informáticas (UCI), a través del sello editorial Ediciones Futuro, publica los contenidos de la Revista Cubana de Ciencias Informáticas (RCCI) bajo licencia Creative Commons de tipo Atribución 4.0 Internacional (CC BY 4.0). Esta licencia permite a otros distribuir, mezclar, ajustar y construir a partir de su obra, incluso con fines comerciales, siempre que le sea reconocida la autoría de la creación original.
_________________________________________________________________________________________________________

 INDEXACIÓN