CorpusMiner 1.0: Herramienta para el agrupamiento de documentos

Leticia Arco, Rafael Bello, Libernys Valdés, Juan Manuel Mederos, Yoisy Pérez

Resumen


CorpusMiner 1.0 permite formar grupos de documentos similares en un corpus textual. El agrupamiento puede ser duro o borroso. Mediante el uso de métodos de agrupamiento concatenados, no es necesario tener un conocimiento del dominio para inicializar los métodos a utilizar. El agrupamiento se realiza a partir de una representación espacio-vectorial del corpus. Se permite la aplicación de técnicas de selección de rasgos, así como diferentes funciones para el cálculo de la similitud de documentos que mejoran la eficiencia del mismo. Esta herramienta es útil en la extracción de resúmenes, categorización, clasificación, y verificación de homogeneidad de un corpus textual.

Palabras clave


agrupamiento de documentos; corpus textuales; minería de textos; de métodos de agrupamiento concatenados

Texto completo:

PDF

Enlaces refback

  • No hay ningún enlace refback.




_________________________________________________________________________________________________________

La Universidad de las Ciencias Informáticas (UCI), a través del sello editorial Ediciones Futuro, publica los contenidos de la Revista Cubana de Ciencias Informáticas (RCCI) bajo licencia Creative Commons de tipo Atribución 4.0 Internacional (CC BY 4.0). Esta licencia permite a otros distribuir, mezclar, ajustar y construir a partir de su obra, incluso con fines comerciales, siempre que le sea reconocida la autoría de la creación original.
_________________________________________________________________________________________________________

 INDEXACIÓN