Huella digital de audio aplicada al reconocimiento de formas

Luis Rafael Baez Gonzalez

Resumen


La tecnología de reconocimiento de formas es crucial en la visión por computadora, permitiendo la identificación precisa de objetos en imágenes y secuencias de video. Su alcance es amplio, abarcando campos como la biología, medicina y aplicaciones militares. Históricamente, estos procesos eran manuales; sin embargo, con el avance de la informática, se han automatizado en gran medida. Este estudio presenta un innovador enfoque para el reconocimiento de formas en imágenes digitales, empleando espectrogramas de Mel como huella digital de audio, una técnica no convencional en este campo. Las imágenes utilizadas se encuentran ya segmentadas en las bases de datos. Cada imagen se transformó a una serie temporal guardada como archivo wav. Se utilizó el método de mapa de constelaciones usado por el sitio web Shazam para clasificar las formas, y se llevaron a cabo experimentos con dos bases de datos: MPEG-7 CE-Shape-1 Part B y ETU-10. Los resultados obtenidos muestran una precisión del 97.92% y del 100% en las bases de datos mencionadas, evidenciando la efectividad y el potencial de este novedoso enfoque en el reconocimiento de formas en imágenes digitales.

Texto completo:

PDF

Enlaces refback

  • No hay ningún enlace refback.




_________________________________________________________________________________________________________

La Universidad de las Ciencias Informáticas (UCI), a través del sello editorial Ediciones Futuro, publica los contenidos de la Revista Cubana de Ciencias Informáticas (RCCI) bajo licencia Creative Commons de tipo Atribución 4.0 Internacional (CC BY 4.0). Esta licencia permite a otros distribuir, mezclar, ajustar y construir a partir de su obra, incluso con fines comerciales, siempre que le sea reconocida la autoría de la creación original. Saber más
_________________________________________________________________________________________________________

 INDEXACIÓN