AI Mineral Tech
ANÁLISIS AUTOMÁTICO DE SECCIONES DELGADAS DE ROCAS
DESCRIPCIÓN AUTOMÁTICA DE IMÁGENES
El objetivo de la descripción automática de imágenes es generar una oración coherente y fluida que describa con precisión el contenido de la imagen.

Extracción de características de la imágen de una andesita

CNN EXPLAINER
Red Neuronal Convolucional
Es un tipo de red diseñada especialmente para procesar datos que tienen una estructura de cuadrícula, como imágenes.
Se encarga de extraer características de la imagen de entrada, como las ubicaciones, tamaños y colores de los objetos.
TRANSFORMER
Es una arquitectura de red neuronal diseñada principalmente para tareas de procesamiento del lenguaje natural. Propuesta por primera vez en el artículo "Attention is All You Need" en 2017 por Vaswani et al.
En lugar de depender de recurrencias o convoluciones el Transformer utiliza mecanismos de atención para procesar secuencias de entrada y salida de manera paralela y eficiente.
El Transformer se ha convertido en la base de muchos modelos de vanguardia en el campo del procesamiento del lenguaje natural, incluyendo BERT y GPT.

Este componente toma las características de la imagen y las descripciones como entrada y aprende a generar las mismas.

EVALUACIÓN DEL MODELO
Las descripciones generadas suelen ser evaluadas utilizando métricas como BLEU, METEOR, ROUGE y CIDEr.
En este modelo se aplica a la métrica BLEU (Bilingual Evaluation Understudy) para comparar la similitud entre la descripción automática y la descripción auténtica.