En Aunoa, la innovaci贸n es parte de nuestro ADN. Hoy estamos emocionados de compartir con vosotros tres avances tecnol贸gicos que marcan un antes y despu茅s en c贸mo gestionamos y aprovechamos la informaci贸n:聽conversi贸n avanzada de documentos,聽indexaci贸n multimodal聽y聽b煤squeda sem谩ntica. Estas novedades son el resultado de meses de investigaci贸n, desarrollo y pruebas, y reflejan nuestro compromiso con la excelencia t茅cnica y la mejora continua.
Conversi贸n avanzada de documentos
Uno de los mayores desaf铆os al trabajar con documentos para IA es preservar su estructura sem谩ntica al convertirlos en texto plano. A menudo, convertir un PDF o un documento de Word en texto implicaba perder informaci贸n valiosa como t铆tulos, tablas, listas o im谩genes.
La soluci贸n: Hemos integrado la importaci贸n de documentos en formato Markdown, un est谩ndar de texto plano que conserva la estructura sem谩ntica. Esto significa que:
- Las tablas siguen siendo tablas.
- Las listas mantienen su jerarqu铆a.
- Las im谩genes y otros elementos no textuales se preservan.
Adem谩s, esta funcionalidad est谩 disponible tanto para documentos individuales como para integraciones con聽Google Drive y Microsoft OneDrive.
驴Por qu茅 es importante?
- Mejor calidad en la indexaci贸n y recuperaci贸n de informaci贸n.
- Mayor eficiencia en procesos automatizados.
- Compatibilidad con documentos complejos sin perder su esencia.
2. Indexaci贸n multimodal: Texto e im谩genes, mejorando la representaci贸n de la informaci贸n
No solo nos quedamos en el texto. Ahora, tambi茅n indexamos聽im谩genes聽dentro de los documentos, gracias a modelos de IA multimodal como聽Jina CLIP v2, un modelo聽state-of-the-art聽que trabaja con texto e im谩genes simult谩neamente.
驴C贸mo funciona?
- Utilizamos dos聽encoders: uno para texto y otro para im谩genes.
- Los vectores generados alinean representaciones sem谩nticas similares, incluso entre modalidades distintas.
- Hemos implementado聽Matryoshka Representation Learning, que permite comprimir vectores sin perder informaci贸n relevante.
Beneficios:
- B煤squedas m谩s precisas, incluso cuando se mezclan texto e im谩genes.
- Retrocompatibilidad con sistemas anteriores.
- Preparaci贸n para futuros desarrollos en IA multimodal.
3. B煤squeda sem谩ntica multimodal: Potenciando casos de uso reales
La pregunta clave era: 驴C贸mo hacer que estas capacidades sean 煤tiles en el mundo real? La respuesta lleg贸 de la mano de nuestro equipo de Marketing y Ventas, con un caso de uso concreto: b煤squeda de productos basada en im谩genes y descripciones.
驴Qu茅 logramos con esto?
- Experiencias de b煤squeda m谩s intuitivas聽para los usuarios.
- Mayor precisi贸n聽al combinar texto e im谩genes.
- Aplicaciones en e-commerce, documentaci贸n t茅cnica y m谩s.
Pr贸ximos pasos: 隆Esto no para aqu铆!
En Aunoa, seguimos trabajando para ofrecer las soluciones m谩s avanzadas en IA y gesti贸n de datos. El futuro ya est谩 aqu铆, y lo estamos construyendo juntos.