La invención y popularización de LLMs (Large Language Models) como GPT-4 de OpenAI ha desencadenado una ola de soluciones innovadoras que permiten aprovechar grandes volúmenes de datos no estructurados, que eran prácticamente imposibles de procesar manualmente hasta hace poco. Estas aplicaciones pueden incluir la recuperación de datos (echad un vistazo al curso sobre ML301 de Don Woodlock, con una excelente introducción a la Generación Aumentada de Recuperación), el análisis de sentimientos, e incluso agentes de IA totalmente autónomos, por nombrar sólo algunos ejemplos!
Los datos no estructurados (o información sin estructura ) es aquella que, o bien no tiene datos previamente definidos, o no se organiza de una manera predefinida. La información sin estructura generalmente tiene una gran cantidad de texto, pero contiene datos como fechas, números y hechos

