El creciente uso de la inteligencia artificial generativa (GenAI) plantea complicados retos para las empresas que la utilizan. Ocurre en todas las industrias, incluido el cuidado de la salud en todas sus vertientes. Uno de los problemas es que los datos en los modelos amplios de lenguaje (Large Language Model, LLM) de la GenAI no siempre son confiables. Esto se debe a que dichos datos pueden estar obsoletos. También a que la información disponible públicamente en la Internet puede ser errónea. Una manera de solucionarlo es mediante a generación aumentada por recuperación (Retrieval Augmented Generation, RAG).
Se trata de una tecnología en uso en las nubes privadas. Los modelos de generación aumentada por recuperación utilizan datos generados por las propias empresas. Dichas bases se pueden actualizar continuamente y, dado que no están expuestos a la Internet, pueden contener información exclusiva, no disponibles públicamente. Eso permite que la GenAI ofrezca respuestas mucho más precisas y oportunas. Además, pueden complementarse con información relevante de fuentes externas, pero confiables.
Ahora bien, no es sencillo poner en marcha la generación aumentada por recuperación. Se requiere armonizar el hardware, software, los modelos fundamentales y herramientas de desarrollo que alimentan la GenAI de manera oportuna y rentable. Por otra parte, se necesita una sólida plataforma de almacenamiento unificada. Una de ellas es la recién presentada GenAI Pod, de Pure Storage.
Simplificar la generación aumentada por recuperación
GenAI Pod es una solución completa que proporciona diseños llave en mano construidos en la plataforma de Pure Storage. Los usuarios pueden impulsar la innovación en sus industrias mientras reducen el tiempo, el costo y las habilidades técnicas necesarias para aprovechar la IA. A diferencia de otras soluciones de pila completa, GenAI Pod permite acelerar las iniciativas de IA con implementaciones de un solo clic y operaciones simplificadas del Día 2 para bases de datos vectoriales y modelos básicos.
Con la integración de PortWorx se obtienen implementaciones automatizadas de microservicios NVIDIA NeMo y NIM mediante la plataforma de software NVIDIA AI Enterprise. Además, se tiene acceso a la base de datos Milvus Vector.
Las aplicaciones iniciales validadas de esta plataforma con generación aumentada por recuperación incluyen específicamente el desarrollo de fármacos. También abarcan la investigación comercial y el análisis de inversiones. Para ello utilizan frameworks de agentic para búsqueda semántica, gestión del conocimiento y chatbots.
La solución completa incluye hardware, software, modelos fundamentales y servicios profesionales de proveedores líderes de IA de la industria. Para este conjunto inicial de diseños validados, Pure Storage se ha asociado con Arista, Cisco, KX, Meta, Nvidia, Red Hat, Supermicro y WWT. Se proyecta que la solución esté disponible en el primer semestre de 2025.