La IA generativa (Generative Artificial Intelligence, GenAI) es como una iniciativa de transformación digital altamente comprimida, y las cosas se mueven rápido. A medida que aumenta la adopción, la pregunta no es cómo las empresas adoptarán la GenAI, sino si sus infraestructuras de datos podrán admitirla.
Hay un patrón en lo que respecta a la adopción de innovaciones y tendencias por parte de las empresas. Primero haga la prueba piloto, luego planifique. El “cómo” puede ser una ocurrencia tardía (simplemente basta preguntarle a TIC después de los últimos años), pero a menudo es lo más importante. El éxito con una nueva tecnología depende en última instancia de si la infraestructura puede sostenerla.
Con la GenAI, una cosa está clara: las infraestructuras de datos deben subir de nivel ahora.
GenAI: transformación digital sobre rieles
Se ha dicho que toda empresa tiene que ser una empresa de seguridad. Ahora, cada empresa también tendrá que ser una empresa preparada para la IA.
¿Por qué? Por primera vez en la historia, se ha derribado la barrera de entrada de AI. Ya no es la caja de arena de los científicos de datos; es para todos. Recién estamos comenzando.
Los casos de uso de GenAI proliferan a diario en el espacio empresarial. Compañías como Databricks, que adquirió MosaicML, traerán modelos de IA generativos y seguros a las empresas. Por su parte, la adquisición de Neeva por parte de Snowflake traerá inteligencia comercial impulsada por LLM a los datos empresariales.
Todo esto señala la magnitud de su disrupción para cada industria. Y en tiempos de recesión, la eficiencia que puede ofrecer es muy, muy atractiva. La IA asequible y accesible se convertirá en otra herramienta, como SaaS (ya se ofrece como un servicio ahora y está creciendo agresivamente).
Pero para muchos casos de uso, la pregunta no es tanto si se implementará la IA, sino cómo y cómo se administrarán los datos. Es probable que los modelos de lenguaje grande (LLM) evolucionen hacia servicios y aplicaciones basados en la nube, como CRM y ERM. Eso creará otra carga de trabajo que las empresas deberán integrar en estados de datos ya complejos.
La simplicidad en la gestión de datos será más importante que nunca.
Del dominio público a los datos privados
Las herramientas de GenAI prosperan con los datos. Cuantos más y mejores datos reciben, más inteligentes se vuelven. Aprovecharlos donde cuenta (internamente, con fines de propiedad) requiere datos nuevos más allá del dominio público. Y todo lo que no se puede raspar está bajo llave por una buena razón.
Casi todas las organizaciones están explorando sus propios modelos y casos de uso de LLM. Los grandes proveedores ya están en una carrera de GenAI. Si bien todos los líderes consideran cómo aprovecharlo, también deben considerar cómo hacerlo mientras retienen el control de su recurso más preciado: sus datos.
Para algunos, esto significa llevar el cálculo de la IA a los datos, y no al revés. Para hacer eso, muchas organizaciones buscan construir sus propios modelos. Los proveedores están en una carrera para construir una matriz lista para IA y una cadena de herramientas de extremo a extremo que pueda respaldar negocios de GenAI. La nube es una opción, pero la IA de producción en la nube puede volverse costosa con el tiempo. Las consideraciones del costo total de propiedad (TCO) de las soluciones en la nube frente a las locales son importantes y, a menudo, las soluciones locales eficientes y de alto rendimiento pueden proporcionar ahorros de costos a largo plazo mientras mantienen a los científicos de datos completamente productivos.
Aquí también es donde la infraestructura de datos de una organización debe estar preparada para el futuro, ser simple y lo suficientemente escalable. Alojar y proteger esos datos mientras los hace lo suficientemente ágiles para los flujos de trabajo de IA es clave. Y no todo el almacenamiento de datos está a la altura de la tarea.
Volumen y accesibilidad de los datos
Primero, está el volumen. La GenAI será una de las innovaciones más disruptivas para afectar los datos globales. Las estimaciones conservadoras predijeron un crecimiento de datos compuesto del 2% año tras año a partir de 2022; sin embargo, eso fue antes de que explotaran ChatGPT y la generación de imágenes.
Consideremos esto: los diseñadores gráficos no pueden crear 300 imágenes únicas en un día. Las plataformas de imágenes de IA sí pueden. Las capacidades de la IA no están limitadas por la realidad física, pero los datos que crea sí lo están. Y necesita vivir en algún lugar.
Luego, está la accesibilidad. De acuerdo con el estudio AI Strategies View 2022, de IDC, los responsables de la toma de decisiones señalaron que «la disponibilidad y accesibilidad seguras de los datos son fundamentales para escalar las iniciativas de IA». El disco HDD no puede seguir el ritmo. Las soluciones all-flash empresariales están optimizadas para IA. Es decir, tienen una arquitectura de alto rendimiento, paralela y escalable con tecnología de reducción de datos como la compresión. También ofrecen actualizaciones sin interrupciones y puede escalar el rendimiento y la capacidad por separado.
La IA y el machine learning (ML) son los proyectos que más datos consumen en la historia. Los datos no estructurados son notoriamente difíciles de agregar y analizar, especialmente fotos y videos. Requiere una plataforma capaz de realizar análisis en diversos perfiles de datos, todos a la vez, o siempre que se requieran estas capacidades.
Si bien a todos nos gustaría explorar más proyectos de IA, también nos gustaría reducir las huellas en nuestros centros de datos. La energía para alimentarlos no es infinita, ni barata. Solo hay una forma para que las empresas avancen con la IA sin sacrificar la eficiencia: flash.
Cómo construir un centro de datos listo para GenAI
La explosión de los casos de uso de GenAI hacen que nos preguntemos: ¿cómo terminarán luciendo las empresas de infraestructura de datos y bases de datos en el futuro si la IA tiene que convertirse en parte de la infraestructura central de cada empresa?
Centros de datos all-flash, por ejemplo.
A su vez, medida que las organizaciones preguntan: ¿qué hará la GenAI por mi negocio? también deberán preguntarse: ¿mi infraestructura de TIC estará lista para esto?
No todos necesitarán su propio LLM. Pero ya sea que esté entrenando sus propios modelos o aprovechando GenAI a través de una aplicación o la nube, el almacenamiento moderno de datos será fundamental para la historia. Una plataforma de almacenamiento robusta y eficiente para IA, como FlashBlade//S, puede manejar todos los datos y tareas que se le presentan desde una miríada de potentes GPU NVIDIA.
Aprovechar al máximo su infraestructura de IA requiere una plataforma de almacenamiento de alto rendimiento y baja latencia que sea escalable. Asimismo, debe ser capaz de manejar una gran cantidad de datos a la vez (gran ancho de banda). También, que pueda compartir información entre muchos procesos de aplicaciones en paralelo es clave. Así se puede optimizar la IA con el TCO más bajo.