IA: ¿El tamaño sí importa? Descubre la nueva métrica clave para tu negocio

IA: ¿El tamaño sí importa? Descubre la nueva métrica clave para tu negocio

Evox News
Por
12 min de lectura

La Reevaluación de los Modelos de Inteligencia Artificial: ¿Tamaño vs. Eficacia?

IA: ¿El tamaño sí importa? Descubre la nueva métrica clave para tu negocio

La pregunta sobre «cómo está tu modelo» ha evolucionado. Antes referida a la estructura empresarial o al esquema de ventas, ahora apunta directamente al modelo de Inteligencia Artificial (IA) adoptado e integrado en la función de TI de una compañía. La proliferación de la IA generativa ha abarcado desde la creación de invitaciones de cumpleaños hasta la escritura de código de software, impulsando el crecimiento de modelos de lenguaje, tanto grandes como pequeños, y las aplicaciones que los utilizan.

En los últimos años, los líderes en IA han mejorado sus modelos, estableciendo nuevos estándares en términos de parámetros de entrenamiento. Sin embargo, el debate ha cambiado, requiriendo una racionalización en el desarrollo de modelos de IA.

La Ley de los Rendimientos Decrecientes en Modelos

Shane McAllister, destacado defensor del desarrollo en MongoDB, señala que los grandes avances en inteligencia artificial, logrados mediante el aumento de la capacidad de cómputo y los parámetros, están mostrando rendimientos decrecientes. A pesar de que los modelos se vuelven más inteligentes, la potencia adicional puede ser excesiva para las tareas empresariales comunes.

La industria, tras la popularización de la IA y sus modelos de lenguaje, necesita una recalibración. Los modelos más valiosos para las empresas son aquellos que ofrecen experiencia precisa y específica, donde los LLM (Modelos de Lenguaje Amplios) de propósito general pueden fallar debido a datos obsoletos o incorrectos.

Chris Mahl, CEO de Pryon, subraya que el debate sobre el tamaño del modelo pasa por alto lo que realmente funciona en la IA empresarial. Empresas están logrando resultados notables al combinar la capacidad de razonamiento de modelos grandes con conocimiento especializado, utilizando técnicas como RAG (Retrieval-Augmented Generation) y el ajuste fino. La innovación se encuentra en la integración de ambos enfoques para resolver problemas empresariales específicos.

Ambas firmas coinciden en que la mayoría de las tareas realizadas con IA son de complejidad baja a media, como resumir reuniones, redactar correos electrónicos o realizar análisis de datos básicos. Estas tareas no requieren miles de millones de parámetros, lo que haría equivalente usar una supercomputadora para enviar un mensaje de texto.

El Correcto Ajuste de la IA

McAllister de MongoDB destaca la importancia de ajustar adecuadamente la IA durante la implementación. La selección del modelo de lenguaje apropiado, incluyendo su escala, debe ser parte del proceso inicial. Sin embargo, a menudo se recurre a ChatGPT por defecto, convirtiéndose en el equivalente moderno de «nadie fue despedido por contratar a IBM». Por lo tanto, el ajuste adecuado de la IA debe ser parte de la conversación sobre la gobernanza de la IA, ya que no todas las tareas necesitan GPT-4.

Esta prisa por implementar aplicaciones de IA puede deberse al deseo de las empresas de no perder la oportunidad que presenta esta tecnología. Sin embargo, el verdadero costo emerge cuando los ciclos de cómputo requeridos por estos grandes modelos comienzan a acumularse.

En industrias reguladas, los modelos más pequeños a menudo superan a sus contrapartes más grandes. Esto se debe a que se requieren datos altamente especializados para generar respuestas valiosas, que es poco probable que se capturen completamente en el proceso de entrenamiento de LLM más generales. Además, las empresas pueden combinar múltiples SLM (Modelos de Lenguaje Pequeños) a través de motores de razonamiento o enrutamiento de modelos inteligentes, eligiendo el modelo adecuado para cada tarea en tiempo real en lugar de depender de un sistema monolítico.

El Costo de las Emisiones de las Aplicaciones

Ejecutar un LLM a gran escala en producción es extremadamente costoso. La menor potencia de cómputo requerida por los SLM se traduce en menores costos, menor consumo de electricidad y menores «emisiones de aplicaciones» de software, un término aún no formalizado en la industria tecnológica, pero que merece ser estandarizado. Desde el punto de vista del desarrollador, los SLM también pueden mejorar la flexibilidad de implementación debido a sus menores demandas computacionales, lo cual es útil en entornos con recursos limitados, como servidores privados o locales, y en industrias reguladas como la salud o las finanzas, donde la seguridad y el control de los datos son esenciales.

John Nay, CEO de Norm Ai, argumenta que los mejores modelos deben utilizarse independientemente de su tamaño. Los modelos más pequeños son, en igualdad de condiciones, peores en el razonamiento y menos útiles. Aunque el argumento del control de datos para los modelos de auto-hospedaje es válido, la preocupación regulatoria más amplia para la IA, a medida que se vuelve más autónoma, se centra en cómo evaluar toda la producción de los agentes de IA en relación con las leyes y regulaciones que rigen la actividad empresarial en cuestión.

Los modelos más pequeños fortalecen la gobernanza y la soberanía de los datos, lo cual será aún más importante a medida que evolucionen los marcos regulatorios. Al minimizar la dependencia de modelos grandes y centralizados, los desarrolladores pueden crear aplicaciones que aseguren que los datos permanezcan dentro de los límites especificados y cumplan con los requisitos de residencia. El verdadero valor de la IA no proviene de la escala, sino de la idoneidad.

Siqi Chen, CEO de Runway, sugiere que la clave para el marco y el modelo de IA correctos es simplemente observar el valor y el volumen del trabajo que se está realizando.

Las empresas deben preguntarse si el costo de un modelo suficientemente capaz de hacer el trabajo es una proporción significativa del costo de la mano de obra humana para hacer el mismo trabajo. En la mayoría de los casos, es poco probable que el costo de un modelo de IA sea un porcentaje significativo del costo de la mano de obra humana. También deben preguntarse si la demanda del trabajo que se está realizando es elástica con el costo. En algunos casos, cuando el costo baja, la demanda aumenta, pero para muchos casos de uso empresarial, la demanda es relativamente inelástica. En esta situación, recurrir al modelo más capaz tiene mucho sentido.

Aunque los SLM pueden ser muy efectivos en casos de uso verticales, el valor económico de ese trabajo es limitado. Los modelos generalizados pueden superar incluso a los modelos especializados más afinados.

El Modelado No Es Un Proyecto De Fin De Semana

Julian LaNeve, CTO de Astronomer, advierte que las empresas que buscan un SLM podrían tener que enfrentarse a la realidad del auto-hospedaje. Hospedar, escalar y mantener una infraestructura de LLM no es un proyecto de fin de semana, sino una inversión significativa, principalmente desde la perspectiva de las personas.

Sin embargo, es probable que los modelos se vuelvan más rápidos, mejores, más eficientes y más baratos con el tiempo. Esto significa que un caso de uso que apenas tiene sentido económico hoy en día merece la pena perseguir, porque se puede cambiar el LLM subyacente a medida que surjan modelos superiores.

LaNeve comparte un ejemplo de su experiencia en Astronomer, donde el equipo afinó un SLM especializado para resumir los fallos de las canalizaciones de datos. La implementación llevó varias semanas e implicó una complejidad significativa en el hospedaje.

Irónicamente, apenas un par de meses después, se lanzó un nuevo modelo que era mejor y más barato que su solución auto-hospedada, por lo que abandonaron su modelo afinado en favor del proveedor de modelos de vanguardia.

La Próxima Vara de Medir Empresarial

La industria está comenzando a darse cuenta de que el poder y la fuerza deben ser templados con equilibrio y precisión. No se trata solo de evitar usar un mazo para cascar una nuez, sino de no usar un mazo cuando un bisturí sería más apropiado.

Volviendo a la pregunta inicial, una respuesta respetable sobre el modelo podría ser: racionalizado, dimensionado correctamente y robustecido, no radicalmente sobredimensionado, subdimensionado o sobredimensionado.

Insights de Evox News: Cómo la reevaluación de modelos de IA puede impactar tu negocio

La noticia sobre la reevaluación de los modelos de IA, enfocándose en la idoneidad y eficiencia en lugar del tamaño, tiene implicaciones significativas para las empresas desde varias perspectivas:

Optimización de Costos: La adopción de modelos de IA de tamaño adecuado, especialmente SLM, puede reducir drásticamente los costos operativos asociados con la computación y el consumo de energía. Esto permite a las empresas asignar recursos de manera más eficiente y mejorar su rentabilidad.
Ventaja Competitiva: Las empresas que adoptan un enfoque estratégico para la selección y ajuste de modelos de IA pueden obtener una ventaja competitiva al resolver problemas empresariales específicos de manera más efectiva y rentable que sus competidores.
Innovación y Flexibilidad: La flexibilidad para combinar diferentes modelos de IA y adaptarse a las necesidades cambiantes del negocio fomenta la innovación. Las empresas pueden experimentar con nuevas aplicaciones de IA y aprovechar las últimas tecnologías sin incurrir en costos prohibitivos.
Cumplimiento Normativo y Seguridad de Datos: El uso de SLM y la gestión de datos descentralizada fortalecen la gobernanza y la soberanía de los datos, lo cual es crucial para cumplir con las regulaciones y proteger la información confidencial de la empresa.

En resumen, la reevaluación de los modelos de IA ofrece a las empresas la oportunidad de optimizar sus operaciones, obtener una ventaja competitiva, fomentar la innovación y garantizar el cumplimiento normativo, todo ello mientras reducen los costos y mejoran la eficiencia

Compartir este artículo