Por qué DeepSeek sacudió la IA: Perspectivas clave de los líderes de Perplexity

Por
9 min de lectura

Recientemente, el sector tecnológico se vio impactado por el anuncio de la firma china DeepSeek sobre nuevos modelos que alteraron significativamente el panorama de la inteligencia artificial.

Meses después, persiste el análisis retrospectivo sobre los factores que hicieron tan notables los logros de DeepSeek, así como la reflexión sobre lo que implica la innovación en modelos de IA en el actual mercado global.

Más allá de las consideraciones de mercado, estos avances se fundamentan en una innovación real, cuyo valor reside en su contribución a la investigación continua en el campo.

A continuación, se detallan tres argumentos clave sobre el posicionamiento competitivo de DeepSeek, extraídos de una conversación con Aravind Srinivas y Johnny Ho, cofundadores de Perplexity, quienes analizan el valor de la IA en el ámbito empresarial.

Tres Principios Fundamentales de DeepSeek

Durante un diálogo sobre inteligencia artificial, Srinivas destacó los principios que sustentan la ventaja competitiva de DeepSeek.

Uno de ellos es la presentación del primer modelo de razonamiento de código abierto de su clase. El término «código abierto» es crucial en este contexto.

El valor del código abierto se evidencia al escuchar a figuras como Yann LeCun o Tim Berners-Lee discutir sobre investigación no comercial y participación comunitaria. De hecho, el propio Srinivas mencionó previamente cómo la democratización de la IA depende de modelos de código abierto, considerándolos una salvaguarda necesaria contra un posible autoritarismo monolítico a medida que la IA se consolida.

Así, DeepSeek impulsó el avance al ofrecer este tipo de tecnología de código abierto al mundo.

Otro aspecto relevante se relaciona con el aprendizaje reforzado no supervisado. La capacidad de los sistemas para aprender y operar autónomamente, sin necesidad de datos etiquetados u otras formas de supervisión, incrementa considerablemente su potencia. Al examinar los logros de DeepSeek, numerosos expertos de la comunidad tecnológica estadounidense resaltan la habilidad del modelo para funcionar sin diversas formas de intervención humana directa.

Un tercer punto señalado por Srinivas es la tendencia hacia motores de IA más específicos, diseñados para tareas y sectores verticales concretos. Argumenta que, en el pasado, el enfoque predominante ha sido la implementación de IA generalista. La creación de nuevos modelos especializados en tareas particulares y su interconexión conformarán un nuevo paradigma.

«(Los nuevos modelos) han adquirido cierto sentido común y conocimiento general del mundo, pero ahora necesitan evolucionar para convertirse en asistentes realmente útiles y eficientes», afirmó. «Por lo tanto, deben ser entrenados en una multitud de tareas específicas de verticales… y el entrenamiento realizado se desplegará en forma de productos como Perplexity, que la gente usará en su vida diaria y de los que derivará valor».

Esta observación resulta perspicaz, ya que este nuevo paradigma incluso tiene nombre: IA agéntica, un tema de conversación recurrente. Aunque se puede evocar la idea de la «Sociedad de la Mente» de Marvin Minsky, que describe una colección de entidades interconectadas para lograr grandes hazañas, la IA agéntica es, por naturaleza, un tipo de sistema o ecosistema conectado, descentralizado y ad hoc. Esto implica la existencia de numerosos modelos o entidades individuales, entrenados específicamente y con conjuntos de habilidades particulares.

IA Empresarial y Toma de Decisiones

Otro segmento importante de la conversación aborda cómo los ejecutivos deben considerar los detalles técnicos, como la distribución de hardware, dado que se trata de decisiones con implicaciones financieras millonarias.

“Es necesario comprender los detalles, porque eso ayuda a tomar decisiones que valen varios millones de dólares, o incluso decenas de millones”, explicó Srinivas, ilustrando su punto. “Si resulta que lo correcto para la compañía es adquirir 10,000 GPUs y luego desarrollar agentes de razonamiento para todos los (roles) y tareas, (por ejemplo) tenemos la capacidad de realizar muchos experimentos a pequeña escala… y concluir que ‘estamos listos para eso’, y entonces lo haremos, incluso si representa el 10% del capital total que tenemos. Porque si eso puede aumentar nuestra capitalización de mercado más del 10%, vale totalmente la pena. Creo que esa es la ventaja que tienes si entiendes los modelos”.

En esencia, la recomendación es no quedarse en lo general, sino ser capaz de profundizar en una aplicación o caso de uso específico para comprender exactamente su significado para el negocio.

Complementó esto con comentarios sobre la naturaleza especulativa de la empresa moderna y su relación con la propuesta del código abierto.

“Apuesta por el hecho de que los modelos de código abierto alcanzarán a los cerrados”, aconsejó. “Apuesta por el hecho de que estos se volverán aún más eficientes y pequeños, lo que significa que su servicio costará (menos)… Parte de esto es obviamente suerte. Parte es buena previsión, pero así es como funciona cualquier empresa. Necesitas tener suerte”.

Por lo tanto, combinar la fortuna con un crecimiento estratégico implica prestar atención a estas tendencias. Esa fue la conclusión principal extraída de este análisis.

Este es un breve panorama de la situación actual respecto a los nuevos modelos y la innovación competitiva en IA.

Insights de Evox News: Cómo los Avances de DeepSeek en IA Redefinen la Estrategia Empresarial

Los desarrollos impulsados por DeepSeek tienen implicaciones directas para las empresas que buscan integrar la inteligencia artificial en sus operaciones. Desde una perspectiva económica, la apuesta por modelos de código abierto y más eficientes, como los destacados por Srinivas, podría eventualmente reducir los costos operativos asociados a la IA. Sin embargo, la necesidad de invertir en hardware específico (como GPUs) y en el entrenamiento de modelos para tareas verticales subraya la importancia de una planificación financiera detallada y un análisis riguroso del retorno de la inversión para estas iniciativas tecnológicas, que pueden requerir un capital significativo.

En términos de ventaja competitiva, la tendencia hacia la IA agéntica y los modelos especializados ofrece oportunidades para la diferenciación. Las empresas que logren desarrollar o adaptar eficazmente sistemas de IA compuestos por agentes especializados para sus nichos de mercado específicos podrían obtener una ventaja operativa considerable. Si bien el código abierto puede democratizar el acceso a la tecnología base, la verdadera ventaja competitiva radicará en la capacidad de una empresa para comprender profundamente los modelos, adaptarlos a sus necesidades únicas y tomar decisiones estratégicas informadas sobre qué tecnologías implementar y cómo hacerlo, superando a competidores que adopten enfoques más genéricos.

Desde el punto de vista de la innovación, el enfoque en modelos especializados y la IA agéntica fomenta un nuevo paradigma de desarrollo. Impulsa a las empresas a pensar no solo en una IA monolítica, sino en ecosistemas de herramientas inteligentes interconectadas. Esto abre la puerta a la innovación en el diseño de flujos de trabajo, la automatización de procesos complejos y la creación de nuevos servicios basados en la colaboración de múltiples agentes de IA. La combinación de desarrollos de código abierto con la necesidad de especialización puede acelerar el ciclo de innovación, permitiendo a las empresas experimentar y desplegar soluciones de IA más rápidamente, siempre que posean la visión estratégica y la capacidad técnica para navegar este complejo panorama

Compartir este artículo
Exit mobile version