¿Qué se necesita para alcanzar el siguiente nivel de inteligencia artificial?
Durante el último año, se ha hablado mucho sobre este tema. Hemos sido testigos de lo que se percibe como una crisis en las leyes de escalamiento, donde los líderes de la industria temían que nos quedáramos sin la capacidad de seguir potenciando los sistemas.
Pero también hemos presenciado un intenso debate sobre qué constituye la inteligencia artificial general (IAG), cuándo podemos afirmar que hemos llegado a ese punto y qué implicaciones tiene.
Un ejemplo destacado de este debate se encuentra en un ensayo escrito por Thomas Wolf, aparentemente en respuesta al ensayo «Machines of Loving Grace» de Dario Amodei.
Esta opinión fue analizada en el podcast AI Daily Brief, donde Nathaniel Whittemore discutió la premisa y sus ramificaciones para el futuro.
Einstein y el buen estudiante
La historia nos enseña que Einstein no fue un estudiante brillante.
El eminente teórico y matemático tuvo dificultades para adaptarse al sistema educativo tradicional de su época. No parecía ser alguien que tuviera todo bajo control, y Wolf sugiere que esa es, en realidad, la norma.
«La historia está llena de genios que lucharon durante sus estudios», escribe Wolf. «Edison fue llamado ‘atontado’ por su maestro. Barbara McClintock fue criticada por su ‘pensamiento extraño’ antes de ganar un Premio Nobel. Einstein falló en su primer intento de ingresar al ETH Zurich. Y la lista continúa».
Sostiene que es un error pensar que se puede simplemente escalar a los buenos estudiantes y obtener un intelecto genial.
Copérnico «fue en contra de su conjunto de datos de entrenamiento» al sugerir que la Tierra orbita alrededor del Sol. Una idea revolucionaria en su tiempo, pero que ahora es un hecho comprobado.
«Para crear un Einstein en un centro de datos, no solo necesitamos un sistema que conozca todas las respuestas, sino uno que pueda plantear preguntas que nadie más haya pensado o se haya atrevido a formular», escribe Wolf. «Uno que escriba ‘¿Qué pasaría si todos estuvieran equivocados sobre esto?’ cuando todos los libros de texto, expertos y el conocimiento común sugieren lo contrario. Solo consideren el loco cambio de paradigma de la relatividad especial y las agallas que se necesitaron para formular un primer axioma como ‘asumamos que la velocidad de la luz es constante en todos los marcos de referencia’, desafiando el sentido común de (aquellos) días».
Citando a Jennifer Doudna y Emmanuelle Charpentier y su trabajo en CRISPR, señaló cómo el pensamiento innovador puede significar usar un producto diseñado para casos de uso radicalmente diferentes.
Estos cambios de paradigma poco frecuentes, dijo, a menudo reciben premios Nobel.
«Los verdaderos avances científicos no vendrán de responder preguntas conocidas, sino de plantear nuevas preguntas desafiantes y cuestionar las concepciones comunes y las ideas previas», añade Wolf, invocando la premisa de la famosa anécdota «42» de Douglas Adams, donde conocemos la respuesta, pero no la pregunta.
«En mi opinión, esta es una de las razones por las que los LLM, aunque ya tienen todo el conocimiento de la humanidad en la memoria, no han generado ningún conocimiento nuevo al conectar hechos previamente no relacionados», escribe Wolf, calificando el conocimiento como un «tejido intangible de la realidad». «Principalmente están haciendo ‘relleno de variedades’ en este momento, llenando los vacíos de interpolación entre lo que los humanos ya saben».
Por otro lado, sugiere que una vez que sean capaces de trascender ese pensamiento dentro de la caja, el cielo es el límite.
«Actualmente estamos construyendo estudiantes muy obedientes, no revolucionarios», escribe Wolf. «Esto es perfecto para el objetivo principal actual en el campo de la creación de grandes asistentes y ayudantes excesivamente complacientes. Pero hasta que encontremos una manera de incentivarlos a cuestionar su conocimiento y proponer ideas que potencialmente vayan en contra de los datos de entrenamiento anteriores, no nos darán revoluciones científicas todavía».
Competencia en el ámbito académico
Whittemore compartió su experiencia personal al estudiar para un decatlón académico, donde los estudiantes se preparaban durante todo el año.
Whittemore reveló que, después de competir entre los cinco primeros a nivel nacional durante dos años, siguió la trayectoria de los cinco mejores estudiantes de la competición más adelante en la vida para ver qué tipo de carreras habían seguido.
«Lo único que todos compartían era una increíble disposición para trabajar duro», dijo. «Pero la mayoría de ellos, como descubriría más tarde, siguiendo su trayectoria a través de la universidad y en sus carreras, eran pensadores muy convencionales. Provenían de escuelas que tenían buenos programas que sabían qué hacer para formar campeones, por lo que se esforzaron y obtuvieron el resultado… pero ninguno de ellos era disruptor, ninguno de ellos era emprendedor, ninguno de ellos era constructor».
En contraste, habló sobre el tipo de personas sobre las que se lee en los medios tecnológicos, los principales impulsores que se convierten en nombres conocidos.
«Tenían una inquietud, una curiosidad, un conjunto de cualidades que los impulsaban a anhelar más y a estar dispuestos a jugar fuera de las reglas del sistema para conseguirlo», dijo.
Al usar los LLM, señaló, podríamos querer desafiar esto.
«Asumimos esta línea recta entre los LLM de hoy, que son básicamente como los mejores estudiantes de decatlón académico que jamás hayamos imaginado, que han leído todas las cosas, estudiado todas las cosas, y que ahora pueden recordar todas las cosas y decirte todas las cosas, pero que no están creando nada por sí mismos», dijo, preguntándose en voz alta si podemos lograr que las redes neuronales piensen de diferentes maneras. «Dado lo mucho que señalamos el logro científico y el avance científico como el lado positivo universalmente acordado de la IA, realmente creo que vale la pena reflexionar sobre estas preguntas y profundizar en ellas».
Procesos multiagente
Dicho esto, Whittemore también admitió que estamos en una era de pensamiento sobre el progreso multiagente con la IA. Habló sobre cómo la cooperación de los agentes sobrecarga las capacidades de la red y por qué eso será importante en el futuro.
La obra «La Sociedad de la Mente» de Marvin Minsky establece una premisa fundamental que sigue reapareciendo: el cerebro humano, por poderoso que sea, no es una sola computadora, sino cientos de computadoras conectadas, y para competir realmente con los humanos, las entidades de inteligencia artificial necesitarán esa misma interacción e interconexión entre múltiples agentes. Se puede llamar aprendizaje en conjunto, conocimiento de red o cognición grupal. O simplemente se puede usar el término general «colaboración».
El resultado es que la verdadera IAG podría significar sistemas que no solo puedan mejorar en la respuesta a preguntas, sino que también sean capaces de formularlas.
Insights de Evox News: Cómo la evolución de la IA puede impactar tu negocio
La reflexión sobre la necesidad de que la IA no solo responda, sino que también formule preguntas, abre un abanico de posibilidades y desafíos para el mundo empresarial. Este cambio de paradigma, de una IA «obediente» a una IA «cuestionadora», podría tener un impacto significativo en diversas áreas:
Innovación disruptiva: Las empresas que logren integrar una IA capaz de cuestionar el statu quo y generar nuevas ideas tendrán una ventaja competitiva significativa. Esto podría traducirse en el desarrollo de productos y servicios revolucionarios, la optimización de procesos internos y la identificación de nuevas oportunidades de mercado.
Toma de decisiones estratégicas: Una IA que no solo analiza datos, sino que también plantea preguntas críticas, podría convertirse en un asesor estratégico invaluable. Podría ayudar a identificar riesgos ocultos, evaluar escenarios alternativos y desafiar las suposiciones existentes, conduciendo a decisiones más informadas y robustas.
Investigación y desarrollo: En sectores como la farmacéutica, la biotecnología o la ciencia de materiales, una IA con capacidad de generar hipótesis y plantear preguntas de investigación podría acelerar significativamente el proceso de descubrimiento y desarrollo de nuevas soluciones.
Ventaja competitiva a largo plazo: Las primeras empresas en adoptar y dominar esta nueva generación de IA «pensante» podrían establecer una ventaja competitiva difícil de superar, redefiniendo las reglas del juego en sus respectivos sectores.
En resumen, la evolución de la IA hacia modelos más autónomos y capaces de generar conocimiento original representa una oportunidad única para las empresas que estén dispuestas a explorar su potencial. Aquellas que logren integrar esta tecnología de manera efectiva estarán mejor posicionadas para liderar la innovación y el crecimiento en el futuro