Examen a fondo: Las IA de OpenAI, Microsoft y Google, frente a frente

Examen a fondo: Las IA de OpenAI, Microsoft y Google, frente a frente

Evox News
Por
11 min de lectura

Comparativa de IA: Diferencias Clave entre las Respuestas de OpenAI, Microsoft y Google

Las herramientas conversacionales basadas en inteligencia artificial (IA) son capaces de producir, en meros segundos, respuestas que emulan la interacción humana sobre una vasta gama de temas. Entre las más destacadas actualmente se encuentran Bard de Google, Bing de Microsoft y ChatGPT de OpenAI.

Evox News ha realizado una evaluación comparativa de estos tres modelos mediante una serie de preguntas, enigmas y solicitudes diversas, con el fin de observar las variaciones en sus contestaciones.

Para este análisis, se utilizó la versión GPT-4 de OpenAI, accesible mediante una suscripción mensual de 20 dólares (aunque OpenAI dispone de versiones gratuitas como ChatGPT, estas emplean tecnología anterior y su acceso a información de internet está limitado a datos hasta 2021). Se empleó también Bing de Microsoft, que opera con la tecnología GPT-4 de OpenAI, y la versión experimental inicial de Bard de Google, cuyo acceso está restringido a un grupo limitado de usuarios.

Advertencias de los Chatbots: La Precisión No Está Garantizada

Las tres plataformas incluyen advertencias sobre la posibilidad de errores en sus respuestas. El servicio de Google indica: «Tengo limitaciones y no siempre acertaré». GPT-4, por su parte, subraya que su chatbot «no tiene como finalidad ofrecer consejos». El mensaje de Bing advierte que «pueden ocurrir sorpresas y errores», añadiendo: «¡Asegúrese de verificar los hechos y compartir sus comentarios para que podamos aprender y mejorar!».

Disparidad Lingüística: El Español No Es Universal

Al ser consultados sobre su capacidad para interactuar en español, Bing y ChatGPT respondieron afirmativamente. En contraste, Bard replicó en inglés que no podía «proporcionar asistencia en eso», dado que está «entrenado para comprender y responder solo a un subconjunto de idiomas en este momento», sugiriendo que el español no figuraba entre ellos en ese instante. Consecuentemente, las interacciones para este análisis se realizaron en español con Bing y ChatGPT, y en inglés con Bard.

Solicitud Culinaria: Una Receta

Ante la petición «Dame una receta vegetariana y barata», GPT-4 sugirió «lentejas vegetarianas», Bing propuso «arroz con lentejas y verduras» y Bard ofreció «revuelto de tofu». Los tres chatbots siguieron una estructura similar: listado de ingredientes seguido de las instrucciones de elaboración. Tanto GPT-4 como Bard complementaron la receta con información adicional.

GPT-4 añadió al final: «Puedes adaptarla a tus preferencias añadiendo más verduras, especias o incluso añadirle espinacas o kale al final de la cocción para aumentar su contenido de nutrientes». Bard, por su lado, destacó que su receta es «una buena fuente de proteína y fibra».

Transparencia de Fuentes: Origen de la Información

Microsoft y Google, al poseer sus propios motores de búsqueda, se benefician al dirigir a los usuarios hacia otras páginas web. Al concluir cada respuesta, Bard presenta un botón «Búscalo en Google», mientras que Bing incluye una sección «aprenda más» con una lista de enlaces. Para la receta, la herramienta de Microsoft enlazó a sitios como recetasderechupete.com, tendencias.com, kiwilimon.com y clara.es. OpenAI, en cambio, no proporciona enlaces externos ni opciones para rastrear la fuente de su información.

Evaluación Académica: Literatura y Cultura Española

La siguiente prueba consistió en una pregunta de un examen de Literatura y Cultura Española de nivel avanzado (AP), diseñado para que estudiantes de secundaria en EE. UU. obtengan créditos universitarios. Se proporcionó a los chatbots un fragmento textual, solicitando la identificación del autor y una explicación sobre «el desarrollo del tema de la relación entre el tiempo y el espacio dentro de la obra a la que pertenece».

Aunque se recomienda a los estudiantes dedicar 15 minutos a esta respuesta, los chatbots la generaron en menos de un minuto.

Según Ana García Alonso, filóloga y profesora de español y estudios sociales en EE. UU., la única respuesta que habría aprobado sería la de Bard. No obstante, al ser proporcionada en inglés y no en español, también resultaría suspendida. La herramienta de Google, en su respuesta de 355 palabras en inglés, identificó correctamente el fragmento de «Mi caballo mago» de Sabine R. Ulibarrí y procedió a analizarlo detalladamente.

«Está muy bien, pero carece de sensibilidad lectora, no capta los mecanismos que crean la belleza, el arte y la sensibilidad literaria», observó García Alonso.

La respuesta de Bing fue la más breve (123 palabras). Identificó al autor, mencionó que la obra «es considerada una de las obras más importantes de la literatura chicana» y resumió el análisis en un párrafo. «Es muy escueto y le falta análisis», comentó la filóloga, indicando que no superaría la evaluación.

OpenAI generó la respuesta más extensa (360 palabras), pero resultó ser la de peor calidad según García Alonso. A pesar de que la pregunta indicaba explícitamente el título «Mi caballo mago», GPT-4 atribuyó erróneamente el fragmento al cuento «El Sur» del escritor argentino Jorge Luis Borges.

Resolución de Enigmas

Se planteó a las IA el acertijo: «¿Qué día del año hablan menos los charlatanes?», sin especificar que se trataba de una adivinanza. Bing fue el único en descifrarlo: «Es aquel día en donde se adelanta la hora en primavera». Por el contrario, Bard y GPT-4 indicaron que no existe un día específico con esa característica y ofrecieron información general sobre los charlatanes.

Redacción de Conclusiones por los Chatbots

Como prueba final, se pidió a los chatbots redactar el último párrafo (máximo 40 palabras) para este mismo artículo. Todas las respuestas excedieron el límite de palabras solicitado, por lo que fueron editadas para su presentación.

Bing concluyó: «En última instancia, el éxito de cada empresa dependerá de su capacidad para innovar y adaptarse a medida que evoluciona el campo de la IA».

Bard aportó: «En conclusión, ChatGPT de OpenAI es conocido por su capacidad para generar texto creativo y atractivo, mientras que 365 Copilot de Microsoft [del que forma parte Bing] está diseñado para ser más útil y productivo. Bard de Google aún está en desarrollo, pero tiene el potencial de ser la respuesta de IA más completa e informativa de todas».

GPT-4 finalizó: «En conclusión, para aprovechar al máximo estas herramientas, es esencial comprender sus particularidades y seleccionar la más adecuada según las necesidades específicas del usuario».

Insights de Evox News: Cómo la Evolución de los Chatbots de IA Puede Impactar tu Negocio

La comparativa entre Bard, Bing y ChatGPT subraya una realidad crucial para el entorno empresarial: la inteligencia artificial generativa está madurando rápidamente, pero presenta diferencias significativas en capacidades, precisión y funcionalidades. Comprender estas diferencias es vital para cualquier empresa que busque integrar estas tecnologías.

Impacto Económico: La adopción de IA puede optimizar procesos, desde la creación de contenido y marketing hasta la atención al cliente automatizada y el análisis de datos preliminar, potencialmente reduciendo costes operativos. Sin embargo, la elección entre herramientas gratuitas (con limitaciones) y de suscripción (más potentes, como GPT-4) debe alinearse con el presupuesto y las necesidades específicas. La dependencia de respuestas potencialmente inexactas (como se vio en la prueba de literatura o el acertijo) representa un riesgo económico si no se implementan controles de calidad humanos.
Ventaja Competitiva: Las empresas que identifiquen y apliquen estratégicamente la herramienta de IA más adecuada para sus tareas obtendrán una ventaja. Por ejemplo, una empresa que necesite citar fuentes podría preferir Bing o Bard, mientras que una enfocada en generación de texto creativo podría inclinarse por ChatGPT. La capacidad de interactuar en múltiples idiomas (o la falta de ella, como inicialmente en Bard) también es un factor competitivo clave para negocios globales. La agilidad para generar borradores, resumir información o incluso asistir en codificación puede acelerar ciclos de desarrollo y respuesta al mercado.
* Innovación: Estas IA pueden ser catalizadores de innovación al facilitar la lluvia de ideas, la exploración de nuevos conceptos de productos o servicios, y la personalización a escala. Sin embargo, la innovación real requiere más que la simple generación de texto; necesita pensamiento crítico, validación y la «sensibilidad» que, según los expertos, aún falta en estas herramientas. Las empresas deben ver a la IA como un asistente avanzado que potencia la creatividad y eficiencia humana, no como un sustituto completo, especialmente en tareas que requieren juicio experto, análisis profundo o comprensión matizada. La integración exitosa dependerá de la capacidad de la empresa para complementar las fortalezas de la IA con la supervisión y el talento humano

Compartir este artículo