La Inteligencia Artificial aprueba la Selectividad, pero tropieza en matemáticas y carece de profundidad

La Inteligencia Artificial aprueba la Selectividad, pero tropieza en matemáticas y carece de profundidad

Evox News
Por
6 min de lectura

Inteligencia Artificial supera prueba de acceso universitario con nota de 8,36 sobre 14

Una iniciativa docente llevada a cabo en un instituto de enseñanza secundaria ha evaluado el rendimiento de la herramienta de inteligencia artificial ChatGPT en las pruebas de Evaluación para el Acceso a la Universidad (EVAU), logrando una calificación promedio de 8,36 puntos sobre un máximo de 14.

Según uno de los impulsores del estudio y profesor de Marketing en el centro educativo, la idea surgió ante la creciente accesibilidad de esta tecnología de IA. El objetivo era analizar su eficacia y la procedencia de su información antes de que el estudiantado comenzara a utilizarla de forma independiente.

El equipo de profesores se propuso medir la aptitud de esta inteligencia artificial para responder a las pruebas de la EVAU. Para ello, ChatGPT se enfrentó a cuestiones auténticas y recientes de seis materias distintas: Inglés, Matemáticas Aplicadas, Lengua Castellana, Historia de España, Economía de la Empresa y Filosofía. La evaluación se realizó bajo la supervisión de docentes que formaron parte del tribunal en la última convocatoria de la EVAU.

Rendimiento destacado en humanidades, deficiente en matemáticas

La calificación final de 8,36 sobre 14 permitiría a un estudiante hipotético acceder a titulaciones universitarias como Física, Química, Biología, Derecho o Administración y Dirección de Empresas (ADE).

El docente a cargo del proyecto señaló que se aplicaron los baremos de evaluación correspondientes a la EVAU del año 2022 de la Universidad de Jaén. Es relevante apuntar que la IA no tenía acceso previo a estos criterios específicos, dado que su base de conocimiento fue actualizada por última vez en 2021.

inteligencia artificial EVAU

El desempeño de ChatGPT en la prueba fue desigual. Obtuvo una puntuación sobresaliente de 9 en Inglés, lo que demuestra un dominio considerable de la gramática y sintaxis del idioma, según los evaluadores.

Sin embargo, en otras áreas las calificaciones fueron notablemente inferiores: 2,5 en Matemáticas Aplicadas, 2,75 en Química, 6 en Lengua Castellana, 4 en Historia de España, 5,5 en Economía de la Empresa y 5,5 en Filosofía. En Biología, por otro lado, alcanzó un notable 8,8.

El responsable del estudio atribuye los mejores resultados en asignaturas de humanidades a la naturaleza conversacional de la IA, diseñada para interactuar textualmente. Por el contrario, su dificultad con las representaciones gráficas explicaría el bajo rendimiento en Matemáticas.

Una IA con conocimientos, pero sin profundidad analítica

Aunque la herramienta exhibió una correcta aplicación gramatical y sintáctica, el equipo evaluador observó que las contestaciones carecían de profundidad, eran superficiales y no referenciaban fuentes.

Se detectó que ChatGPT evitó la terminología especializada, abordando los temas de forma muy general, sin evidenciar análisis crítico o criterio propio. En ocasiones, incluso pareció generar datos o resultados para dotar de mayor coherencia a sus respuestas.

El promotor del estudio matizó que únicamente se facilitaron las preguntas a la IA, sin proporcionar ningún tipo de información contextual adicional. «Esta ausencia de contexto podría haber limitado la profundidad de las respuestas y, por ende, los resultados», indicó. Considera que proporcionar información contextual, como indicar que se trataba de un examen de Química, podría haber mejorado la recuperación de datos relevantes por parte de la IA.

El equipo docente considera que este experimento evidencia que, si bien la inteligencia artificial ha progresado significativamente, aún existe una brecha considerable para que las máquinas igualen la capacidad humana en términos de conocimiento profundo y pensamiento crítico.

Insights de Evox News: Cómo la evaluación de IA en pruebas académicas puede impactar tu negocio

Este experimento, aunque académico, ofrece valiosas lecciones para el entorno empresarial:

Validación de Capacidades: Demuestra que, si bien herramientas como ChatGPT son potentes en tareas lingüísticas y de recuperación de información general, presentan limitaciones significativas en razonamiento complejo (matemáticas), análisis profundo y pensamiento crítico. Las empresas que integren IA deben ser conscientes de estas limitaciones y no sobrestimar sus capacidades actuales para tareas que requieran juicio experto o análisis matizado.
Supervisión Humana Indispensable: La tendencia de la IA a generar respuestas superficiales o incluso «inventar» datos subraya la necesidad crítica de supervisión humana. En aplicaciones empresariales (generación de informes, análisis de mercado, atención al cliente), depender ciegamente de la IA sin validación puede llevar a errores costosos o decisiones mal fundamentadas. La IA debe verse como una herramienta de apoyo, no un sustituto completo del criterio humano.
* Oportunidades de Innovación y Ventaja Competitiva: Las debilidades actuales de la IA (falta de profundidad, pensamiento crítico, dependencia del contexto) señalan áreas donde el talento humano sigue siendo crucial y donde se puede obtener una ventaja competitiva. Las empresas pueden enfocarse en desarrollar habilidades en sus equipos que la IA no puede replicar fácilmente. Además, surgen oportunidades para desarrollar soluciones de IA más sofisticadas o servicios que combinen la eficiencia de la IA con la profundidad del análisis humano, o incluso herramientas especializadas en la verificación de contenido generado por IA. El entendimiento preciso de qué puede y no puede hacer la IA permite una implementación más estratégica y rentable

Compartir este artículo