Google reinventa el futuro: IA traduce, viste y crea mundos audiovisuales

Google reinventa el futuro: IA traduce, viste y crea mundos audiovisuales

Evox News
Por
13 min de lectura

Google Despliega un Arsenal de Innovaciones Impulsadas por la Inteligencia Artificial

Mountain View, California (Evox News) – Google ha presentado una serie de avances tecnológicos centrados en la inteligencia artificial (IA) durante su conferencia anual Google I/O. Entre las novedades destacan un sistema de traducción en tiempo real para Google Meet que conserva la singularidad de la voz del hablante, una herramienta de prueba virtual de ropa para compras en línea y las nuevas gafas Android XR, todas potenciadas por la IA.

La gigante tecnológica también anunció la integración de un «modo con inteligencia artificial» en su motor de búsqueda en Estados Unidos. Esta función, impulsada por la potente IA Gemini 2.5, promete transformar la experiencia de búsqueda en la web, según se reveló en la conferencia de desarrolladores.

Sundar Pichai, CEO de Google, describió esta actualización como una «reinvención completa» del buscador, permitiendo a los usuarios realizar consultas más extensas y complejas utilizando un lenguaje natural, sin la necesidad de recurrir a palabras clave específicas.

Pichai destacó que las pruebas iniciales han demostrado que los usuarios están realizando consultas significativamente más largas, superando en ocasiones hasta cinco veces la extensión de las búsquedas tradicionales. Este «Modo IA» ha estado disponible como experimento preliminar para suscriptores de Google One AI Premium.

A diferencia del buscador convencional, el «Modo IA» emplea una técnica de «abanico de consultas», dividiendo la pregunta del usuario en subtemas y buscando respuestas específicas para cada uno. Según la empresa, este enfoque permite una exploración más profunda de la web y la identificación de contenido más relevante y preciso.

Traducción de Idiomas Sin Perder la Esencia de la Voz

La nueva función de Google Meet busca eliminar las barreras lingüísticas de manera casi instantánea, preservando al mismo tiempo el tono, la expresión y la voz distintiva de cada participante.

Durante la presentación en el Anfiteatro Shoreline, se mostró un video pregrabado que ejemplificaba esta funcionalidad, mostrando una conversación fluida entre una persona de habla inglesa y otra de habla hispana, cada una comunicándose en su lengua materna sobre el alquiler de una propiedad.

Captura de un video de Google de la presentación del traductor de voz simultáneo en Google Meet. EFE/ Google
Captura de un video de Google de la presentación del traductor de voz simultáneo en Google Meet. EFE/ Google

«El resultado es una conversación auténtica y natural, incluso en diferentes idiomas, ya sean nietos angloparlantes charlando sin esfuerzo con sus abuelos hispanohablantes o colegas de todo el mundo conectados desde diferentes continentes», señaló Google en un comunicado.

Actualmente, esta herramienta está disponible en fase beta para suscriptores de los planes Google AI Pro y Ultra, con planes de expansión a usuarios empresariales en el futuro cercano.

Google Apuesta por la Generación de Video y Audio con IA

Google ha revelado su modelo de generación de video impulsado por IA, Veo 3, que por primera vez integra la generación de video y audio (música, efectos especiales y diálogo). Anteriormente, la IA se limitaba a la creación de imágenes, sin capacidades de sonido.

«Estamos entrando en una nueva era de creación», afirmó Josh Woodward, vicepresidente de Google Labs y Gemini.

Según Google, esta innovadora herramienta de generación de video mejora la calidad de Veo 2 (presentada este año para competir con modelos similares de OpenAI) y, por primera vez, puede generar videos con audio, incluyendo sonidos ambientales como el tráfico en una calle, el canto de pájaros en un parque e incluso diálogos entre personajes.

La compañía también anunció Imagen 4, un nuevo modelo para la generación de imágenes con IA, que destaca por su capacidad para recrear texto de manera precisa, una tarea que tradicionalmente ha representado un desafío para la IA.

Otra innovación es Flow, una herramienta de edición cinematográfica que Google describe como «una herramienta de cine con IA que te permite crear clips, escenas e historias cinematográficas».

Compra de Ropa Asistida por IA

Una nueva función, disponible actualmente en Search Labs (EE.UU.), permite a los usuarios visualizar cómo les quedaría una prenda de vestir. Sin embargo, la herramienta no garantiza un ajuste perfecto al cuerpo del usuario ni permite probar diferentes tallas.

«El propósito no es tanto que quede bien. La clave es poder ver cómo luce», explicó Lilian Rincon, vicepresidenta de producto de compras para el consumidor de Google, antes de la presentación.

La herramienta, denominada «Try it on», requiere únicamente una fotografía de cuerpo entero y no necesita información sobre la altura o el peso del usuario.

Los usuarios en Estados Unidos podrán utilizar esta función para «probarse miles de millones de prendas de la base de Shopping Graph».

A diferencia de la tecnología mostrada en la película ‘Clueless’, esta nueva función no permite combinar diferentes prendas de vestir.

Android XR: La Nueva Generación de Gafas Inteligentes

Google también presentó la última versión de sus gafas inteligentes, Android XR, un modelo que integra la IA Gemini y ofrece traducción en tiempo real, aunque la demostración de esta función experimentó algunos problemas técnicos durante la conferencia.

Google ha estado desarrollando el concepto de gafas inteligentes durante la última década, y Android XR representa un «gran paso adelante», según la compañía.

Fotografía de archivo de un anuncio de Google, que ha presentado sus últimas innovaciones impulsadas en la inteligencia artificial. EFE/Hannibal Hanschke
Fotografía de archivo de un anuncio de Google, que ha presentado sus últimas innovaciones impulsadas en la inteligencia artificial. EFE/Hannibal Hanschke

«Equipadas con cámara, micrófonos y altavoces, estas gafas funcionan en conjunto con su teléfono, permitiéndole acceder a sus aplicaciones sin tener que buscar en el bolsillo», explicó la empresa.

Estas gafas futuristas también cuentan con una «pantalla opcional» en el interior de la lente que proporciona información útil de forma privada, como mapas o mensajes de texto.

Google también destacó sus esfuerzos para hacer estos modelos más elegantes, colaborando con Gentle Monster y Warby Parker como socios fundadores para el diseño y suministro de las monturas.

Cofundador de Google Predice la Llegada de la Inteligencia Artificial General Antes de 2030

Sergey Brin, cofundador de Google, pronosticó durante la conferencia Google I/O que la inteligencia artificial general (IAG), una tecnología hipotética capaz de comprender o aprender cualquier tarea intelectual que pueda realizar un ser humano, estará disponible antes de 2030.

Brin, quien dejó su cargo ejecutivo en 2019 y ahora colabora con los investigadores de IA de Google, también sugirió que en el futuro coexistirán múltiples IAG.

Por su parte, Demis Hassabis, director ejecutivo de Google DeepMind, estima que la IAG llegará después de 2030.

Hassabis también señaló que la IAG debería ser capaz de «comprender las emociones».

«Creo que sería casi una decisión de diseño si quisiéramos imitar las emociones. No creo que haya ninguna razón por la que no pudiera serlo en teoría, pero podría ser diferente, o podría no ser necesario, o de hecho, no deseable, que tengan el tipo de reacciones emocionales que tenemos los humanos», matizó en el encuentro con Brin que se celebró hoy en Mountain View, en la sede de la compañía en California.

Brin describió el momento actual en Google como un período emocionante para trabajar: «Cualquiera que sea informático no debería estar jubilado ahora mismo».

Insights de Evox News: Cómo las innovaciones de Google pueden impactar tu negocio

La presentación de Google en su conferencia I/O revela un futuro donde la IA se integra aún más en la vida cotidiana y, crucialmente, en el mundo empresarial. Para los negocios, esto significa:

Mejora de la Comunicación Global: La traducción en tiempo real con preservación de la voz en Google Meet podría revolucionar las operaciones internacionales. Las empresas podrían comunicarse con clientes y socios en todo el mundo de manera más natural y efectiva, eliminando barreras lingüísticas y facilitando la expansión a nuevos mercados. Esto se traduce en una ventaja competitiva al poder construir relaciones más sólidas y personales con stakeholders globales.
Optimización de la Experiencia del Cliente en el Retail: La herramienta de prueba virtual de ropa tiene el potencial de transformar la industria del retail. Al permitir a los clientes visualizar cómo les queda la ropa antes de comprarla, las empresas pueden reducir las tasas de devolución, aumentar la satisfacción del cliente y mejorar las ventas en línea. Esto representa una oportunidad de innovación para las marcas que buscan destacarse en un mercado cada vez más competitivo.
Impulso a la Creatividad y la Producción de Contenido: La capacidad de generar videos con audio a través de IA abre nuevas posibilidades para la creación de contenido. Las empresas podrían producir videos promocionales, tutoriales y otros materiales de marketing de manera más rápida y económica. Esto ofrece una ventaja en términos de eficiencia y agilidad, permitiendo a las empresas adaptarse rápidamente a las tendencias y necesidades del mercado.
Adopción Temprana de la IAG (Inteligencia Artificial General): Si la predicción de Sergey Brin se cumple, las empresas deben comenzar a prepararse para un futuro donde la IAG tenga un impacto significativo. Esto implica invertir en investigación y desarrollo de IA, capacitar a los empleados en nuevas habilidades y explorar cómo la IAG puede transformar sus modelos de negocio. Aquellas empresas que adopten la IAG de manera temprana podrían obtener una ventaja significativa sobre sus competidores

Compartir este artículo