El 20 de mayo, Google anunció durante la conferencia anual Google I/O 2025 en San Francisco, una serie de avances en sus tecnologías de inteligencia artificial. Entre los aspectos destacados está el lanzamiento gratuito de Gemini Live para usuarios de Android y iPhone (iOS).
La herramienta, que combina entrada de voz, video y uso compartido de pantalla, permite interacciones más largas y naturales. Se puede usar, por ejemplo, para resolver problemas domésticos con soporte visual en tiempo real o para planificar actividades como salidas con amigos, incluyendo la creación de eventos automáticos en Google Calendar y sugerencias de Google Maps.
La búsqueda con IA es rediseñada
La función se está integrando progresivamente en todo el ecosistema de Google, como Calendar, Tasks, Keep y Maps. Según Josh Woodward, vicepresidente de Google Labs, el objetivo es permitir la gestión centralizada de la información en un solo lugar.
La compañía también presentó el nuevo Modo de Búsqueda con IA, considerado una reinvención completa de cómo los usuarios interactúan con el motor. La función, que comienza a lanzarse en Estados Unidos, utiliza razonamiento avanzado para manejar consultas más complejas, transformando palabras clave en respuestas contextualizadas basadas en las preferencias y el historial de navegación de los usuarios.
Con esto, será posible hacer preguntas más largas, agregar nuevas preguntas en secuencia e incluso usar la cámara del teléfono para mostrar objetos y contextos al motor de búsqueda. Google afirma que en países como Estados Unidos e India, el uso de Resúmenes de IA ha aumentado el número de tipos de búsqueda realizados en más del 10%.
Nuevos planes pagos: AI Pro y AI Ultra
La gran tecnología también reveló dos nuevas suscripciones: Google AI Pro y Google AI Ultra. La versión Pro, con una tarifa mensual de 19,99 dólares (aproximadamente 113 reales), ofrece acceso a todos los productos de IA de la compañía con mayor capacidad de procesamiento y características adicionales. El plan Ultra, por 249,99 dólares (aproximadamente 1,414 reales), incluye acceso anticipado a tecnologías experimentales, como el modo Deep Think y el generador de video Veo 3.
Ambos planes ya están disponibles en Estados Unidos y, según Google, están dirigidos a usuarios avanzados que desean utilizar todo el potencial de Gemini.
Gemini 2.5 Pro y Flash reciben mejoras
El Gemini 2,5 Pro ha sido actualizado con el modo experimental Deep Think, dirigido a razonamientos complejos y análisis profundos. Mientras tanto, Flash 2,5 ha sido optimizado para responder más rápidamente y de manera más económica, con un 20% a 30% menos de consumo de tokens en tareas multimodales.
Ambos modelos ahora cuentan con salida de audio nativa, detección de emociones en el habla y soporte para múltiples idiomas, incluyendo características como conversión de texto a voz con entonación y acentos personalizables. La actualización también trae mayor seguridad contra ataques de inyección de comandos, siendo Gemini 2,5 considerado el más seguro de la compañía hasta la fecha.
Integración con Chrome y plan gratuito para estudiantes
Otra novedad es la integración inicial de Gemini en el navegador Chrome, permitiendo a los usuarios solicitar resúmenes o explicaciones sobre cualquier página web. Inicialmente disponible solo para suscriptores de los planes Pro y Ultra en los Estados Unidos, la funcionalidad se ampliará pronto.
Estudiantes de Brasil, Estados Unidos, Indonesia, Japón y el Reino Unido tendrán acceso gratuito al plan Gemini Pro durante un año académico. Lo anterior, como parte de la iniciativa de la compañía para democratizar el uso de la IA en la educación.
Creación de imágenes y videos con IA
Se presentaron dos nuevos modelos generativos: Imagen 4, dirigido a imágenes fotorrealistas con alta precisión de texto y detalles visuales, y Veo 3, capaz de generar videos con sonido ambiental, efectos de sonido y diálogos. Estas características ya están disponibles en la aplicación Gemini para suscriptores de AI Ultra.
El modelo Veo 3 se señala como el primero de su tipo con generación de audio nativa, lo que mejora significativamente el realismo de las creaciones audiovisuales de IA.
Canvas y Deep Research mejoran la productividad
El Canvas, un espacio creativo dentro de Gemini, ahora permite la creación de infografías, cuestionarios e incluso audios de podcasts en 45 idiomas. Mientras tanto, Deep Research ofrece informes personalizados al cruzar documentos privados con datos públicos. Se trata de una característica útil para investigadores y profesionales que buscan obtener conocimientos más profundos ahorrando tiempo.
Según Koray Kavukcuoglu, CTO de Google DeepMind, y Tulsee Doshi, directora senior de gestión de productos, la función se integrará en Google Drive y Gmail en próximas actualizaciones.
Google Meet obtiene video 3D con Beam
Google Meet ha sido mejorado con la tecnología de video 3D de Google, Google Beam, una evolución del proyecto Starline. En asociación con empresas como HP, la función crea la sensación de presencia física durante las videollamadas. Además, la plataforma ahora ofrece traducción en tiempo real, inicialmente para inglés y español.
IA como un Agente Autónomo
El nuevo modo Gemini Agent, que se espera lanzar pronto, permitirá a la IA realizar tareas de múltiples pasos. Tales, como buscar propiedades, programar visitas y completar formularios en línea. Esta función podría expandirse a otras aplicaciones en el ecosistema de Google, como Gmail y Drive.
Con estas innovaciones, Google busca mantener su liderazgo en el sector en medio de la creciente competencia de rivales como OpenAI, Microsoft y Perplexity. Sundar Pichai, CEO de Google y Alphabet, destacó el momento como una nueva fase en la evolución de la IA:
“Décadas de investigación se están convirtiendo en realidad para personas, empresas y comunidades en todo el mundo.”
Las actualizaciones reflejan la estrategia de la compañía para transformar su búsqueda tradicional en una plataforma de agentes digitales inteligentes, enfocándose en la personalización, la autonomía y la integración completa en la vida diaria de los usuarios.
Descargo de responsabilidad
Descargo de responsabilidad: en cumplimiento de las pautas de Trust Project, BeInCrypto se compromete a brindar informes imparciales y transparentes. Este artículo de noticias tiene como objetivo proporcionar información precisa y oportuna. Sin embargo, se recomienda a los lectores que verifiquen los hechos de forma independiente y consulten con un profesional antes de tomar cualquier decisión basada en este contenido.