Google continúa decididamente enfocado en la tarea de recuperar terreno y tiempo perdido después de la impactante avanzada de OPEN AI y sus CHAT GPT. El gigante tecnológico acaba de lanzar una nueva herramienta de Inteligencia Artificial (IA) llamada Gemini, que presentó como más potente que cualquier otra actualmente en el mercado, incluyendo el ya famoso y popular ChatGPT, creado por OpenAI, hoy aliada con Microsoft.
Esto ocurre mientras en la vereda rival Open AI pasa por momentos turbulentos y de reajuste luego del inesperado episodio en que su CEO, Sam Altman, fue expulsado por su propia junta directiva para luego ser restituido con el aparente apoyo y respaldo financiero de Microsoft. Se tejieron una serie de especulaciones de las más insólitas y bizarras acerca de las razones que provocaron el insólito escenario, que hasta hoy no se aclara totalmente. En ese contexto se produjeron una serie de escaramuzas con despidos, renuncias y más despidos, reincorporaciones, etc. Mientras tanto Google parece haber aprovechado todo el embrollo de OPEN AI para preparar su feroz arremetida. Que por estos días se está haciendo realidad. En el lanzamiento de GEMINI, la compañía subraya su”multimodalidad“, al ser capaz de “razonar con fluidez mediante textos, imágenes, video, audio y códigos”, a través de lo que se conoce como el modelo MMLU, siglas en inglés para la “comprensión masiva de lenguaje multitareas”.
Según la presentación general ofrecida por la compañía, Gemini se presentará en tres formatos: Nano (la más sencilla, en forma de aplicación para teléfonos celulares), Pro y Ultra, esta última “la más potente para tareas de gran complejidad”.
Gemini puede recibir información visual o auditiva (notas de música, imágenes, palabras) y desde ahí generar contenido propio, que a su vez puede ser en versión texto, audio o imágenes.
En la presentación, Gemini es capaz de detectar errores en un problema matemático complejo, dar la respuesta correcta y explicar los pasos hasta llegar a ella; El potencial de Gemini se va a aplicar a su sistema actual de chat, conocido como Bard y que funciona ya en varias lenguas, incluido el español.
La compañía no ha aclarado cómo piensa monetizar la nueva herramienta, y por el momento se ha limitado a anunciar que estará disponible a partir de la semana próxima (desde 13 de diciembre).
De manera perturbadora Google Gemini es capaz de razonar, por lo que podría realizar labores básicas de reconocimiento de texto, imágenes, vídeo, audio, código de programación y hasta acciones de individuos, como se observa en los videos de presentación. Debido a todos estos motivos esta Inteligencia Artificial sería mucho más potente que ChatGPT. Por lo menos hasta que Sam Altman presente su modelo GPT-5.