2023 será recordado como un punto de inflexión en la historia de la inteligencia artificial, donde la competencia entre gigantes y startups terminó con la llegada de Google Gemini.
La verdad es que durante el año 2023, esta gran compañía se ha quedado un poco atrás en este campo, a pesar de un gran lanzamiento como el de Google Bard, pero parece que tiene una última sorpresa esperándola hasta el final.
– Infórmate Venezuela –
Gemini se presenta como una familia de modelos que promete superar incluso al famoso GPT-4 en varios aspectos, especialmente en integración multimodal. Puede crear y procesar texto, imágenes y otros tipos de datos como gráficos y mapas.
Sin embargo, por muy impresionantes que parezcan estas herramientas hoy en día, Google cree que están lejos de maximizar todo el potencial de la tecnología. Entonces, en este artículo analizaremos qué está tratando de lograr el gigante de las búsquedas con Gemini, cómo funciona y por qué lo ven como el futuro de la IA, informó Computer Hoy.
¿Qué es Google Géminis?
Mellizos Tampoco se puede acceder directamente a un nuevo y potente modelo de inteligencia artificial de Google, al estilo GPT-4.. Más bien, actúa como una base que Google y, eventualmente, otros desarrolladores pueden utilizar para crear productos sobre ella. Por ejemplo, GPT-4 sirvió para crear un ChatGPT más potente. Con Géminis ocurre lo mismo.
– Infórmate Venezuela –
Según Dennis Hassabis, director ejecutivo y cofundador de Google DeepMind, “fue construido desde cero para ser multimodal, lo que significa que puede resumir y comprender, procesar e integrar sin problemas información dispar, incluidos texto, código y audio. , fotografías y vídeos”. «.
Puede comprender no sólo texto sino también imágenes, vídeos y audio. Como modelo multimodal, Gemini se describe como capaz de realizar tareas complejas en matemáticas, física y otros campos, además de comprender y generar código de alta calidad en múltiples lenguajes de programación.
Si bien esto por sí solo no es un gran atractivo, con modelos similares disponibles ahora, la versatilidad del Gemini es un factor clave, ya que es más que un solo modelo y puede funcionar en todo, desde centros de datos hasta dispositivos móviles.
Se lanzó el 6 de diciembre con demostraciones que muestran cómo escribir código, explicar problemas matemáticos, encontrar similitudes entre dos imágenes, convertir imágenes en código, comprender emojis y más, aunque hubo controversia sobre cuán manipuladas estaban estas pruebas.
Estará disponible en tres modelos.
Así describe Google a Géminis Un modelo flexible capaz de ejecutarse en todo, desde centros de datos de Google hasta dispositivos móviles. Para lograr esta escala, Gemini se lanzará en tres tamaños: Géminis Nano, Géminis Pro y Géminis Ultra.
1. Gemini Nano: El modelo Gemini Nano está diseñado para funcionar en teléfonos inteligentes, específicamente el Google Pixel 8. Está diseñado para realizar tareas en el dispositivo que requieren un procesamiento eficiente de IA sin conectarse a servidores externos, como sugerir respuestas en el chat de la aplicación. o resumir el texto.
La ventaja de permanecer en su teléfono y no acudir a servidores externos es la privacidad y seguridad de la que habla la mayoría de la gente cuando se refiere a estas herramientas de inteligencia artificial. Eso sí, no esperes la misma velocidad de respuesta, y es cierto que consumen mucha batería y espacio de almacenamiento.
- Gemini Pro: Gemini Pro, que se ejecuta en los centros de datos de Google, está diseñado para impulsar la última versión del chatbot Bard AI de la compañía. Es capaz de ofrecer tiempos de respuesta rápidos y comprender consultas complejas. En este caso, el modelo anterior, el PaLM 2, será eliminado para dar la bienvenida al Gemini Pro.
- Gemini Ultra: Aún no está disponible para uso generalizado, Google describe al Gemini Ultra como su modelo más capaz, «supera el rendimiento actual de última generación en 30 de 32 puntos de referencia académicos ampliamente utilizados en la investigación y el desarrollo de modelos de lenguaje grande (LLM)». Está diseñado para tareas muy complejas y se lanzará después de completar la fase de prueba actual.Esto se espera para principios de 2024.
– Infórmate Venezuela –