Los chips para abordar la IA de próxima generación y un enfoque abierto son parte de la oferta integral de IA de Google Cloud que además presentó innovaciones para que la nube sea una plataforma abierta.
Google Cloud ha anunciado una expansión generalizada en su infraestructura de nube , prometiendo un enfoque variado y potente para el entrenamiento , la inferencia y el procesamiento de datos de la IA.
En Google Cloud Next 2024 , su conferencia anual celebrada en Mandalay Bay en Las Vegas, Google Cloud presentó una serie de nuevos avances para su arquitectura de ‘AI Hypercomputer’, destinados a ayudar a los clientes a desbloquear todo el potencial de los modelos de AI.
Con la necesidad de atender la demanda cada vez mayor de sus clientes, AI Hypercomputer reúne las TPU y GPU de Google Cloud , así como su software de IA para ofrecer una amplia cartera de opciones de capacitación en IA generativa .
Uno de los pilares centrales de la arquitectura de hipercomputadora de IA son las unidades de procesamiento tensorial (TPU) de Google Cloud (circuitos diseñados específicamente para redes neuronales y aceleración de IA) y Google Cloud ha anunciado que la última iteración de TPU v5p ya está disponible de forma generalizada.
Anunciado por primera vez en diciembre de 2023, Google Cloud afirmó que TPU v5p puede entrenar modelos de lenguaje grandes tres veces más rápido que la generación anterior. Cada TPU v5p contiene 8960 chips que pueden desbloquear mejoras en el ancho de banda de la memoria del 300% por chip.
A las máquinas virtuales (VM) A3 de Google Cloud, anunciadas en mayo de 2023, se les unirá una nueva VM ‘A3 mega’. Con una variedad de GPU H100 de Nvidia en cada VM, A3 mega ofrecerá el doble de ancho de banda de red de GPU a GPU, lo que los hace ideales para ejecutar y entrenar las cargas de trabajo de IA más grandes del mercado.
Un nuevo servicio llamado Hyperdisk ML ayudará a las empresas a aprovechar el almacenamiento en bloque para mejorar el acceso a los datos con fines de inteligencia artificial y aprendizaje automático (ML) . Sigue al anuncio de 2023 de Google Cloud Hyperdisk, un servicio de almacenamiento en bloque que ayuda a las empresas a conectar dispositivos de almacenamiento duraderos a instancias de VM individuales.
«La IA es un problema actual»
Estamos listos, comenzando con una cuenta regresiva estilizada para el inicio oficial de la conferencia y pasando rápidamente a un montaje de video de algunos de los avances recientes de Google Cloud en IA.
En Google, nos dicen que «la IA es un problema actual» y el montaje analiza los diversos casos de uso empresarial de la IA de Google. «Puede traducir de un código a otro y está un paso más cerca de hablar mil idiomas». También nos dicen que tiene aplicaciones transformadoras para análisis y seguridad.
Aquí para contarnos más está Thomas Kurian, director ejecutivo de Google Cloud. «Han pasado menos de ocho meses desde el próximo 2023», comienza, añadiendo que en este tiempo Google Cloud ha introducido más de 1.000 avances de productos y ha avanzado en infraestructuras como la presentación de seis nuevos cables submarinos.
Para entrar en más detalles, Kurian da la bienvenida a Sundar Pichai en un vídeo pregrabado para detallar algunos de los mayores avances que ha logrado Google Cloud.
Casi el 90% de los unicornios de IA son clientes de Google Cloud, le dice Pichai a la audiencia. Centrándose en Gemini, destaca los grandes avances que se han logrado con el modelo interno de Google sólo en el último año: Gemini 1.5 Pro , que ahora está disponible de forma generalizada, puede ejecutar un millón de tokens de información de manera consistente y puede procesar audio y video. , código, texto e imágenes a través de su forma multimodal.
Según Pichai, una compañía de seguros podría utilizarlos para grabar vídeos e imágenes de un incidente y automatizar el proceso de reclamaciones.
Se nos dice que esperemos testimonios de representantes de empresas como Uber, Goldman Sachs y Palo Alto para explorar formas concretas en las que Google AI ya está cambiando los procesos comerciales.
Pasando el testigo nuevamente a Kurian, se nos brinda una descripción general de algunas de las noticias de hoy.
«Nuestros anuncios más importantes de hoy se centran en la IA generativa», dice Kurian, y explica que Google Cloud se centra en ‘agentes’ de IA que pueden usarse para procesar información multimodal para automatizar tareas complejas como compras personales o automatizar más los traspasos de empleados a enfermeras. .
Provocar estos avances es una cosa, pero la clave es basarlos en mejoras tangibles en los procesos de negocio.
Aquí (a través de vídeo) para explicar más está David Solomon, presidente y director ejecutivo de Goldman Sachs.
“Específicamente en Goldman Sachs, nuestro trabajo con IA generativa se ha centrado en tres pilares clave: permitir el crecimiento empresarial, mejorar la experiencia del cliente y mejorar la productividad de los desarrolladores.
Solomon dice que la evidencia ya muestra que la IA generativa se puede utilizar para mejorar la eficiencia de los desarrolladores hasta en un 40%. La compañía también está explorando formas de utilizar la inteligencia artificial para resumir declaraciones públicas y recopilar información sobre ganancias.
La infraestructura es crucial en la era de la IA
Kurian señala que la infraestructura es de suma importancia para respaldar el desarrollo de la IA en la nube y presenta a Amin Vahdat, vicepresidente de sistemas e infraestructura de Google Cloud, para analizar la gran cantidad de anuncios de infraestructura de hoy.
Vahdat analiza una serie de nuevos anuncios en la hipercomputadora AI de Google, incluida la disponibilidad general de su nuevo acelerador de AI TPU v5p y el próximo lanzamiento de la nueva familia de chips Blackwell de Nvidia en Google Cloud.
La empresa también se ha centrado en mejorar el tiempo de carga a través de Hyperdisk ML, una solución de almacenamiento en bloque que puede ofrecer mejoras hasta 11,9 veces superiores a alternativas comparables.