Inicio » Ciencias » Modelos Mundiales de IA: el próximo salto cuántico en video, robótica y management

Modelos Mundiales de IA: el próximo salto cuántico en video, robótica y management

Los «modelos mundiales» o «simuladores mundiales» de IA se perfilan como la próxima gran revolución en el campo de la inteligencia artificial.

Empresas como World Labs y DeepMind están invirtiendo millones en su desarrollo, prometiendo avances significativos en la generación de video, la robótica y la toma de decisiones de la IA.

¿Qué son los Modelos Mundiales de IA?

Los modelos mundiales de IA se inspiran en la forma en que los humanos construyen modelos mentales del mundo.

Nuestro cerebro procesa información sensorial abstracta y la convierte en una comprensión concreta de nuestro entorno, creando «modelos» que influyen en nuestra percepción.

Un ejemplo citado por los investigadores David Ha y Jürgen Schmidhuber es el de un bateador de béisbol, capaz de predecir la trayectoria de una pelota a 100 mph en milisegundos, gracias a un modelo interno del mundo.

«Para los jugadores profesionales, todo esto ocurre de forma subconsciente», escriben, «sus músculos mueven el bate en el momento y lugar correctos de acuerdo con las predicciones de sus modelos internos».

Este tipo de razonamiento subconsciente es considerado por algunos como un prerrequisito para la inteligencia a nivel humano.

Aplicaciones y Potencial de los Modelos Mundiales:

La aplicación más inmediata y visible de estos modelos es la generación de video. Los videos generados por IA a menudo presentan inconsistencias, como extremidades distorsionadas.

Los modelos mundiales, al comprender las leyes físicas básicas (como por qué una pelota de baloncesto rebota), pueden generar videos más realistas y coherentes.

Como explica Alex Mashrabov, exjefe de IA de Snap y CEO de Higgsfield, «un espectador espera que el mundo que está viendo se comporte de forma similar a su realidad». Un modelo mundial evita la creación tediosa y manual de cada movimiento de objeto.

Pero la generación de video es solo la punta del iceberg. Yann LeCun, científico jefe de IA de Meta, cree que los modelos mundiales podrían usarse para pronósticos y planificación sofisticados.

Un modelo, con una representación básica de un «mundo» (ej. una habitación desordenada), dado un objetivo (una habitación limpia), podría determinar una secuencia de acciones (usar una aspiradora, lavar los platos, sacar la basura) no por imitación, sino por comprensión de causa y efecto.

«Necesitamos máquinas que comprendan el mundo; máquinas que puedan recordar cosas, que tengan intuición, sentido común, que puedan razonar y planificar al mismo nivel que los humanos», dijo LeCun.

«A pesar de lo que puedan haber oído de algunas de las personas más entusiastas, los sistemas de IA actuales no son capaces de nada de esto».

Desafíos y Limitaciones

El entrenamiento y la ejecución de modelos mundiales requieren una enorme capacidad de computación, incluso superior a la de los modelos generativos actuales.

Sora, un modelo considerado como un «modelo mundial» por OpenAI, necesita miles de GPUs para su entrenamiento y ejecución. Además, los modelos mundiales, como todos los modelos de IA, «alucinan» e internalizan sesgos de sus datos de entrenamiento.

Un modelo entrenado principalmente con videos de ciudades europeas soleadas podría tener dificultades para representar ciudades coreanas nevadas.

Cristóbal Valenzuela, CEO de Runway, destaca la necesidad de datos de entrenamiento amplios y específicos para capturar con precisión el comportamiento de los habitantes de un mundo (humanos y animales).

«Los modelos necesitarán generar mapas consistentes del entorno», dijo, «y la capacidad de navegar e interactuar en esos entornos».

El Futuro de los Modelos Mundiales

A pesar de los desafíos, el potencial de los modelos mundiales es enorme. Podrían generar mundos 3D interactivos para videojuegos, fotografía virtual y más, según Justin Johnson de World Labs.

Además, podrían mejorar la robótica, otorgando a los robots una conciencia del mundo que los rodea, permitiendo una toma de decisiones más inteligente y adaptativa.

«Con un modelo mundial avanzado, una IA podría desarrollar una comprensión personal de cualquier escenario en el que se encuentre», dijo Mashrabov, «y empezar a razonar posibles soluciones».

Aunque aún queda un largo camino por recorrer, la inversión multimillonaria y el trabajo de empresas líderes en IA indican que los modelos mundiales podrían revolucionar la forma en que interactuamos con la tecnología y el mundo que nos rodea.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

WP to LinkedIn Auto Publish Powered By : XYZScripts.com