Esta rama de la IA permite recibir y procesar datos de diversa índole simultáneamente para obtener soluciones más precisas, adaptadas a cada situación, lo que se aproxima más a la forma en que los seres humanos piensan e interactúan con el mundo.

La inteligencia artificial (IA) es un área clave para el futuro de la sociedad y la economía cada vez más presente en las empresas, que utilizan esta tecnología para la mejora de la eficiencia, competitividad e innovación de sus procesos de producción y servicios. Así, el 12,6% de las compañías españolas de más de diez empleados ya usan algún tipo de IA, un porcentaje que se eleva al 41,3% en el caso de las firmas del sector TIC, según una encuesta del Instituto Nacional de Estadística (INE), publicada a finales de 2022.

Los usos más comunes de la IA son la automatización de flujos de trabajo, soporte en la toma de decisiones, dotar de movimiento físico a las máquinas o identificar objetos y personas en imágenes.

Dentro de la inteligencia artificial encontramos varias ramas, como la IA generativa, que recurre al machine learning para asimilar los patrones y relaciones existentes en un conjunto de datos creados por personas. A partir de ahí, desarrolla su propio contenido con características similares. Una de sus aplicaciones más comunes son los chats de conversación o chatbots, la traducción automática de textos, la generación o modificación de imágenes o la creación de voces.

Este año se prevé que la IA generativa dé un paso más allá con la denominada inteligencia artificial generativa multimodal, que permite recibir y procesar datos de diversa índole simultáneamente (textos, imágenes, vídeo, audio, medidas de temperatura, movimiento, etc.) para obtener soluciones más precisas, adaptadas a cada situación. La diferencia respecto a la IA generativa unimodal, es que esta última solo tiene en cuenta un tipo de información (textos, imágenes, vídeos o audio).

De esta forma se busca replicar la manera de percibir y comunicar información de manera integral, aprovechando las diversas fuentes sensoriales y los datos recibidos para enriquecer su comprensión. Este nuevo modelo se acerca más a la forma en que los seres humanos interactúan con el mundo.

Un ejemplo de lo que se puede lograr con IA multimodal es la generación de objetos, entornos y datos espaciales en 3D a través de tecnologías como la realidad aumentada, la realidad virtual, así como la simulación de sistemas físicos complejos como los gemelos digitales, una réplica virtual realizada a imagen y semejanza de un objeto físico, proceso o sistema.

Aplicaciones de la IA multimodal

Con la IA multimodal se abre un amplio abanico de posibilidades en sectores como el de la salud, la automoción, la educación o en cuestiones como la accesibilidad. A continuación, desgranamos algunas de sus aplicaciones en estos ámbitos:

  • Asistencia sanitaria. Permitirá mejorar el diagnóstico y ajustar el tratamiento de cada paciente, a través de la combinación de diferentes datos como imágenes médicas, el historial del paciente o los proporcionados por sensores médicos portátiles (ritmo cardiaco, presión arterial, glucosa, etc.).
  • Automoción. Potenciará la seguridad vial mediante la fusión de datos procedentes de cámaras o radares.
  • Educación. Analizará textos, vídeos de impartición de clases y exámenes para adaptar los contenidos y hacerlos más atractivos para el alumnado, ofreciendo una experiencia pedagógica personalizada en las aulas.
  • Accesibilidad. Permitirá tener una comunicación más natural con la tecnología a las personas con discapacidad, por ejemplo, mediante la traducción del lenguaje oral al escrito o la manipulación de imágenes y vídeos a través de instrucciones habladas, lo que supondrá un gran avance para este colectivo.

Implicaciones futuras de la IA generativa multimodal

La inteligencia artificial “cambiará la forma en que las personas trabajan, aprenden, viajan, reciben atención sanitaria y se comunican entre sí”, vaticina Bill Gates, fundador de Microsoft. No obstante, sus implicaciones futuras y riesgos asociados son imprevisibles.

Dentro de poco no se podrá distinguir entre aquello creado por la IA y el trabajo humano, lo que implica que no podremos detectar si algo es artificial. Otro reto será la transparencia de esta tecnología, de forma que sea lo más neutral posible.

Por ello, desde la Unión Europea se está trabajando en una propuesta para regular la inteligencia artificial. En este sentido, en diciembre de 2023 se alcanzó un acuerdo provisional sobre la Ley de IA, cuyas normas pretenden garantizar que los sistemas de inteligencia artificial comercializados en el mercado europeo y utilizados en la UE sean seguros, fiables y respeten los derechos fundamentales y los valores de la Unión.