“La VISIÓN sin ACCIÓN es alucinación”

La Visión Artificial ofrece experiencias transformadoras en todos los aspectos de las operaciones empresariales y en la vida cotidiana de las personas. Estas tecnologías ayudan a potencializar un mundo cada vez más inteligente: espacios inteligentes, gemelos digitales, interfaces de usuario multimodales y humanos digitales.

Los avances en la Visión Artificial están aumentando continuamente la automatización de procesos e impulsando la revolución de la productividad. Actualmente, la Visión Artificial representa un rol fundamental en el mundo industrial, manufacturero y retail.

Desde Minsait, creamos experiencias diferenciales y una multitud de soluciones prácticas generadoras de valor, tales como:

  • Vigilancia inteligente de activos en el sector energético que permite identificar y caracterizar diferentes elementos críticos en la operación.
  • Inspección del estado de las electrovías en la cadena de producción en el sector de automoción.
  • Detección de incendios forestales.
  • Supervisión de avifauna en parques eólicos.

En los últimos dos años, hubo un notable progreso de las tecnologías de Visión Artificial que ha revolucionado la aplicabilidad en la interacción e interpretación de los datos visuales. El estado del arte ha tenido un notable progreso durante el año 2023, dando lugar a aplicaciones más sofisticadas. A continuación, se presentan los tres principales avances:

  • Multimodal Large Language Models (MLLMs): estos modelos amplios tienden un puente entre los datos textuales y visuales, proporcionando una mejora significativa en la capacidad de realizar búsquedas visuales.
  • IA Generativa: los modelos generativos de text-to-image (T2I) mejoran significativamente la calidad y el realismo de las imágenes y videos generados a partir de descripciones textuales. Este avance amplía las capacidades de data augmentation para mitigar la carencia de datos, lo cual es especialmente crucial en el diseño y entrenamiento de modelos de aprendizaje profundo.
  • Modelo SAM (Segment Anything Model): este modelo permite la segmentación de prácticamente cualquier cosa en una imagen, lo que incrementa la capacidad para tareas de segmentación complejas.

Estos avances tecnológicos sientan las bases para futuros progresos y aplicaciones de la Visión Artificial.

De cara a 2024, se indican las cinco principales tendencias que permitirán acelerar la adopción de la Visión Artificial en las organizaciones y el desarrollo de aplicaciones más amplias y exitosas:

  1. Visión por ordenador 3D: los avances en los algoritmos de Visión Artificial 3D desempeñarán un papel fundamental en diversas aplicaciones, como en el modelado de gemelos digitales.
  2. Robotic & Large Vision-Language Models (LVLMs): los recientes avances en los modelos fundacionales de VLMs han demostrado su capacidad para comprender datos multimodales y resolver tareas complejas en la manipulación robótica. Al combinar el entendimiento visual con la comprensión del lenguaje, estos modelos están sentando las bases de una nueva era de robótica inteligente y receptiva.
  3. Edge Computing: gracias a los avances tecnológicos de pequeños dispositivos con alta capacidad de procesamiento de datos, se aumentarán las capacidades de análisis en tiempo real, permitiendo el procesamiento local de los modelos de IA y reduciendo las exigencias de conectividad e incluso los costes operativos.
  4. Integración de la realidad aumentada (AR): mejorará las experiencias en los sectores de fabricación, retail y educación.
  5. Datos sintéticos y etiquetado de datos: el papel de la IA generativa en la Visión Artificial seguirá creciendo, principalmente en la creación de datos sintéticos. Esto ayudará a generar soluciones robustas incluso con datos limitados y mejorará la velocidad y la rentabilidad del etiquetado de datos.

La adopción y ampliación de las tecnologías de Visión Artificial por parte de las organizaciones dependerá tanto de las capacidades, la madurez y la habilidad para ofrecer soluciones, como de soluciones más robustas, interpretables y éticamente responsables, garantizando así el cumplimiento de la normativa de Inteligencia Artificial.

La integración de diferentes tecnologías emergentes con Visión Artificial posibilita la escalabilidad de soluciones en la inspección visual, control de calidad y mantenimiento de activos para impulsar su adopción por parte de compañías del sector industrial (principalmente, manufacturero y energético).

En definitiva, las organizaciones se aprovecharán de estas soluciones para reducir el tiempo de generación de valor y lograr un mayor impacto operativo y comercial.

Durante el año 2024, el uso de las soluciones de Visión Artificial tendrá un creciente impacto en diversos sectores, particularmente en el sector de la sanidad, y también desempeñará un papel crucial en la lucha contra la desinformación y la detección de deepfakes.

Un artículo de Vasco Costa Correia (Responsable de Visión Artificial)

Autor

Vasco Costa Correia

Fecha de publicación

02/09/2024

Compartir

Enlace copiado al portapapeles

Publicaciones relacionadas

Participar en el próximo informe

    Si quieres que tu empresa colabore con nosotros en el próximo informe anual rellena el siguiente formulario y nos pondremos en contacto contigo.







    Los datos de carácter personal que usted proporcione serán tratados por Indra Business Consulting S.L., con C.I.F. nº B-82627019. La finalidad del tratamiento es la de gestionar la petición que nos realiza por medio del canal on line.

    Indra Business Consulting S.L. le informa que tiene derecho a ejercer sus derechos de acceso, rectificación, supresión, cancelación, oposición, limitación del tratamiento y portabilidad en los términos especificados en la legislación sobre protección de datos, dirigiéndose a dpo@indra.es, indicando de qué canal o asunto quiere darse de baja. Para más información, pinche aquí.




    Contactar

      Rellena el siguiente formulario con tus detalles para que nos podamos poner en contacto contigo.








      Los datos de carácter personal que usted proporcione serán tratados por Indra Business Consulting S.L., con C.I.F. nº B-82627019. La finalidad del tratamiento es la de gestionar la petición que nos realiza por medio del canal on line.

      Indra Business Consulting S.L. le informa que tiene derecho a ejercer sus derechos de acceso, rectificación, supresión, cancelación, oposición, limitación del tratamiento y portabilidad en los términos especificados en la legislación sobre protección de datos, dirigiéndose a dpo@indra.es, indicando de qué canal o asunto quiere darse de baja. Para más información, pinche aquí.