Visión artificial: los sentidos llegan a la automatización
La visión artificial, cada vez más integrada en herramientas como los robots de picking, comienza a cobrar una mayor relevancia en empresas de todo el mundo y, según DHL, se espera que el valor de esta tecnología alcance los 41,11 miles de millones de euros en 2030. Se prevé que continúe extendiéndose por compañías logísticas y de otros sectores durante el próximo lustro.
¿Qué es la visión artificial?
La visión artificial es un campo de la inteligencia artificial que permite a los sistemas informáticos extraer información a partir de imágenes digitales, vídeos y otras entradas visuales. Tras procesar los datos recogidos mediante algoritmos, las computadoras pueden tomar medidas o realizar recomendaciones y sugerencias. Si con la IA los ordenadores pueden “pensar”, con la visión artificial pueden “ver” y “entender” su entorno.
Estas herramientas deben entrenarse del mismo modo en que los humanos aprenden a distinguir objetos e interpretar lo que ven. No obstante, el proceso es más rápido para la visión artificial debido a la gran cantidad de referencias que puede asimilar.
¿Cómo funciona un sistema de visión artificial?
Los sistemas de visión artificial funcionan mediante el uso de dos tecnologías principales:
- Deep learning. Este tipo de machine learning emplea algoritmos que otorgan a los ordenadores la habilidad de enseñarse a sí mismos el contexto de los datos visuales. Así, aprenden a distinguir unas imágenes de otras por su cuenta sin necesidad de ser programados para reconocer cada figura.
- Red neuronal convolucional (CNN). Para que los modelos de machine learning lleguen a discernir aquello que ven, estos deben desglosar las imágenes fijándose en sus píxeles, a los cuales asignan etiquetas. Después, utilizan estas marcas para crear convoluciones, es decir, operaciones matemáticas sobre dos funciones para generar una tercera función. A partir de ahí, los robots elaboran predicciones y comprueban su exactitud en una serie de iteraciones, lo que les permite reconocer objetos de forma similar a como lo hacen los humanos.
Gracias a este conocimiento, la visión artificial analiza su entorno en tres pasos:
- Un dispositivo captura una imagen. Puede ser una cámara o una cámara de vídeo.
- La imagen se envía a un sistema de interpretación que aplica un patrón de reconocimiento para comparar la escena con otras que conoce.
- Cuando un usuario solicita información, el programa aporta los resultados de su análisis.
Aplicaciones de la visión artificial en la industria
Empresas de sectores como la logística, la medicina, el transporte y el ocio ya han incorporado la visión artificial a su funcionamiento. Las cámaras de seguridad, controles de tráfico, teléfonos inteligentes y otros dispositivos les proporcionan multitud de datos que usan con distintos fines. Un ejemplo doméstico es Google Translate, que permite captar textos con una cámara y traducirlos a otro idioma instantáneamente.
Además, hay varias aplicaciones de la visión artificial en la industria 4.0:
- Realidad aumentada. La información recogida mediante visión artificial sirve para posicionar objetos virtuales en entornos físicos.
- Vehículos autónomos. Los coches que se conducen por sí mismos utilizan la identificación en tiempo real para detectar lo que está ocurriendo en la carretera y actuar en consecuencia.
- Fabricación. Se pueden monitorizar las máquinas para garantizar su buen funcionamiento, así como evaluar la calidad de los productos y el packaging en las líneas de producción.
- Análisis espacial. Se identifican personas u artículos en el espacio y se registran sus movimientos.
- Sanidad. El análisis de imágenes de dispositivos médicos asiste a los facultativos a la hora de identificar patologías y lograr diagnósticos más rápidos y certeros.
- Agricultura. Vigilar los campos desde satélites, drones o aviones hace posible monitorizar las cosechas, detectar posibles emergencias o déficits de nutrientes. Empresas como Patatas Meléndez seleccionan las patatas que harán llegar a sus clientes mediante esta tecnología.
- Extracción de textos. El procesado automático puede ayudar a descubrir contenido relevante entre grandes cantidades de texto.
¿Quién fue el creador de la visión artificial?
Según Thomas Huang, investigador y profesor emérito de la Universidad de Illinois (EE. UU.) y una de las figuras líderes en visión artificial, la historia de esta tecnología se remonta a los años sesenta, cuando Larry Roberts discutió la posibilidad de extraer información geométrica en 3D desde perspectivas 2D en su tesis del Massachusetts Institute of Technology (MIT). En aquellos años la IA nació como campo académico de estudio y en 1963 los ordenadores comenzaron a transformar imágenes bidimensionales en tridimensionales.
El reconocimiento óptico de caracteres (OCR) llegó en 1974, y el reconocimiento inteligente de caracteres (ICR) logró descifrar textos escritos a mano mediante redes neuronales. En 1982 el neurocientífico David Marr determinó que la visión funciona de modo jerárquico y desarrolló algoritmos para que las máquinas detectaran bordes, esquinas, curvas y otras formas geométricas. Simultáneamente, el científico informático Kunihiko Fukushima creó una red de celdas para el reconocimiento de patrones llamada Neocognitron. Los avances continuaron en el arranque del siglo XXI, y en 2012 el modelo AlexNet logró reducir el índice de errores a un pequeño porcentaje.
La visión artificial en logística
La logística y la gestión de la cadena de suministro son otros de los sectores donde la visión artificial posee un gran potencial y varias aplicaciones, algunas vinculadas a la robótica:
- Envíos. La visión inteligente se emplea para calcular el espacio que ocupan los objetos en transportes y depósitos y contribuye a mejorar los datos que recogen los sistemas de gestión de almacenes (SGA). También se utiliza para comprobar que las etiquetas de los productos son legibles.
- Mantenimiento. Dado que recoge información de varios equipos, la IA puede detectar cuándo se necesitarán reparaciones.
- Operaciones. La inteligencia artificial puede trazar las rutas más eficientes para el picking de los operarios y también es útil para el control de acceso. La visión artificial puede detectar personas que corren por las instalaciones o acceden a zonas restringidas a fin de facilitar una rápida intervención por medio de alertas.
- Seguridad. Supervisar los movimientos de vehículos y personas en almacenes y aparcamientos posibilita tomar acciones inmediatas para minimizar riesgos. Las cámaras también detectan si los EPI se visten adecuadamente y monitorizan a los conductores para que descansen ante las primeras señales de cansancio.
La visión artificial en los robots de picking
Otro aspecto en que la visión inteligente está llamada a revolucionar la logística son los robots de picking o cobots de pick and place. Estos aparatos son idóneos en centros logísticos que gestionan un gran volumen de expediciones diarias, ya que son capaces de preparar pedidos a gran velocidad, alcanzando los 1.000 picks por hora. Funcionan de manera ininterrumpida y su software de visión calcula los puntos de picking más adecuados para cada producto. Los algoritmos de IA les permiten recoger artículos desconocidos sin necesidad de ser sometidos a un entrenamiento previo.
En Mecalux trabajamos para que los almacenes se mantengan a la vanguardia de la tecnología y aprovechen avances como la visión artificial en operativas como el picking. Si quieres llevar tu empresa al siguiente nivel y saber más sobre nuestro robot de picking u otras soluciones, no dudes en ponerte en contacto con nosotros. Te asesoraremos sobre las opciones que mejor se ajustan a tus necesidades y te acompañaremos durante todo el proceso de instalación.