junio 8, 2022 10:00 am

Jesús

La visión por computador capacita a las máquinas para interpretar y comprender el mundo visual que las rodea. Al ser una de las aplicaciones de la inteligencia artificial de más rápido crecimiento, se está desplegando en una amplia gama de sectores y casos de uso para resolver problemas.

En la sanidad, la visión por computador permite realizar diagnósticos más rápidos y precisos. En el transporte, informa de los movimientos de los vehículos autónomos. En la banca y las finanzas, verifica la autenticidad de las tarjetas y los documentos de identidad. Éstas son sólo algunas de las formas en que la visión por computador está cambiando nuestro mundo.

Sin embargo, ninguna de estas impresionantes capacidades es posible sin la anotación de imágenes. La anotación de imágenes es una forma de etiquetado de datos que consiste en etiquetar partes de una imagen para dar al modelo de IA la información que necesita para entenderla. Así es como, por ejemplo, un coche sin conductor puede interpretar y observar las señales de tráfico y los semáforos, así como evitar a los peatones.

Para anotar las imágenes y prepararlas para el entrenamiento de su modelo de IA, se necesita un conjunto de datos visuales suficientemente grande y personas que las anoten. Entre las técnicas de anotación de imágenes más habituales se encuentran el trazado de recuadros alrededor de los objetos y el uso de líneas y polígonos para delimitar los objetos objetivo.

Hay muchos mitos y conceptos erróneos sobre la IA. Estos son algunos de los mitos comunes que disipamos en nuestro trabajo para etiquetar los datos que impulsan los sistemas de IA:

Mito 1: La IA puede marcar imágenes tan bien como los humanos.

Las herramientas de etiquetado automático de imágenes están evolucionando rápidamente. La automatización, con humanos en el entorno, puede ahorrar tiempo y dinero mediante la anotación previa de conjuntos de datos visuales. Sin embargo, estas ventajas tienen un coste importante. Por ejemplo, un proceso de aprendizaje mal supervisado puede perpetuar los errores, lo que lleva a que el modelo sea progresivamente menos preciso con el tiempo, un concepto conocido como deriva de la IA.

Aunque el etiquetado automático es mucho más rápido, carece de precisión. Dado que la visión por computador está pensada, en su mayor parte, para interpretar las cosas como lo hacen los humanos, es lógico que la anotación de imágenes siga exigiendo también la experiencia humana.


Mito 2: No importa si la observación se desvía un píxel.

Es fácil pensar que un solo píxel no es más que un punto en la pantalla, pero cuando se trata de utilizar datos para potenciar la visión por computador, incluso una pequeña inexactitud en la anotación de la imagen puede tener graves consecuencias. Por ejemplo, la calidad de las anotaciones en un TAC médico utilizado para entrenar a las máquinas en el diagnóstico de enfermedades puede suponer la diferencia entre un diagnóstico correcto o erróneo. En un vehículo autónomo, un solo error durante la fase de entrenamiento puede significar la diferencia entre la vida y la muerte.

Aunque no todos los modelos de visión por computador predicen situaciones de vida o muerte, la precisión durante la fase de etiquetado tiene un efecto significativo a largo plazo. Los datos anotados de baja calidad pueden causar problemas dos veces: primero, durante el entrenamiento del modelo y, de nuevo, cuando el modelo utiliza los datos anotados para hacer futuras predicciones. Para construir modelos de visión por computador de alto rendimiento, debe entrenarlos utilizando datos anotados con alta precisión.


Mito 3: Es fácil llevar a cabo la anotación de imágenes en una organización.

Se puede pensar que la anotación de imágenes no es más que una tarea repetitiva y fácil. Al fin y al cabo, no requiere ninguna experiencia en inteligencia artificial. Pero eso no significa que deba hacer el trabajo internamente. La anotación de imágenes requiere formación, acceso a las herramientas adecuadas, conocimiento de las reglas de su negocio y de cómo manejar los casos límite, y control de calidad. Además, es muy caro que sus científicos de datos se encarguen del etiquetado. La ampliación de los equipos internos es difícil debido a la naturaleza a menudo tediosa y repetitiva del trabajo, que puede conducir a la rotación de empleados. Además, tendrá que asumir la carga de incorporar, formar y gestionar a los miembros del equipo de anotación.

La elección de las personas adecuadas para anotar sus datos para la visión por computador es una de las decisiones más importantes que tendrá que tomar. Para anotar grandes volúmenes de datos a escala durante largos períodos de tiempo, es mejor utilizar un equipo gestionado y subcontratado. La comunicación directa con ese equipo es útil para realizar ajustes en el proceso de anotación a lo largo del camino, mientras se prueba y entrena el modelo.


Mito 4: El crowdsourcing puede utilizarse para la anotación de imágenes a escala.

El crowdsourcing, o colaboración colectiva, permite acceder a un gran número de trabajadores al mismo tiempo. Sin embargo, este enfoque tiene inconvenientes que dificultan su uso para la anotación a escala. El crowdsourcing utiliza trabajadores anónimos, y los trabajadores cambian con el tiempo, lo que significa que son menos responsables de la calidad. Además, no se pueden aprovechar las ventajas de que los trabajadores se familiaricen con el dominio, el caso de uso y las reglas de anotación a lo largo del tiempo.

Otra desventaja de los trabajadores de crowdsourcing es que este enfoque suele utilizar el modelo de consenso para medir la calidad de las anotaciones. Esto significa que se asigna a varias personas para que realicen la misma tarea y la respuesta correcta es la que recibe la mayoría de los trabajadores. Así, se paga para que la misma tarea se haga varias veces.

El crowdsourcing puede tener sentido cuando se trata de completar un proyecto único o de probar una prueba de concepto para su modelo. Los equipos gestionados y subcontratados son una mejor opción para los proyectos de anotación a largo plazo que requieren una gran precisión.


La conclusión.

Utilizar imágenes con anotaciones de baja calidad para entrenar un modelo de visión por computador puede ser contraproducente. Las anotaciones de baja calidad afectan al proceso de entrenamiento y validación del modelo, así como a la capacidad de toma de decisiones de éste, ya que aprende de esas anotaciones para tomar decisiones en el futuro. Al trabajar con el socio de mano de obra adecuado, puede garantizar anotaciones de mayor calidad y, en última instancia, un mejor rendimiento de su modelo de visión por computador.

Sobre el Autor

Jesús Martínez es el creador de DataSmarts, un lugar para los apasionados por computer vision y machine learning. Cuando no se encuentra bloggeando, jugando con algún algoritmo o trabajando en un proyecto (muy) cool, disfruta escuchar a The Beatles, leer o viajar por carretera.