2017-10-20
Cuando la policía en Londres recientemente probó un nuevo sistema de reconocimiento facial, cometieron un error preocupante y vergonzoso. En el Carnaval de Notting Hill, la tecnología hizo aproximadamente 35 coincidencias falsas entre sospechosos conocidos y miembros de la multitud, con una persona arrestada "erróneamente".
Se suponía que los sistemas de vigilancia visual basados en cámaras ofrecían una sociedad más segura y segura. Pero a pesar de décadas de desarrollo, en general no son capaces de manejar situaciones de la vida real. Durante los disturbios de Londres de 2011, por ejemplo, el software de reconocimiento facial contribuyó a un solo arresto de los 4,962 que tuvieron lugar.
El fracaso de esta tecnología significa que la vigilancia visual todavía se basa principalmente en personas sentadas en habitaciones oscuras que miran horas de metraje de la cámara, lo que es totalmente inadecuado para proteger a las personas en una ciudad. Pero investigaciones recientes sugieren que el software de análisis de video podría mejorarse dramáticamente gracias a los avances del software realizados en un campo completamente diferente: el análisis de la secuencia de ADN. Al tratar el video como una escena que evoluciona de la misma manera que lo hace el ADN, estas herramientas y técnicas de software podrían transformar la vigilancia visual automatizada.
Desde que la Policía Metropolitana instaló las primeras cámaras de CCTV en Londres en 1960, hasta ahora se han desplegado hasta 6 millones de ellas en el Reino Unido. Y ahora se emiten cámaras para el cuerpo a los oficiales de primera línea, lo que crea no solo más imágenes de video para analizar, sino también datos más complejos debido al movimiento constante de la cámara.
Sin embargo, la vigilancia visual automatizada sigue estando limitada a tareas en entornos relativamente controlados. La detección de intrusión en una propiedad específica, el conteo de personas que pasan por una puerta determinada o el reconocimiento de la matrícula se puede completar con bastante precisión. Pero analizar secuencias de grupos de personas o identificar personas en una calle pública no es confiable porque las escenas al aire libre varían y cambian mucho.
Para mejorar el análisis de video automatizado, necesitamos un software que pueda manejar esta variabilidad en lugar de tratarlo como un inconveniente, un cambio fundamental. Y un área que se usa para manejar grandes cantidades de datos muy variables es la genómica.
Dado que los tres mil millones de caracteres de ADN del primer genoma humano (el conjunto completo de datos genéticos en un humano) se secuenciaron en 2001, la producción de este tipo de datos genómicos ha aumentado a un ritmo exponencial. La gran cantidad de estos datos y el grado en que puede variar significa que se han necesitado grandes cantidades de dinero y recursos para desarrollar software especializado e instalaciones informáticas para manejarlo.
Hoy es posible que los científicos accedan con relativa facilidad a los servicios de análisis del genoma para estudiar todo tipo de cosas, desde cómo combatir enfermedades y diseñar servicios médicos personalizados, hasta los misterios de la historia humana.
El análisis genómico incluye el estudio de la evolución de los genes a lo largo del tiempo mediante la investigación de las mutaciones que se han producido. Esto es sorprendentemente similar al desafío en la vigilancia visual, que se basa en la interpretación de la evolución de una escena en el tiempo para detectar y rastrear peatones en movimiento. Al tratar las diferencias entre las imágenes que componen un video como mutaciones, podemos aplicar las técnicas desarrolladas para el análisis genómico a video.
Las primeras pruebas de este principio "vide-ómicas" ya han demostrado su potencial. Mi grupo de investigación en la Universidad de Kingston, por primera vez, ha demostrado que los videos pueden ser analizados incluso cuando son capturados por una cámara que se mueve libremente. Al identificar el movimiento de la cámara como mutaciones, se pueden compensar para que una escena parezca filmada por una cámara fija.
Mientras tanto, los investigadores de la Universidad de Verona han demostrado que las tareas de procesamiento de imágenes se pueden codificar de tal manera que las herramientas de genómica estándar puedan ser explotadas. Esto es particularmente importante ya que tal enfoque reduce significativamente el costo y el tiempo de desarrollo de software.
Combinar esto con nuestra estrategia podría finalmente generar la revolución de la vigilancia visual que se prometió hace muchos años. Si se adoptara el principio "vide-ómicas", la próxima década podría ofrecer cámaras mucho más inteligentes. En ese caso, es mejor que nos acostumbremos a ser vistos en video con mucha más frecuencia.