Atrapando ladrones mediante inteligencia artificial


Tener cámaras de seguridad apenas funciona como disuasión, y en algunos casos el material registrado no es tomado en cuenta luego de ocurrido el ilícito.

Lo ideal sería detectar el robo en el momento (o el merodeo previo) y notificar a las autoridades, al propietario, enviar un móvil de respuesta, etc., pero una vigilancia constante es costosa al necesitar personal dedicado. La video verificación es otra opción, pero como se inicia luego de que los sensores se activan no es útil para casos donde los mismos son engañados.

Utilizando inteligencia artificial podemos vigilar cada cámara, y si una actividad sospechosa es detectada se le muestra al operador para que decida cómo continuar.
De esta manera el guardia solamente atiende a las pocas cámaras que este asistente le prioriza, pudiendo así llegar con un servicio continuo a un costo reducido.


Tensorflow (TF) y OpenCV

Analicemos con estas tecnologías la escena de un robo ocurrido a principios de 2019 donde si bien contaban con cámaras de vigilancia, solamente fueron útiles para documentar el hurto.

Ambas herramientas detectan correctamente la actividad. Un análisis en tiempo real de las imágenes recibidas por email podría haber alertado al propietario en la primer intrusión (rotura del portón), que como tampoco tenía alarma nunca fue notificado.

En el sigiente caso las propiedades contaban con alarma, pero las mismas (por fallas propias o virtud de los ladrones) no se activaron y los delincuentes se llevaron hasta las plantas.


Usando Tensorflow y además OpenCV hacemos que sus detecciones se complementen entre sí, en el siguiente caso ocurrido en una pizzeria se aprecia que el grado de confianza de la detección hecha por TF es del 53%, lo cual es bajo, sin embargo OpenCV confirma esa detección agregando seguridad a la decisión que vaya a tomar el sistema.


En la imagen anterior del robo a una disquería pasa lo contrario, Tensorflow logra una detección aceptable mientras que OpenCV no (tal vez debido a lo congestionado de la imagen).
Es por estas variaciones que al momento de tomar decisiones se agregan otros aspectos históricos de la escena, pero eso será motivo de otro artículo (queda por discutir lo relacionado a detección de armas, vehículos y situaciones de robo).


Microsoft Azure Computer Vision

Si la cantidad de imágenes a analizar fuera menor o nuestros bolsillos más abultados, podríamos usar MS Cognitive Services. Es una buena opción para comenzar un proyecto y luego desarrollar modelos propios. Para nosotros (vigicai) puede ser un tercer actor que en el futuro vote sobre el contenido de una escena ante una duda calculada.


Mejorar los modelos predictivos y agregar nuevas etiquetas es algo que los servicios como el de Microsoft realizan. En nuestro sistema aprovechamos la atención del guardia que opera la consola para consultarle lo que está viendo, y con esa información (además de ver su grado de atención) podemos implementar mejoras periódicas a nuestros modelos.


¿Cuántos fueron atrapados entonces?

Lamentablemente en los casos analizados no se reportó que los ladrones fueran capturados luego de los hechos, pero queremos que eso cambie.
Creamos vigicai con el objetivo llegar a todos con una propuesta en seguridad diferente, y para que cualquier empresa de seguridad pueda brindar un servicio de vanguardia a sus clientes.