Gérer les risques
Aujourd'hui et demain

Risques industriels et environnementaux

L'exploitation des images en vidéosurveillance

La vidéosurveillance, enrichie de fonctionnalités d’analyse intelligente, permet aujourd’hui des performances allant bien au-delà de la simple détection d’objets en mouvement. Tracking sur les possibilités actuelles en matière d’analyse d’image.

En surveillance en temps réel, mais aussi en recherche d’événements a posteriori, la prise en compte de critères de plus en plus fins, via le développement d’algorithmes puissants, fournit des moyens étendus d’exploitation de l’image. Avec à la clé, des gains de temps, d’efficacité et de productivité substantiels. En conséquence, les applications de la vidéosurveillance intelligente sont de plus en plus nombreuses : détection d’intrusion, lecture de plaques, analyse de comportements, mais aussi analyse de flux à des fins logistiques, par exemple. Néanmoins, il reste des domaines où les technologies d’analyse d’image révèlent leurs limites. Car si elle tend à remplacer l’œil humain, voire à le surpasser en acuité comme en réactivité, la vidéosurveillance intelligente n’est pas toujours en mesure de se substituer à l’intuition et au jugement d’un opérateur. Mais pour combien de temps encore ?

Enrichir une installation de vidéosurveillance

Le développement permanent des technologies ne cesse d’enrichir le potentiel des solutions de vidéosurveillance. Le domaine de l’analyse d’image profite naturellement de ces enrichissements, à commencer par les performances fournies par l’image numérique.

 

Pour Laurent Wagneur, dirigeant de la société Telios, « le numérique permet de contrôler de manière intelligente la qualité d’une image. Par ailleurs, il devient beaucoup plus facile de d’obtenir un flux d’image pertinent, dans la mesure où une caméra numérique est capable de fournir les images d’une zone d’intérêt de manière automatique. Ensuite, les processeurs ont beaucoup évolué, de manière à prendre en charge la majorité des fonctionnalités d’analyse intelligente, et ce très en amont. Si bien que la chaîne de la vidéosurveillance s’est radicalement simplifiée, au profit d’une utilisation plus intelligente, d’une qualité d’image satisfaisante et de possibilités d’exploitation en multiflux. Aujourd’hui, les nouveaux processeurs permettent de bénéficier de tous ces avantages sur un même plan, là où avant, il fallait choisir entre débit d’images, définition et fonctionnalités d’analyse. »

Comme à l’heure actuelle, la grande majorité des installations de vidéosurveillance sont équipées de caméras standard, il reste donc nécessaire de recourir à des solutions intermédiaires, sans avoir à renouveler intégralement un équipement déjà coûteux.

 

> Pour qui souhaite développer les capacités d’analyse d’un parc de caméras, deux types solutions coexistent sur le marché.

 

– Il est ainsi possible de recourir à une solution d’intelligence centralisée ou distribuée. Dans le premier cas, l’offre est concentrée autour de solutions logicielles d’analyse d’image, intégrées à un serveur de vidéosurveillance. C’est une solution souple, permettant à n’importe quel dôme du marché de bénéficier de fonctionnalités d’analyse de l’image.

 

– Dans le second cas, les défenseurs du principe d’intelligence à la source proposent des extensions matérielles intégrées aux caméras, ou via un encodeur, et permettant de concentrer les performances d’analyse vidéo très en amont de la chaîne d’équipements.

« L’efficacité d’un système est conditionnée par les capacités de détection des capteurs eux-mêmes »

La vidéosurveillance intelligente… à quelles conditions ?

Le traitement de l’image en vidéosurveillance résulte d’un principe de base : la détection d’un mouvement, traduit par l’analyse des différences constatées dans une suite d’images.

> La détection de mouvements couvre ainsi un ensemble d’applications assez vaste :

– détection d’intrusion,

– analyse de position et de déplacement à l’image,

– détection de stationnarité, etc.

 

Cependant, avant d’obtenir une analyse d’image performante, il est d’abord nécessaire d’en définir les conditions d’utilisation. Une précaution qui peut paraître évidente, mais, comme le rappelle Laurent Wagneur, « il est important de bien s’assurer des possibilités d’exploitation de la vidéosurveillance intelligente dans un environnement donné et avant tout, de contrôler la qualité de l’image. Si une caméra n’est pas capable d’effectuer des réglages instantanés (luminosité, contraste et autre paramètres, adaptés sur chaque trame), le résultat sera discutable. Même chose au niveau de la compression. Si l’algorithme de compression a abîmé chaque pixel au moment de la compression, comment traiter de manière satisfaisante le mouvement réel d’un objet détecté sur l’image ? »

 

Pour Olivier Viné (Open Wide) : « L’efficacité d’un système est conditionnée par les capacités de détection des capteurs eux-mêmes. En environnement dégradé, une caméra standard va beaucoup moins bien réagir. Les algorithmes développés auront beau être performants, utilisés avec une caméra rendue aveugle, ils ne pourront pas faire grand chose ».

Détecter, pister, analyser

Dans le champ de vision, quelque chose bouge, la caméra l’a détecté… oui, mais en fonction de quoi ? La détection d’un mouvement est conditionnée par la présence de plusieurs critères (cf. encadré « La détection de mouvement est conditionnée par plusieurs critères » ). Le tracking vidéo est une fonctionnalité aujourd’hui communément répandue dans les solutions de vidéosurveillance intelligente. D’abord bidimensionnelle, cette technologie s’est enrichie d’une analyse d’image tridimensionnelle. Philippe Giraud : « Le tracking 3D est le résultat d’une application intégrant un algorithme tridimensionnel. Concrètement, en 2D, un dôme évolue sur un plan horizontal et un plan vertical. En 3D, un dôme peut être manipulé sur un champ en profondeur, en perspective. En conséquence, en 2D, un dôme reste sur une profondeur de champ fixe alors qu’en 3D, il est capable de zoomer sur les éléments en mouvement de manière beaucoup plus précise et d’arriver à une prise d’information beaucoup plus pertinente, l’objet filmé augmentant en proportion sur l’image. »

La détection d’un individu ou d’un objet en mouvement conduit ensuite à l’analyse des informations enregistrées par la caméra. En effet, un système doté de fonctionnalités de détection et de pistage en temps réel doit également se révéler capable de qualifier un événement pour fournir une information la plus pertinente possible.

Laurent Assouly (Evitech) précise qu’« après avoir détecté un objet, il s’agit ensuite de le qualifier, de l’identifier plus précisément pour exploiter l’information de manière adéquate. Les fonctionnalités sont variées : déclenchement d’alarmes anti-intrusion, mais aussi comptage, mesure automatique de trafic, détection d’immobilité, de contre-sens ou d’unicité de passage dans un sas, d’objets déposés ou enlevés… toutes ces fonctions existent et fournissent des réponses relativement fiables, même si pour certaines, il reste encore des améliorations substantielles à fournir. »

La détection de mouvement est conditionnée par plusieurs critères

1. La modification proportionnelle au sein de l’image.

2. La modification colorimétrique par rapport à l’image de référence.

3. L’analyse de la rapidité de déplacement de l’ensemble volume/couleur.

En d’autres termes, dès que la caméra a détecté un objet d’une certaine proportion et constaté une variation colorimétrique dans l’image, elle analyse que cet ensemble se déplace à une certaine vitesse. Ces trois conditions doivent être simultanément réunies pour confirmer une détection. Après l’avoir détecté et identifié, la caméra peut donc suivre l’objet dans son déplacement et, le cas échéant, déclencher une alarme si l’objet en question est entré dans une zone d’intérêt.

« Au-delà de la détection de mouvement, de plus en plus d’utilisateurs souhaitent accéder à une information pertinente et spécifique »

 

 

Fiabiliser la détection en environnement complexe ou dégradé

En parallèle, un système capable de détecter des mouvements génère aussi des contraintes liées à la présence d’éléments perturbateurs dans le champ de vision d’une caméra. Ces facteurs peuvent être :

de type environnemental (vibrations de la caméra, mouvements de la végétation, luminosité insuffisante, contre-jour, passage de phares de voiture, etc.) ouintrinsèquement liés à l’image (création de bruit en situation de faible luminosité, mais aussi compression excessive de l’image entraînant du « mouvement » d’une image à l’autre).

Comme le rappelle Olivier Viné, « la capacité à détecter en environnement dégradé pose encore des limites à l’utilisation des technologies de vidéosurveillance intelligente dans les applications de sécurité. C’est un domaine où il est encore difficile d’admettre au moins 5 fausses alarmes par jour. »

En effet, la vidéosurveillance est soumise aux mêmes problématiques d’alarmes intempestives que les détecteurs d’intrusion classiques. En conséquence, la maîtrise des interactions avec l’environnement est essentielle, tout particulièrement en extérieur non abrité, insuffisamment éclairé. Pour réduire les risques de déclenchements intempestifs, de nombreuses solutions ont été développées.

>  Le placement et le calibrage corrects des caméras sont des prérequis indispensables, mais pas suffisants. « Il s’agit également de maîtriser le bruit généré dès lors que la lumière baisse, précise Laurent Assouly. Des algorithmes ont été conçus pour filtrer automatiquement le bruit, si bien qu’en situation de très faible luminosité, une caméra est capable de distinguer le bruit généré de véritables objets en mouvement ».

> Deuxièmement, il est nécessaire de maîtriser les perturbations liées à l’environnement. En fonction de ces contraintes, des algorithmes filtrent automatiquement l’image pour fournir une information fiable.

> Ensuite, afin de réduire les risques de fausses alertes, il est utile d’élaborer des scénarios spécifiques en définissant des zones de détection successives : si un intrus pénètre dans ces différentes zones, l’alerte sera donnée avec pertinence. Si un mouvement est limité à une seule de ces zones, le périmètre du site par exemple, il ne sera pas analysé comme une intrusion et l’alerte ne sera pas jugée pertinente. À l’appui de ces dispositifs, nous sommes capables de fournir une réponse plus performante et de ne garantir que 1 ou 2 fausses alarmes par jour et par caméra. 

 

Néanmoins, à l’heure actuelle, et dans la majorité des cas, la sécurité d’un site ne peut pas reposer exclusivement sur la vidéosurveillance, aussi performante soit-elle. « Aujourd’hui, résume Arnaud Lannes, il n’est pas recommandé d’envisager une détection périmétrique à l’aide d’une caméra au-delà de 20 m. Passée cette distance, les contraintes liées à l’environnement et à ses fluctuations se révèlent beaucoup plus difficiles à maîtriser. » Philippe Giraud enchaîne : « Aussi poussées soient les capacités d’analyse intelligente, il existe des interactions avec l’environnement qu’il est indispensable de maîtriser en recoupant les informations fournies par la caméra, mais aussi par une barrière infrarouge, une détection périmétrique, etc. Il est essentiel d’élaborer des scénarios, au cas où les capacités d’une caméra seraient perturbées par tout élément susceptible d’altérer la détection d’une intrusion caractérisée.  Une fois ces données contextuelles maîtrisées, on peut compter sur les performances d’un tracking efficace et optimisé. »

Les atouts de la recherche contextuelle

Appliquées à la surveillance live, les fonctionnalités d’analyse d’image offrent des performances remarquables en temps réel. Elles sont également sollicitées dans la recherche d’événements a posteriori. À ce titre, le domaine de la recherche contextuelle bénéficie de nombreux outils logiciels, destinés à faciliter considérablement le travail de l’opérateur. Olivier Viné le confirme, « la recherche contextuelle est une dimension très importante de l’analyse intelligente de l’image. Dans le cadre d’une recherche d’événements a posteriori, on ne sait pas toujours avec exactitude quel élément on recherche. En effet, si vous surveillez un parking, vous ne savez pas a priori quelle voiture va être fracturée. Le jour où un tel événement arrive, l’enjeu est bien sûr de retrouver l’enregistrement de cet événement le plus rapidement possible en fonction de différents critères établis comme des filtres de recherche : horodatage, régions d’intérêt, taille de l’objet, mais aussi sa forme (dans un rapport hauteur/largeur), trajectoire (entrante, sortante), direction. Ces filtres sont liés au traitement du mouvement seul. Il est par ailleurs possible d’associer à une recherche un deuxième niveau de traitement au sein du mouvement détecté : la présence de plaque d’immatriculation et la présence d’un visage reconnaissable. »

Détection et plus : vers d’autres applications

Outre la détection d’intrusion, l’analyse vidéo intelligente trouve de multiples applications, et ce dans des domaines croissants.

De manière générale, on constate, l’émergence de demandes plus spécifiques : au-delà de la détection de mouvement, de plus en plus d’utilisateurs souhaitent accéder à une information pertinente et spécifique. Par exemple, dans un contexte industriel, il s’agit non seulement de compter les chariots qui passent, mais également de différencier les chariots à vide, ou contenant un nombre précis de palettes. C’est un exemple parmi d’autres, car il existe de nombreux autres modes d’exploitations, liés à la détection d’informations de plus en plus fines.

La société Evitech, spécialisée dans la protection de sites sensibles, étend son champ d’activités à la détection de fuites dans l’industrie pétrolière, par exemple, et à la détection de départ de feux, également appliquée à la pétrochimie ou à la surveillance de forêts.

Dans le domaine logistique, les fonctionnalités de recherche d’objets trouvent également des débouchés intéressants. « Il existe une vaste problématique dite de démarque inconnue ou trou d’inventaire, explique Philippe Giraud. Dans un entrepôt, les camions viennent se présenter à quai pour charger les stocks. À ce niveau, il est très facile de faire des erreurs de chargement… Grâce à un algorithme de recherche d’objets avec analyse comparative temporelle (ACT), il est possible de constater la modification d’état d’une palette dans une zone de stockage donnée, alors que, par exemple, cette palette n’aurait pas dû être déchargée. En effet, un objet surveillé par une caméra peut être masqué pour des raisons diverses, sans pour autant avoir disparu. L’algorithme que nous avons développé permet de relativiser ces masquages (par exemple, le passage d’un véhicule devant l’objet pendant quelques secondes) et permet en quelque sorte à la caméra de temporiser le masquage momentané d’un objet ou bien de conclure à sa disparition réelle. »

Bosch et le secteur automobile

De son côté, Bosch Security Systems profite d’un contexte très favorable au développement des fonctionnalités d’analyse d’image : « nous travaillons en étroite collaboration avec la branche automobile. Ainsi, nous disposons d’équipes mutualisées dont le travail profite à la fois au domaine de la vidéosurveillance, mais aussi au domaine de la vidéo embarquée dans les voitures. Une même technologie débouche donc sur des applications très diverses, sachant que dans le secteur automobile, les recherches s’orientent vers la capacité des véhicules à prendre des décisions de sécurité via la vidéo embarquée. En effet, une caméra peut avoir une capacité de réaction bien plus élevée que le système œil-cerveau humain. On imagine les possibilités d’applications sur la route, où les dangers nécessitent des réflexes appropriés… » (Arnaud Lannes). 

« L’enjeu de la recherche contextuelle : retrouver un événement le plus rapidement possible en fonction de différents critères établis comme des filtres de recherche »

 

De l’expérimental au fonctionnel

Si un nombre grandissant d’applications tire profit de la vidéosurveillance intelligente, tout n’est pas encore possible, ou en tout cas, envisageable sur le marché actuel.

« Il est vrai que certaines fonctionnalités restent expérimentales à l’heure actuelle, reconnaît Philippe Giraud. Sur le plan fonctionnel, encore trop de critères ne sont pas parfaitement maîtrisés. Même si on se rapproche maintenant d’éléments de référence qui permettent de fiabiliser la détection. »

À titre d’exemple, la reconnaissance faciale reste une technologie qui augure davantage du futur qu’elle témoigne des performances actuelles. Affaire de conditions d’exploitation, comme le rappelle Laurent Assouly : « Les caméras déployées aujourd’hui en vidéosurveillance urbaine sont de résolution moyenne et ne permettent pas de fournir un résultat d’analyse fiable. En reconnaissance faciale, les solutions existantes exigent au moins entre 60 et 90 pixels entre les deux yeux et surtout, dans des conditions d’éclairage très au-delà des conditions exigées en vidéosurveillance… Sur le terrain, il faudrait qu’un individu soit à moins d’1,5 m de la caméra. Comment une caméra surplombant un carrefour peut-elle convenablement réunir ces conditions ? ».

Olivier Viné : « Pour ce type d’applications, il faut par ailleurs opérer une distinction entre environnement coopératif et non-coopératif. Un environnement coopératif conduit l’individu à se présenter obligatoirement dans le champ de vision d’une caméra, voire face à elle. Un sas d’entrée d’une banque, par exemple. Un environnement non-coopératif définit tout environnement où des individus circulent, sans contrainte particulière liée à la capture d’images. Un couloir de métro, par exemple. Dans ce contexte, l’exercice est bien plus difficile, étant donné qu’il nécessite d’effectuer un traitement en temps réel, image par image, pour sélectionner un visage à peu près reconnaissable. Bien sûr, viendra un jour où les algorithmes de détection en environnement non-coopératif deviendront suffisamment performants pour se connecter avec des algorithmes de reconnaissance. Mais pour l’heure, on n’y est pas encore. »

Affaire également de limites technologiques, confirme Arnaud Lannes : « les algorithmes de reconnaissance faciale restent très complexes à développer. Ensuite, cette technologie demande un serveur aux capacités surdimensionnées pour pouvoir exploiter une base de données de x milliers de visages. Nous sommes actuellement limités par l’incapacité à rechercher immédiatement le visage détecté. »

Néanmoins, les résultats progressent et permettent, si ce n’est de le reconnaître, en tout cas de détecter un visage comme tel. En témoignent la dernière version de l’IVA développée par Bosch, capable de faire de la détection de tête et donc, de différencier un être humain d’un animal. Ou encore, la solution Open Wide conçue par Sisell, facilitant, via une fonctionnalité d’extraction automatique de visages, l’identification sur des points de passage d’individus. Olivier Viné : « Il est possible de procéder à une recherche sur le critère de la présence d’un visage. Cette technologie est vouée à fournir une aide à un opérateur humain, susceptible de reconnaître un visage parmi toutes les occurrences qui ont été identifiées suite à une recherche. Notre solution est donc capable d’extraire des enregistrements un panel de portraits qui est ensuite soumis à l’examen de l’opérateur. »

Quelques solutions disponibles sur le marché

 

> Les solutions Sisell, Open Wide

Les solutions logicielles d’Open Wide offrent une palette étendue de fonctionnalités, notamment pour la surveillance des transports publics ferroviaires : détection, pistage multi-cibles en temps réel, analyse d’activités, détection de stationnarité, recherche multi-critères. Sisell s’enrichit également d’un système d’inspection vidéo, permettant de garantir la qualité des images enregistrées. En effet, une caméra peut, pour des raisons diverses, fournir une image floue, décadrée ou bruitée. Très souvent, ce dysfonctionnement n’est constaté qu’après enregistrement et n’autorise pas une exploitation correcte des images. Une solution de supervision automatisée de réseau de caméra permet de tester chaque jour les caméras d’une installation avec remontées des informations sur l’état de chaque équipement. 

 

> Le système breveté Avideon Tracker, Avideon

Capable d’assurer la poursuite automatique d’objets ou de personnes en 3D, le système Avideon Tracker conjugue de nombreuses fonctionnalités au service de la surveillance de sites. Assurant une véritable autonomie de fonctionnement, de détection et d’analyse et de poursuite automatique à une installation de vidéosurveillance, la solution logicielle conçue par Avideon permet également une exploitation assistée en recherche d’événements a posteriori. Solution complète et autonome, 100% française, Avideon Tracker permet de multiples applications de sécurité, mais aussi dédiées à l’industrie pour la surveillance de process logistiques.

 

> L’IVA (Intelligent Video Analysis), Bosch Security Systems

Solution complète de vidéosurveillance intelligente, l’IVA (Intelligent Video Analysis), dans sa version 4.0, l’IVA propose deux principaux modes de fonctionnement : une fonction d’analyse de flux permettant de repérer un individu avançant à contresens d’une foule et fournissant des applications très intéressantes pour les aéroports, les transports en commun, les escalators. L’IVA dispose également de nombreuses fonctionnalités de détection multizones, de franchissement de ligne, d’événements entrants et sortants, de détection d’immobilisation ou de disparition d’un objet. Toutes ces fonctionnalités sont disponibles à la fois au niveau de la caméra et en recherche contextuelle. De telle manière qu’une caméra bénéficiant de l’IVA peut, outre la transmission d’alarmes, envoyer des métadonnées exploitées à posteriori via un moteur de recherche contextuelle multi-critères. Enfin, l’IVA 4.0 propose une aide au paramétrage réduisant les opérations de calibrage d’une caméra à quelques minutes.

Commentez

Participez à la discussion


La période de vérification reCAPTCHA a expiré. Veuillez recharger la page.