Audio analytics: migliorare le videocamere IP con orecchie intelligenti

I vantaggi nell’associare alle telecamere di rete strumenti di analisi audio per riconoscere risse, furti o infrazioni anche quando l’obiettivo guarda da un’altra parte.

 

Quando percepiamo una minaccia, il nostro cervello fa affidamento a tutte le sue facoltà per comprendere il pericolo. Quel rumore è stato causato dallo scoppio di un motore o da un colpo di pistola? E’ il suono di una finestra che si rompe o qualcuno ha semplicemente fatto cadere un bicchiere? Quella voce stava gridando con rabbia, o strillando di gioia?

L’aggiunta di un contesto visivo potrebbe rendere più facile capire la differenza. A volte, però, abbiamo solo un istante a disposizione per valutare le nostre ipotesi.

Nel mondo della sicurezza fisica, le videocamere di sorveglianza ampliano la percezione attraverso strumenti di analisi che imitano il processo umano di valutazione dei dati sensoriali e che possono concludere se una minaccia sia imminente o meno.

La maggior parte di noi è familiare con le analitiche video. Applicazioni che operano nel reame del visivo – catturando, analizzando e trasmettendo consapevolezza delle cose viste in una precisa situazione. Esse permettono alle videocamere di misurare la dimensione della folla, di segnalarci se qualcuno sta gironzolando da solo o di rilevare intrusioni in aree riservate.

Dall’altro lato, le analitiche audio operano nel reame del suono – riconoscendo e identificando suoni anche quando la videocamera sta riprendendo nella direzione opposta. Queste applicazioni posso allertare il personale di sicurezza a seguito dell’ascolto di suoni specifici come aggressioni verbali, la rottura di una finestra o anche di una pistola che fa fuoco.

 

Comprendere le basi delle analitiche audio

I software di riconoscimento audio rilevano una combinazione complessa di caratteristiche, dai decibel all’energia rilasciata nel tempo su differenti frequenze. Programmate per ignorare suoni di sottofondo come il traffico, la conversazione, la musica e così via, queste applicazioni innescano un allarme quando percepiscono un modello acustico molto specifico.

Questa modalità di percezione permette di ridurre al minimo il rischio di falsi positivi (o falsi negativi) anche in ambienti particolarmente impegnativi e rumorosi come le piattaforme ferroviarie o i raggi di un penitenziario.

A differenza delle modalità di raccolta audio delle videocamere, le analitiche audio non registrano i suoni continuativamente. Il programma opera in buffer mode, registrando solo pochi secondi prima e dopo il riconoscimento di un preciso pattern sonoro. In questo modo risparmia spazio di archiviazione permettendo comunque alla sicurezza di verificare solo quella parte di registrazione e di preservarla come prova forense.

Installare analitiche audio in device all’avanguardia come le telecamere di rete, le door station di rete, gli speaker e i bridge audio di rete porta molteplici vantaggi:

  • L’analisi dell’audio avviene all’interno dello strumento, eliminando la necessità di un server centrale;
  • I video feed vengono attivati solo quando sollecitato da un evento audio, riducendo il consumo di banda e le dimensioni di archiviazione;
  • Questa soluzione migliora la sorveglianza in tempo reale perché l’allarme indirizza immediatamente l’attenzione del personale di sicurezza verso il potenziale incidente.

Rafforzare i sistemi di sorveglianza video con le analitiche audio non offre unicamente un livello aggiuntivo di protezione agli edifici. L’immediatezza delle sue segnalazioni spinge la sicurezza ad essere maggiormente proattiva nell’identificazione e nella risposta alle minacce.

 

Tutta un’altra musica: ciò che ascolti ti dice cosa fare

Tenendo in considerazione le tecniche di machine-learning in fase di sviluppo, il numero potenziali di suoni catalogati in un database di analisi può essere quasi infinito, limitato unicamente dalla capacità di processamento della videocamera. In un contesto di sicurezza, tra le più comuni firme sonore captate da queste analitiche vi sono i suoni da aggressione, gli allarmi delle auto, gli spari e le rotture dei vetri.

  • La rilevazione di un’aggressione identifica l’ostilità verbale prima che diventi un assalto vero e proprio. Il software di analisi rileva i pattern sonori associati con la coercizione, la rabbia o la paura. E’ interessante a proposito notare che l’Associazione Psicologica Americana ha stabilito che il 90 percento di tutte le aggressioni viene preceduta da dimostrazioni di rabbia. Quando il sistema riconosce una di queste uniche firme sonore, il sistema fa immediatamente partire un allarme e/o invia un video in tempo reale alla control room o su un device mobile. Grazie a questo sistema di preallarme, il personale può intervenire rapidamente e gestire l’incidente prima che le ostilità diventino fisiche. Installando l’applicazione sulle videocamere, la sicurezza può osservare lo svolgimento degli eventi e fornire maggiori dettagli e informazioni sul contesto a coloro che stanno recandosi sulla scena;
  • La rilevazione di un allarme automobilistico riconosce gli specifici motivi sonori prodotti dai più comuni sistemi di allarme per vetture in commercio. Le analitiche posso percepire il suono in un significativo raggio intorno alla videocamera, rendendo questa applicazione particolarmente utile in parcheggi, garage e simili. Inviando una segnalazione già provvista di informazioni sulla posizione, questi strumenti aiutano lo staff di sicurezza a reagire più rapidamente agli incidenti prevenendo furti e vandalismi;
  • La rilevazione degli spari riconosce il suono del fuoco di diversi tipi di arma: pistole, fucili, armi automatiche. Una volta che il software riconosce un’arma sparare, attiva un’immediata segnalazione al personale di sicurezza che può riprodurre il suono per verificarne l’esattezza e utilizzare le videocamere per comprendere meglio la minaccia, in modo da poter rispondere più rapidamente e con maggior sicurezza a quanto sta avvenendo.
  • La rilevazione della rottura di vetri riconosce il suono di molte diverse tipologie di vetro: laminato, singolo o doppio, temperato o smerigliato. Una volta riconosciuto il suono, un allarme viene inviato alla sicurezza per investigare la rottura. Questo tipo di analitiche, installato su una telecamera, permette di evitare la spesa di installazione di sensori di movimento su ogni finestra.

Dotare le soluzioni di video sorveglianza con queste e altre analitiche audio adatte ai vari scenari può portare la consapevolezza della situazione su un livello completamente nuovo. Equipaggiando i sistemi con l’analisi intelligente di ciò che viene ascoltato e visto aiuta il personale di sicurezza a riconoscere più rapidamente la natura della minaccia e ad agire in modo appropriato.

Bisogna inoltre sottolineare che le analitiche audio possono riconoscere e identificare solo alcuni pattern sonori specifici e non, ad esempio, il discorso parlato. Questa è una distinzione importante perché nella maggior parte dei paesi esistono regolamentazioni molto ferree per quanto riguarda i dispositivi di registrazione audio ed il rispetto della privacy.

 

Dalla lavagna al mondo reale: due storie

Un conto è parlare di tecnologia in astratto, ma è il suo funzionamento nel mondo reale a dimostrare il suo vero potenziale. Osserviamo (o forse sarebbe meglio dire ascoltiamo) quindi come due differenti entità stanno integrando le analitiche audio nelle proprie soluzioni di video sorveglianza.

 

Billerica Police Department: come creare celle più sicure

Nella città di Billerica, nel Massachussetts, le analitiche audio giocano un ruolo fondamentale nel mantenere la sicurezza all’interno della prigione. Il dipartimento di polizia ha installato videocamere Axis sul soffitto di ciascun ramo del penitenziario, dotandole di un sistema intelligente di analisi del suono delle aggressioni, al fine di poter ascoltare pattern sonori ostili, come ad esempio una persona che urla. Quando il sistema rileva questa firma sonora, invia un segnale di allerta alla AXIS Camera Station nel vicino centro di polizia e allo smartphone dell’agente in servizio in quel momento. La notifica mostra il numero della cella dove il disturbo è stato rilevato insieme agli stream video della telecamere, in modo da verificare la causa dell’agitazione.

Interrogato a proposito del valore della tecnologia nel suo lavoro, il Tenente Greg Katz, responsabile tecnologico del Dipartimento di Polizia di Billerica, ha sottolineato che “la cosa buona riguardo le analitiche audio è che permettono agli agenti di essere proattivi. Prima capiscono che qualcosa sta succedendo, prima possono intervenire impedendo che succeda qualcosa di grave”.

Il tenente Katz ha sottolineato anche che, trattandosi di una tecnologia basata sull’IP, le analitiche audio possono integrarsi facilmente con altri strumenti tecnologici di rete. Il prossimo passo del Dipartimento di Billerica sarà di installare uno speaker di rete nella sede della polizia interna al penitenziario per segnalare l’esistenza di un alterco in corso. In queste circostanze, se il sistema di analisi dovesse riconoscere un’aggressione, potrebbe trasmettere un’allerta verbale del tipo “Disordini nella cella due, inviare un agente immediatamente”.

Il Dipartimento di Polizia di Billerica ha installato il Sistema di riconoscimento delle aggressioni sulle Videocamere AXIS Q8414-LVS in ciascuna sezione del penitenziario.

 

Rock Hill Schools: intervenire prima che la lite degeneri

Rock Hill Schools ha deciso di installare il sistema di rilevamento smart delle aggressioni negli edifici della scuola, con l’obiettivo di aiutare i professori e il personale non docente a gestire le risse tra studenti. Le videocamere Axis già installate nella scuola sono state integrate con l’applicazione audio per ascoltare voci aggressive e inviare segnali ai dirigenti.

“La parte problematica nel lavorare con i ragazzi delle scuole superiori è che possono essere lì a scherzare e giocare per molto tempo. Poi uno spinge un altro un po’ troppo forte, e ti ritrovi tra le mani uno scontro fisico vero e proprio”, ha spiegato Kevin Wren, direttore della gestione delle emergenze di sicurezza alle Scuole Rock Hill.

In passato, i dirigenti si affidavano al fatto che qualcuno avrebbe premuto un bottone chiedendo aiuto. Questo poteva ritardare una risposta per più di due minuti. “Ora le analitiche audio notificano la dirigenza, che può inviare immediatamente un responsabile della sicurezza” ha sottolineato Wren. “Questo ha portato il nostro tempo di reazione nell’ordine dei secondi anziché dei minuti”.

Dal momento che i microfoni sono integrati alle videocamere, quando il dirigente riceve un allarme, le riprese video vengono trasmesse insieme al file audio e permettono di determinare se la notifica è reale o meno.

Questo sistema è ancora nelle fasi iniziali di sviluppo, ma Wren è ottimista. “Abbiamo 2.300 ragazzi solo in questa scuola. Se riuscissimo a ridurre il numero di risse del 10 percento o più, sarebbe una grande vittoria per noi”.

 

Perché associare orecchie e occhi intelligenti?

Quando furono lanciate sul mercato, le telecamere di sorveglianza erano semplicemente degli ottusi strumenti di registrazione. Via via che la capacità di elaborazione delle informazioni è aumentata nel corso degli anni, sono diventate molto più smart. Oggi, le analitiche video conferiscono alle videocamere occhi intelligenti per aiutare il personale di sicurezza nell’interpretazione di ciò che la videocamera sta guardando. Se si aggiungono alle videocamere anche le analitiche audio, il sistema potrà sfruttare queste orecchie intelligenti per ascoltare e distinguere l’importanza di ciò che potrebbe sfuggire al semplice sguardo.

Per scoprire di più circa l’integrazione delle analitiche audio nelle soluzioni di video sorveglianza, puoi leggere  “Listen Up,” James Marcella, Security Industry Association Magazine, April 2018. (in inglese).