Un algoritmo in quattro step per cinque continenti

Condividi

La tecnologia ANPR di Hikvision può essere impiegata in tutto il mondo grazie a soluzioni flessibili e intelligenti basate sul machine learning (AI) per analizzare e identificare qualsiasi targa con grande precisione, affidabilità e rapidità.

La videosorveglianza appli­cata al controllo dei mezzi di trasporto è sempre più diffusa, sia in ambito gestionale (pa­gamento parcheggi e pedaggi, controllo accessi ecc.) sia nella sicurezza (rilevamento infrazioni, indagini fo­rensi ecc.).

Esistono varie tecnologie utilizzate per leggere e identificare le targhe degli automezzi (ANPR), che si differenziano per procedura utilizzata, algoritmi impiegati e altri fattori. Non tutti i software ANPR, tuttavia, possono operare a li­vello globale, perché gli algoritmi o le immagini campione vengono addestrati per riconoscere solo alcune decine di targhe e non le centinaia o migliaia impiegate nei cinque continenti.

La tecnologia ANPR di Hikvision, invece, uti­lizza sofisticati algoritmi di machine learning per estendere le capacità di riconoscimento del sistema a qualsiasi targa, con un basso margine d’errore.

Quattro step per l’identificazione

Uno dei punti di forza della tecnologia ANPR di Hikvision è l’estrazione di numeri, lettere e simboli dalle targhe con isolamento dal resto dell’inquadratura, spesso costellata di elementi che possono ingannare il software di ricono­scimento. Gli algoritmi utilizzati dall’azienda permettono invece di rilevare la targa con un rischio di errore minimo, isolando ogni elemento e partizionando i caratteri per poi procedere con il riconoscimento.

Bilayer plate processing – La tecnologia Hikvision permette di stabilire quali sono gli elementi identificativi chiave anche nel caso di TARGHE COMPOSTE DA DUE O PIÙ RIGHE, ignorando numeri e lettere ininfluenti ai fini della procedura ANPR (anno di immatricolazione, Paese, regione ecc.).

La tecnologia non si basa sul colore o sulla strut­tura dei caratteri delle targhe dei veicoli – come avviene in altri software ANPR che richiedono un lungo lavoro di addestramento (caricamento immagini di targhe da tutto il mondo, specifiche layout ecc.) – ma è in grado di distinguere le tar­ghe “mono-riga” (come quelle europee) e “dop­pia-riga” (americane, mediorientali ecc.) senza pregiudicare il riconoscimento di ogni singolo elemento grafico e alfanumerico.

La procedura di identificazione si basa su quat­tro step:

  • posizionamento approssimativo,
  • fil­traggio della targa,
  • posizionamento preciso
  • post-processing (riconoscimento caratteri).

Posizionamento approssimativo

La procedura di localizzazione approssimativa opera in base al contrasto tra lo sfondo e i carat­teri della targa, indipendentemente dalla com­binazione di colori (per esempio, sfondo bianco e caratteri neri, sfondo nero e caratteri bianchi, sfondo giallo e caratteri neri ecc.). Il software ANPR scansiona ogni singolo fotogramma del video catturato dalla telecamera di sorveglianza alla ricerca di questi elementi a forte contrasto.

POSIZIONAMENTO APPROSSIMATIVO – Il software ANPR scansiona ogni singolo fotogramma del video catturato dalla telecamera di sorveglianza alla ricerca degli elementi a forte contrasto che sono sintomatici della presenza della targa.

Componenti dei veicoli, arredi urbani, cartelloni­stica e altri elementi presenti nell’inquadratura possono ingannare il software in questa prima fase, ma si tratta di un’occorrenza perfettamen­te normale trattandosi della primissima fase di rilevamento.

Filtraggio della targa

Lo step successivo è l’applicazione di un filtro basato su sofisticati algoritmi capaci di discrimi­nare in modo rapido, preciso ed efficace le targhe da qualsiasi altro elemento. Se gli elementi identificativi presenti negli al­goritmi confermano che si tratta di una targa reale, si passa allo step successivo – altrimenti il “crop” della ripresa video viene scartato.

Filtraggio della targa

L’im­magine catturata dalla telecamera non è quasi mai identica a quella di una targa fotografata di fronte o scannerizzata, perché l’angolo di ripresa può variare di parecchi gradi, l’immagine risulta sfocata per via del movimento ecc.

Posizionamento preciso

Il terzo step consiste nel rilevamento dei contor­ni della targa, indipendentemente dalla presen­za di lettere e numeri di identificazione su una o due righe. Per quest’operazione si utilizza lo stesso metodo (effetto contrasto) di cui sopra: il software esamina lo sfondo, i caratteri e gli altri elementi stabilendo con precisione i bordi reali della targa e definendo l’area da sottoporre ad analisi e riconoscimento.

Posizionamento preciso

L’algoritmo di rilevamento dei caratteri permette anche di stabilire quali sono gli elementi iden­tificativi chiave delle targhe composte da due o più righe e ignorare numeri e lettere ininfluenti ai fini della procedura ANPR (anno di immatri­colazione, Paese, regione ecc.).

Post-processing e riconoscimento dei caratteri

Completata la fase di delimitazione dei bordi della targa (superiore e inferiore), si passa agli step di post-processing, come il posizionamento dei moduli carattere nell’area d’interesse e il loro riconoscimento.

Esistono vari metodi per delimitare il rettangolo circoscritto dal carattere alfanumerico, ciascuno con i propri vantaggi e svantaggi:

  • POST-PROCESSING E RICONOSCIMENTO CARATTERI

    Proiezione verticale: è un metodo che identi­fica le depressioni delle onde negli spazi tra i caratteri (per individuarli e separarli) osser­vando le proiezioni. Non è in grado di stabi­lire dove si trova il bordo sinistro del primo carattere e, pertanto, non va utilizzato come metodo unico ma in combinazione con altri.

  • CCL (etichettatura dei componenti collegati): ogni carattere è una regione connessa oppure ha una parte connessa. È possibile estrapolare la regione connessa dall’immagine per ottene­re la forma del carattere, ma il rumore presen­te nell’immagine ripresa potrebbe degradare le regioni di caratteri diversi e interferire con l’identificazione della partizione dei caratteri.
  • Corrispondenza modello: si tratta di un meto­do utile per individuare esattamente la posi­zione del carattere e la sua struttura, ma solo dopo aver utilizzato altre applicazioni (come la proiezione verticale). Purtroppo, nel mondo esistono centinaia di targhe con forme e layout differenti, per cui è un metodo poco affidabile.

Riconoscimento caratteri con machine learning 

L’algoritmo OCR progettato da Hikvision si basa su una rete neurale di apprendimento automatico: è più preciso e affidabile rispetto ai sistemi di riconoscimento tradizionali, perché utilizza un modulo di identificazione dell’autenticità dei caratteri e supporta numeri e lettere di vari alfabeti (inglese, arabo, cinese, coreano, tailandese, giapponese ecc.).

Una tecnica per cinque continenti

Per risolvere il problema dell’universalità dell’al­goritmo di partizione dei caratteri, Hikvision ha sviluppato:

  • una tecnica avanzata (partizione approssi­mativa) che combina la proiezione verticale e la CCL per dividere approssimativamente i caratteri;
  • un metodo (partizione ad alta precisione) per separare con precisione i caratteri;
  • una strategia per identificare i bordi dei carat­teri nelle targhe multi-linea e multi-sezione.

Grazie a questo il software dell’azienda può es­sere applicato su qualsiasi targa nei cinque con­tinenti e non solo in mercati specifici.

Partizione approssimativa

Durante la procedura di partizione approssima­tiva, Hikvision utilizza innanzitutto la CCL per stimare la larghezza dei caratteri e degli spazi, poi adotta la proiezione verticale per individuare i caratteri e i loro bordi (sinistro e destro).

Partizione ad alta precisione

Poiché la partizione approssimativa può generare errori (come l’unione di due caratteri in uno solo oppure la divisione di un carattere in due), l’a­zienda ha sviluppato un algoritmo di partizione ad alta precisione, articolato nel seguente modo:

  • basandosi su diverse immagini pre-elaborate (a scala di grigio, disegni di contorno ecc.), l’algoritmo confronta i risultati e seleziona quello più attendibile;
  • un secondo algoritmo viene utilizzato per identificare i caratteri con larghezza differen­te; i caratteri risultato della partizione vengo­no evidenziati all’interno di un rettangolo blu;
  • per ovviare al problema per cui i caratteri si­mili vengono spesso considerati un solo carat­tere dopo la partizione approssimativa, la tec­nologia BAT (Block Analysis Technology, ossia analisi dei blocchi) partiziona ogni carattere migliorando l’affidabilità del riconoscimento.

Lettura targhe multi-linea e multi-sezione

Hikvision ha poi sviluppato una tecnica di ana­lisi delle targhe multi-campo e multi-riga non basata su schemi predefiniti, ma su algoritmi “di­namici” capaci di individuare il campo con meno caratteri (di norma ininfluenti) rispetto a quello con più caratteri (dati identificativi veri e propri) indipendentemente dal loro posizionamento.

 

Richiedi maggiori informazioni

Edicola web

[paperlit id="prj_5c66717ea7555" show_issue="yes" all_title="Edicola Web"]

Ti potrebbero interessare

serbatoi dell'ACS

Ma è vero che… è consigliabile dotare i serbatoi dell’ACS di resistenze elettriche?

In un’epoca di transizione energetica, la gestione del comfort domestico sta cambiando radicalmente. Se un tempo il serbatoio dell’acqua calda era visto come un semplice contenitore passivo collegato alla caldaia, oggi sta diventando il cuore pulsante di un sistema energetico intelligente

Ma è vero che… l’interruttore del contatore può sostituire il generale?

La protezione della linea montante a valle del contatore è un elemento essenziale per la sicurezza dell’impianto elettrico. La norma cei 64-8 stabilisce quando sia necessario installare un interruttore generale dedicato e in quali casi è possibile utilizzare il magnetotermico integrato nel contatore del distributore.

Come si fa… l’impianto elettrico di una cucina professionale a gas?

Dalla suddivisione dei circuiti all’ubicazione del quadro, fino ai sistemi di rilevazione fughe gas: criteri tecnici e accorgimenti progettuali per realizzare un impianto elettrico adeguato nelle cucine professionali a gas.