Estrarre informazioni corrette da immagini

Estrarre informazioni corrette dalle immagini è sicuramente una delle sfide nella ricerca informatica (legata ad internet) dei prossimi anni.
Un primo step era stato estrarre testo corretto da immagini, il famoso OCR, con il passare degli anni sempre più preciso. Indispensabile anche con il corsivo per permettere di digitalizzare tutto il nostro passato (manoscritti, documenti, libri, … montagne di carta che spesso hanno ancora contenuti misteriosi o conosciuti da pochissimi eletti).
Un secondo step è stato il riconoscimento facciale già arrivato a buon livello anche se la privacy ne sta limitando la diffusione pubblica.
Il vero fine è una descrizione della fotografia e magari in base alla descrizione una localizzazione o in base alla localizzazione una descrizione.

Ovvero partiamo da alcuni esempi semplici per passare alla fantascienza.

ci sono dei visi -> ci sono due persone, cinque persone, …
riconoscimento della tipologia delle persone -> due ragazze, un calciatore, un anziano, …
oggetti con i loro colori o monumenti o … -> una casa gialla, il Colosseo, …
squadra di calcio, magliette rosso nere e bianco nere, pubblicità in lingua italiana -> partita Milan – Juve? San Siro o Juventus Stadium?

Al momento non viene considerato ma sarebbe relativamente semplice partendo da ubicazione e angolazione della macchina fotografia al momento dello scatto ricavare cosa si stava fotografando almeno nel caso di monumenti famosi o di luoghi dove è già passata la google car o equivalenti.

Non sono solo vaneggiamenti: Google’s Image Recognition Software Can Now Describe Entire Scenes

Leave a Reply