Sedavõrd suur hulk Madalmaade kunstniku Johannes Vermeeri töid kui tänavu Hollandi Rahvusmuuseumis (Rijksmuseum) oli viimati ühe katuse all 1696. aasta maikuus, mil Amsterdami oksjonil müüdi maha ligi pool tema maalidest. Ent Vermeeri taieseid on püütud omandada ka ebaseaduslikel viisidel. 23. septembril 1971. aastal varastati Brüsseli Kunstimuuseumist 1670. aastal valminud Vermeeri teos "Armastuskiri", mis kujutab kaht daami, neist ühel ümbrik näpus.
Varas peitis end muuseumisaalis ja kui näitus õhtul suleti, lõikas ta kartulikoorijaga “Armastuskirja” raami küljest lahti. Järgnevatel päevadel võttis kurjategija ühendust Belgia meediaga nõudes maali eest 200 miljonit Belgia franki, mis tulnuks annetada Bangladeshi näljaohvritele. Paraku vahistati 21-aastane röövel Mario Roymans kaks nädalat hiljem, kui ta tegi järjekordse kõne meediale bensiinijaamast, mille müüja sattus juttu pealt kuulma. Vermeeri teos oli tublisti vigastatud - lisaks kartulikoorijaga nüsimisele mattis Roymans teose enne oma voodi alla peitmist metsa. Maal taastati järgneva aasta jooksul ja see leidis oma tee uuesti muuseumisaali.
Kuid mõtleme korraks olukorrale, kus sellist maali alles otsitakse. Politseile, meediale ja muuseumi esindajatele võib saabuda hulk vihjeid, sealhulgas fotosid erinevatest väidetavatest leidudest. Kui muuseumitöötajad on tavaliselt kunstiteadusliku ettevalmistusega ning oskavad sõltuvalt oma erialasest vilumusest ja metoodilistest valikutest langetada otsuseid vihjete kvaliteedi kohta, siis nii politsei kui meedia esindajad võivad lihtsamini orki minna ka sellise maaliga, mil pole “Armastuskirjaga” midagi pistmist.
Kujutleme, et Brüsseli politseikapten Jean-Pierre teeb saabuvate vihjete esmase läbivaatuse ülesandeks politseikoolist lähetatud praktikant Raphaëlile. Politseikadett Raphaël on lisaks kriminalistikale õppinud keskkoolis natuke programmeerimist, mistõttu otsustab ta oma tööd lihtsustada, kloonides Kilian Brachtendorfi koodinäite, mida ta Vermeeri „Armastuskirja“ tuvastamiseks mõningasel määral modifitseerib. Programmi keskmes on tajuräsi (perceptual hashing) algoritm, millega saab mõõta kahe visuaali Hammingi kaugust mis tahes resolutsiooniga pildifailide vahel. Inimtaju ja see, kuidas arvuti pilti töötleb on erinevad asjad, kuid tajuräsi tulemused on muljetavaldavalt sarnased inimtaju järeldustega.
Lihtsustatult väljendudes on Hammingi kaugus kahe ühe ja sama pikkusega räsi kahendväärtuste (0 või 1) erinevus. Näiteks oletame, et pildi A räsi on 000111 ja pildi B räsi on 111111. Sellisel juhul on Hammingi kaugus 3, sest räsid erinevad kolmes kohas: A räsi esimeses pooles on kolm nulli, kuid B räsis on samade kohtade peal arvud 1. Kuna selliseid kohti on kolm, siis on Hammingi kauguseks 3. Mida sarnasemad on pildid, seda väiksem on Hammingi kaugus. Kilian Brachtendorfi koodilahendis jäävad Hammingi kauguse väärtused 0 ja 1 vahele. Näiteks kui pildi A ja B Hammingi kauguseks on 0,15 ning piltide C ja D Hammingi kauguseks on 0,97, siis võib järeldada, et pildid A ja B on omavahel sarnased, samas kui pildid C ja D on tõenäoliselt üsna erinevad.
Antud juhul on Raphaëli otsus valida tajuräsil põhinev algoritm asjakohane just seepärast, et visuaalsed vihjed võivad olla üsna erinevate mõõtmetega. Tajuräsi arvutamise üldine algoritm koosneb neljast etapist:
Pildi mõõtmed vähendatakse 9x8 (72) piksli suuruseks näidiseks.
Pilt muudetakse mustvalgeks.
Määratletakse kõrvuti asetsevate pikslite erinevus teineteise suhtes.
Pildi pikslid tõlgendatakse räsiks lähtuvalt sellest, kas vasakul asetsev piksel on paremast eredam, kusjuures pikslite võrdlemise suund pole oluline, kuni sellest peetakse kinni kõigi näidiste puhul sarnasel viisil.
Raphaël saab esimese nädala lõpuks - andmeteaduslikus mõttes - võrdlemisi tagasihoidliku koguse vihjeid: kokku 10. Visuaalsel vaatlusel ilmneb, et enamik vihjeid kujutab daami, kellel on kas ümbrik või kiri näpu vahel. Paraku ei tea Raphaël, et enamik näidiseid, v.a üks on saadetud erinevate nimede all ühe ja sama isiku poolt, kes trükkis Google’isse “paintings with female holding letter” ehk “maalid kirja hoidva naisterahvaga” ning valis nende seast esimesed ettejuhtuvad. Raphaël moodustab vihjetest korpuse ja mõõdab ühe konkreetse tajuräsi algoritmi, täpsemalt erinevusräsi (difference hash) abil nende sarnasuse (link tema koodile).
Ta normaliseerib tulemused neljanda kohani pärast koma ja kannab need sarnasuse vähenemise järjekorras tabelisse:
Vihje | Tulemus |
sample_ 1 | 0.4513 |
sample_8 | 0.4827 |
sample_7 | 0.4875 |
sample_5 | 0.4924 |
sample_4 | 0.4930 |
sample_10 | 0.4951 |
sample_6 | 0.4953 |
sample_3 | 0.4983 |
sample_6 | 0.4963 |
sample_2 | 0.4991 |
Mõõtmistulemuste keskmiseks kujuneb 0.4891, standardhälve on 0.0142, mediaan 0.4940 ja kvartiilhaare (esimese ja kolmanda kvartiili vahe) 0.045. Kuigi arvväärtused on võrdlemisi sarnased, saab teistest mõnevõrra parema skoori esimene näidis, milleks on röövli poolt kartulikoorijaga nüsitud Johannes Vermeeri “Armastuskirja” repro. Seega peaks Raphaël lähtuvalt erinevusräsi algoritmi tulemustest raporteerima oma ülemusele, politseikapten Jean-Pierre’ile, et kõikidest saabunud vihjetest võiks uurida edasi esimese näidisega seotud asjaolusid.
Selguse huvide on oluline juhtida tähelepanu järgmistele aspektidele:
valim on väike, mistõttu tuleb tulemustesse suhtuda ettevaatusega (seda enam, et võrdlusandmed põhinevad tundmatu vihjaja ühekordsel Google’i päringul),
mõneti ebaselgeks jäävad võrdlusbaasi ühetaolised tulemused, kuid üks võimalus on see, et enamik maale kujutab isikut, kes asub teose horisontaalses keskpunktis (isik on hele, taust mitmel juhul pigem tume),
erinevusräsi arvutamisel saab mängida arvutamisel kasutatava võtme pikkusega (fail “CompareImages” rida 23), mistõttu tuleks igal konkreetsel juhtumil otsustada, milline on asjakohane võtme pikkus,
tajuräsi algoritmi abil saab otsustada visuaalide n-ö füüsilise sarnasuse üle, samas kui tähenduslik aspekt jääb vaatluse alt välja (Johannes Vermeeri “Armastuskirja” puhul on väidetud, et peaaegu iga maalil kujutatud objekt nagu näiteks protagonisti süles olev muusikainstrument, põrandalapp, tuhvlid jne on tähenduslik).
Erinevusräsi algoritm võimaldab kitsendada sarnaste visuaalide hulka ühetaoliselt mõistetavate printsiipide järgi ja pakub lisaks sümbolite tõlgendamisele tõhusa viisi, et välistada suvaliste näidete esitamist tõe pähe.
Tiit Kuuskmäe on Mind the Meaning partner, kes tegeleb kohtusemiootika kaasustega. Päise kujundus ja karrikatuur: Kristjan Holm.