Jak se počítače učí číst v našich tvářích

Jak se počítače učí číst v našich tvářích

18. 08. 2017

Technologie počítačového rozpoznávání obličejů a identifikace osob na jejich základě dozrává. A díky tomu začíná dokazovat nejen bezpečnostní, ale také ryze obchodní potenciál.

„Až ve chvíli, kdy se počítače naučí číst v naší tváři, mohou se začít učit skutečně rozumět lidem.“ To je závěr, ke kterému dospěli Čcha Čang a Čeng-jou Čang, dva špičkoví vědci z oboru, kteří jsou autory citátu, ale dnes už jde o celkem obecně přijímaný závěr. Lidský obličej je jako otevřená kniha, a my si málokdy uvědomujeme, jak dobře v ní náš mozek dokáže číst. A stroje by se v ní měly naučit číst také, pokud komunikace s nimi má být tak přirozená jako s jinými lidmi. Programátoři to samozřejmě vědí a na tomto problému pracují už desítky let. Upřímně řečeno, pokrok nebyl tak rychlý, jak optimisté doufali. Po útocích z 11. září 2001 například existovala naděje, že počítačová identifikace osob na základě obličejů v brzké době umožní najít podezřelé při přechodu hranic či přímo na snímcích bezpečnostních kamer. Všichni víme, že zatím tomu tak úplně není. Ale pokrok je nezastavitelný. Rychlost vývoje této technologie v dlouhodobém měřítku odpovídá Moorovu zákonu – například chybovost se každé dva roky sníží na dvojnásobek. Od 90. let už jde o úctyhodný pokles chybovosti zhruba o čtyři řády, na úroveň prakticky lepší, než má lidský mozek. Nemluvě samozřejmě o schopnosti prohledávat rozsáhlé databáze.

Obrovská obchodní příležitost

Rozšiřování využití této technologie nahrává i fakt, že podobně jako u dalších IT technologií i v případě rozpoznávání obličejů se kvalita stále zvyšuje, zatímco ceny nerostou, ba rovnou klesají. I proto předpovídají analytici trhu v oblasti rozpoznávání obličejů průměrný roční růst někde kolem 20 až 25 %. Podle společnosti MarketsandMarkets zabývající se průzkumy trhů bude mít v roce 2020 tento segment trhu hodnotu kolem šesti miliard dolarů místo dnešních zhruba tří miliard. Svou roli v tom zřejmě bude hrát i změna technologie. Rozpoznávání obličejů vyžadovalo dosud pro řadu firem příliš drahá serverová řešení (na serverech probíhá porovnání obrazu s databázemi). Nyní se zdá, že lepší software i hardware umožňují část (a zřejmě podstatnou část) celého procesu přesunout na levnější vybavení, například přímo do kamer, které jsou vybaveny stále výkonnějšími čipy.

Spolupráce nutná

Neznamená to ovšem, že by byly postupy za všech okolností tak přesné a efektivní, jak by bylo zapotřebí. Zatím zcela spolehlivě – a levně, což je samozřejmě také důležité – zvládá především ty případy, kdy dotyčný při identifikaci spolupracuje. Tedy například, pokud se zastaví ve vymezeném prostoru před snímacím zařízením, tedy v systémech na kontrolu vstupu. V takových podmínkách si už pokročilé systémy spolehlivě vedou mnohem lépe než lidé i v přesnosti. Jiné je to v takzvaně „nespolupracujícím prostředí“. Identifikace v živém videu, nebo i v záznamu s množstvím osob, je samozřejmě mnohem náročnější. Provádí se s pomocí výkonově náročného biometrického algoritmu, který vyhledá v obraze jednotlivé obličeje, provede biometrickou analýzu a porovná výsledek s databází, což je v reálném čase evidentně náročné. Navíc lze v praxi v podobných případech těžko používat standardní kamerové systémy, u kterých obvykle nevyhovuje umístění kamer. Byly obvykle navrženy s jiným záměrem, například jako přehledové. A tak je v mnoha případech nutné doplnit je samostatnými kamerami určenými pouze pro detekci obličejů.

Jak najít VIP

To vše s sebou nese investiční náklady – a tak hlavními klienty jsou dnes stále především subjekty v oblasti bezpečnosti, kde identifikace pomocí obličeje představuje klíčovou technologii. Možné využití je samozřejmě mnohem širší. Pro aerolinky to může být například způsob, jak v davu najít cestujícího s nárokem na VIP služby, který se ztratil na cizím letišti. Pro hotel či obchod může být výhodné rychle vytipovat své „VIP“, ať už jde opravdu o známé osobnosti, či pravidelné návštěvníky. Podobná použití se skrývají obvykle pod názvem „business intelligence“, což je termín, který sice zní poněkud nezvykle, ve skutečnost jde ale v podstatě jen o nové způsoby zvyšování úrovně poskytování služeb – hlavně díky vyhodnocování informací o chování zákazníků. Z hlediska rozšiřování technologie je dobře, že obchodníci nemusejí přesně znát identitu návštěvníků, v mnoha případech podle všeho stačí, či by měly stačit, mnohem obecnější informace – a to je nejen méně náročná, a tedy levnější technologie, ale také technologie, na kterou právo i veřejnost samozřejmě nahlížejí shovívavěji. Pravdou totiž je, že byť často říkáme opak, nejsme každý tak úplně jiný. Všichni rádi šetříme energií a uchylujeme se k obecným vzorcům chování a rozhodování, které pak lze samozřejmě statisticky sledovat a vyhodnocovat. Je velmi dobře představitelné, že software dokáže pouze na základě vyhodnocení základních vizuálních informací – pohlaví, věku, chování (jen prochází, nebo míří za něčím určitým atp.) – vytipovat zákazníky, u kterých je pravděpodobnost útraty nejvyšší, a upozornit na ně zaměstnance. Nemluvě samozřejmě o tom, že takový systém může velmi snadno sloužit i bezpečnostní službě k ochraně zboží. Možností je prostě celá řada, a určitě jich bude rychlým tempem přibývat. Software pro rozpoznávání obličejů lze integrovat s marketingovým systémem, který bude automaticky zobrazovat reklamy „na míru“ pro daného zákazníka. Údaje získané provozováním systému pak mohou samozřejmě sloužit i při úpravách obchodu, jeho uspořádání, rozložení atp. To se samozřejmě provádí už dnes, ale proces je nepochybně možné ještě v mnohém vylepšit.

Při rozpoznávání obličeje je klíčový i úhel nastavení. Optimálně by měl být menší než +/- 15 stupňů horizontálně a +/- 15 stupňů vertikálně. Při překročení těchto hodnot dochází k deformaci poměru vzdáleností obličejových kontur, a v důsledku se tak snižuje přesnost identifikace.

Jak to funguje

Při identifikaci je dobré mít viditelné důležité části obličeje (oči, nos a ústa). Obličej by měl být dostatečně osvětlen, ale ne přesvětlen, například přímým slunečním světlem nebo reflektorem. Obraz by měl mít minimálně 40 pixelů mezi zorničkami očí, optimálně 80 až 100 pixelů. S hodnotami pod 40 pixelů u dnešních systémů prudce klesá úspěšnost identifikace. Počet obličejů v jednom snímku: snímek z video streamu může obsahovat více tváří. S ohledem na rozlišení kamery a požadavek na minimální počet obrazových bodů mezi zorničkami očí lze snadno odvodit, kolik obličejů „se vejde“ do snímku kamery s různým rozlišením až do mezní hodnoty stanovené podle dostupného výpočetního výkonu.

Líbil se vám článek?