2009
informatika
Gyalogosátkelőhely felismerés a Bionikus Szemüveggel
Témavezető:
Dr. Karacs Kristóf
Dr. Karacs Kristóf
Összefoglaló
A szemünk az egyik legfontosabb érzékszervünk, nem véletlen, hogy a legtöbb mozdulatunk, cselekedetünk megtervezését a beérkező vizuális információkra alapozzuk. Ennek az érzékszervnek az elvesztése, sérülése nagyon megnehezíti a mindennapi életet. A vakok és gyengénlátók segítésére számos módon próbálnak megoldást találni, ám ezek az irányzatok elsősorban a megmaradt,és az agyi plaszticitás révén megerősödött érzékszervekre támaszkodnak, mint például a hallásra vagy a tapintásra. Ezzel szemben a Bionikus Szemüveg egy olyan eszköz, ami a kiesett érzékszervet kívánja pótolni, a környezetből a kamerájába érkező vizuális információ feldolgozásával. Működése a Celluláris Hullámszámítás alapelvein, és a Celluláris Neurális/nem lineáris Hálózat – Univerzális Gépen (CNN-UM) alapszik.
Az alábbiakban ismertetett feladat megoldása az utcai közlekedésben segíti a felhasználót, gyalogosátkelők felismerésével. A zebrasávok felismerése a bejövő videófolyam elemi képkockáin történik, maga a megoldás pedig egy CNN template sorozatot jelent, amit a gyalogosátkelő jellemző tulajdonságait kiemelő, két különböző maszkoló lépés előz meg. A CNN algoritmus alapvető morfológiai és logikai lépések sorozatából áll, amiket végül egy szintén CNN-el megvalósított méretbeli szűrés követ. Az így kapott eredményképeken fut le végül a kiértékelő eljárás, ami az észlelt foltok száma és mérete – hossza – alapján hozza meg döntését. Az algoritmus kimenete képkockánként egy skalár érték, ami azt adja meg, hogy a detektált objektum milyen mértékben feleltethető meg gyalogosátkelőnek. Amennyiben bináris kimenetre van szükség, akkor a skalár értékek egy előre rögzített küszöbérték szerint kerülnek besorolásra a két osztályba.
Mint a legtöbb képfeldolgozó eljárás, a gyalogosátkelő felismerése is számos nehézségbe ütközik a láthatóság, a különböző fényviszonyok illetve itt speciálisan az útburkolat és az útburkolati jel hibái révén. Ebből kifolyólag a bemeneti képek már a tanítás –azaz a folyamat tervezése – során négy különböző kategóriába kerültek, így már mind a tanítás, mind pedig az algoritmus hatékonyságának a vizsgálata során különböző súllyal számíthattak a különböző kategóriák. Ezek után elmondható, hogy a megtervezett folyamat az összes kép több mint 60%-ára, az első kategóriás képeknek viszont több mint 80%-ára adott jó választ. Hibás elfogadás, igaz csak nagyon kis százalékban, de előfordult a tesztelés során, amit a későbbiekben mindenképp el kell kerülni. Ebben sokat segíthetne például a már megtalált zebra vetése egy tracking algoritmussal a képkockák között.
Az algoritmus kidolgozását valamint kiértékelését is Matlab környezetben végeztem. A kidolgozott algoritmusnak egy kezdeti verzióját a Bi-i kamera-számítógépen is implementáltam, így a kidolgozott módszer a közeljövőben egy mobiltelefonból és hozzá csatlakozó mini kamera-számítógépből álló hordozható rendszeren is kipróbálható és tesztelhető lesz.
Az alábbiakban ismertetett feladat megoldása az utcai közlekedésben segíti a felhasználót, gyalogosátkelők felismerésével. A zebrasávok felismerése a bejövő videófolyam elemi képkockáin történik, maga a megoldás pedig egy CNN template sorozatot jelent, amit a gyalogosátkelő jellemző tulajdonságait kiemelő, két különböző maszkoló lépés előz meg. A CNN algoritmus alapvető morfológiai és logikai lépések sorozatából áll, amiket végül egy szintén CNN-el megvalósított méretbeli szűrés követ. Az így kapott eredményképeken fut le végül a kiértékelő eljárás, ami az észlelt foltok száma és mérete – hossza – alapján hozza meg döntését. Az algoritmus kimenete képkockánként egy skalár érték, ami azt adja meg, hogy a detektált objektum milyen mértékben feleltethető meg gyalogosátkelőnek. Amennyiben bináris kimenetre van szükség, akkor a skalár értékek egy előre rögzített küszöbérték szerint kerülnek besorolásra a két osztályba.
Mint a legtöbb képfeldolgozó eljárás, a gyalogosátkelő felismerése is számos nehézségbe ütközik a láthatóság, a különböző fényviszonyok illetve itt speciálisan az útburkolat és az útburkolati jel hibái révén. Ebből kifolyólag a bemeneti képek már a tanítás –azaz a folyamat tervezése – során négy különböző kategóriába kerültek, így már mind a tanítás, mind pedig az algoritmus hatékonyságának a vizsgálata során különböző súllyal számíthattak a különböző kategóriák. Ezek után elmondható, hogy a megtervezett folyamat az összes kép több mint 60%-ára, az első kategóriás képeknek viszont több mint 80%-ára adott jó választ. Hibás elfogadás, igaz csak nagyon kis százalékban, de előfordult a tesztelés során, amit a későbbiekben mindenképp el kell kerülni. Ebben sokat segíthetne például a már megtalált zebra vetése egy tracking algoritmussal a képkockák között.
Az algoritmus kidolgozását valamint kiértékelését is Matlab környezetben végeztem. A kidolgozott algoritmusnak egy kezdeti verzióját a Bi-i kamera-számítógépen is implementáltam, így a kidolgozott módszer a közeljövőben egy mobiltelefonból és hozzá csatlakozó mini kamera-számítógépből álló hordozható rendszeren is kipróbálható és tesztelhető lesz.
Dr. Karacs Kristóf