2013
informatika
Emberi szemmozgás-kísérleteken alapuló modell a látvány lényegi kiértékelésére
Témavezető:
Dr. Szirányi Tamás, Dr. Vidnyánszky Zoltán
Dr. Szirányi Tamás, Dr. Vidnyánszky Zoltán
Összefoglaló
Az emberi szemmozgás algoritmikus úton történő becslése egy fontos kutatási terület. A jelenleg elfogadott modell értelmében a látás egy olyan összetett folyamat, amelyet a látóterünkben levő kép tulajdonságai mellett belső, kognitív tényezők is befolyásolnak. A folyóiratokban bemutatott módszerek legtöbbje azonban tisztán a kép struktúrájából kiindulva közelíti meg a problémát.
Ebben a munkában megkíséreltem túlmutatni ezeken a módszereken kognitív tényezők integrálásával. A modell emberi szemmozgás-kísérletekre épül, amelyek tanítási és tesztelési célt szolgáltak. Első lépésben egy fejre szerelhető szemkövető készülékkel tanuló videókat rögzítettünk, amelyek képkockáin képi leírókat detektáltam. Ezeket klaszterezve kezelhető mennyiségű adatot kaptam. Az így nyert mesterséges kiugró pontokat emberi szemmozgási mintákkal együtt statisztikai modellbe illesztettem. Ez a megközelítés olyan gráfok bejárásán alapul, amelyeket a humán mérések során nyert valószínűségi adatok alapján építettem fel. A modell becslést ad arra, hogy adott képen melyek azok a részek, amelyek vonzzák a tekintetet. Az eredmények kiértékeléséhez újabb kísérleteket végeztem, amelyben alanyok szemmozgását rögzítettem bizonyos feladatok elvégzése közben. A modellt különböző képi leírók kezelésére készítettem fel.
Munkám célja az volt, hogy egy új megközelítés szerint adjak becslést a tekintet útjára. Modellem széles körű alkalmazási lehetőségeket hordozhat magában. Az eredmények kiértékelésénél azt találtam, hogy a módszer sikeresen ad becslést a tekintet útjára, ráadásul könnyen paraméterezhető egy-egy konkrét alkalmazási terület igényei szerint.
Ebben a munkában megkíséreltem túlmutatni ezeken a módszereken kognitív tényezők integrálásával. A modell emberi szemmozgás-kísérletekre épül, amelyek tanítási és tesztelési célt szolgáltak. Első lépésben egy fejre szerelhető szemkövető készülékkel tanuló videókat rögzítettünk, amelyek képkockáin képi leírókat detektáltam. Ezeket klaszterezve kezelhető mennyiségű adatot kaptam. Az így nyert mesterséges kiugró pontokat emberi szemmozgási mintákkal együtt statisztikai modellbe illesztettem. Ez a megközelítés olyan gráfok bejárásán alapul, amelyeket a humán mérések során nyert valószínűségi adatok alapján építettem fel. A modell becslést ad arra, hogy adott képen melyek azok a részek, amelyek vonzzák a tekintetet. Az eredmények kiértékeléséhez újabb kísérleteket végeztem, amelyben alanyok szemmozgását rögzítettem bizonyos feladatok elvégzése közben. A modellt különböző képi leírók kezelésére készítettem fel.
Munkám célja az volt, hogy egy új megközelítés szerint adjak becslést a tekintet útjára. Modellem széles körű alkalmazási lehetőségeket hordozhat magában. Az eredmények kiértékelésénél azt találtam, hogy a módszer sikeresen ad becslést a tekintet útjára, ráadásul könnyen paraméterezhető egy-egy konkrét alkalmazási terület igényei szerint.
Dr. Szirányi Tamás
sziranyi.tamas@sztaki.mta.hu
Dr. Vidnyánszky Zoltán