A szemmozgás tanulmányozása segítheti az önvezető autók fejlesztését?
Andrea Benucci olasz származású kutató biológiai tudományterületen kutató csapatával tárgyak gyors és pontos felismerésére szolgáló mesterséges neurális hálózatok létrehozásának módszerét fejlesztette ki. A kutatás a RIKEN Agytudományi központban, Japánban zajlott, ahol Benucci a Neurális áramkörök és viselkedés laboratóriumának csoportvezetője.
A munkacsoport az érzékszervi feldolgozás idegrendszeri alapjait vizsgálja, ezen belül a látást. Az általuk használt kísérleti eszközök az optogenetika, az optikai képalkotás és az elektródák rögzítésének módszerein alapulnak.
A kutatás részletei a PLOS Computational Biology szakfolyóiratban jelentek meg. A folyóirat havonta megjelenő, nyílt hozzáférésű tudományos folyóirat, amelyet 2005-ben hoztak létre, a Public Library of Science a Nemzetközi Számítógépes Biológiai Társasággal együttműködve adja ki.
A tudományos cikkben ismertetik, hogy a kutatás eredményei sikeresen alkalmazhatóak a gépi „látásra”, a gépi tanulásra is, amely lényege az, hogy az önvezetésre szánt jármű megtanulja azt, hogy hogyan ismerje fel a fontos jellemzőket a közlekedés folyamán. Az elve az emberi szem működéséhez hasonló, hiszen a fejünk mozgatása közben a tárgyak nem homályosodnak vagy mosodnak el, annak ellenére hogy a szem által észlelt fizikai környezet folyamatosan változik.
Forrás: www.pixabay.com
Kezdetben az eredmények nem voltak túl kecsegtetőek, – a teszt az volt, hogy 60 000 fekete-fehér képet kellett 10 kategóriába sorolni. A szem mozgása és az ezzel megváltozó vizuális bemenet nem volt elég pontos még, így az eltolt képekkel való betanítás után a tesztet újra el kellett végezni – ez a teszt jó eredménnyel zárult.
Benucci legújabb fejlesztése a CNN, vagyis a konvolúciós neurális hálózat, amely a különböző tárgyak stabil felismerésében segítheti majd az önvezető autókat. A CNN optimalizálja a szem mozgása közben a tárgyak osztályozását egy vizuális jelenet folyamán – a CNN tulajdonképpen egy tanulási algoritmusnak tekinthető, amely képet kap bemenetként és fontosságot, azaz tanulható súlyokat és torzításokat rendel a kép tárgyaihoz és ezzel a módszerrel különbözteti meg őket egymástól. Ez azért fontos, hogy az önvezető autók hibázási lehetőségét a minimálisra csökkentsük.
Benucci szerint „a szemmozgások és efferens másolataik utánzásának előnyei azt jelentik, hogy a gépi látásérzékelőt irányított típusú mozgásokra kényszerítjük, miközben tájékoztatjuk a kapcsolódó képek feldolgozásáért felelős látóhálózatát a saját maguk által generált mozgásokról”.
A kutatás azonban itt nem ér véget, a következő lépésben a kutatók a neuromorf technológiákkal dolgozó kollégákkal folytatják majd az együttműködést. Az ötlet az, hogy tényleges szilícium alapú áramköröket valósítsanak meg a jelen tanulmányban kiemelt elvek alapján, és teszteljék, így képesek-e javítani a gépi látás képességét a valós alkalmazásokban.