A szemmozgás tanulmányozása segítheti az önvezető autók fejlesztését?

31 aug 2022

Andrea Benucci olasz származású kutató biológiai tudományterületen kutató csapatával tárgyak gyors és pontos felismerésére szolgáló mesterséges neurális hálózatok létrehozásának módszerét fejlesztette ki. A kutatás a RIKEN Agytudományi központban, Japánban zajlott, ahol Benucci a Neurális áramkörök és viselkedés laboratóriumának csoportvezetője.

A munkacsoport az érzékszervi feldolgozás idegrendszeri alapjait vizsgálja, ezen belül a látást. Az általuk használt kísérleti eszközök az optogenetika, az optikai képalkotás és az elektródák rögzítésének módszerein alapulnak.

A kutatás részletei a PLOS Computational Biology szakfolyóiratban jelentek meg. A folyóirat havonta megjelenő, nyílt hozzáférésű tudományos folyóirat, amelyet 2005-ben hoztak létre, a  Public Library of Science a Nemzetközi Számítógépes Biológiai Társasággal együttműködve adja ki.

A tudományos cikkben ismertetik, hogy a kutatás eredményei sikeresen alkalmazhatóak a gépi „látásra”, a gépi tanulásra is, amely lényege az, hogy az önvezetésre szánt jármű megtanulja azt, hogy hogyan ismerje fel a fontos jellemzőket a közlekedés folyamán. Az elve az emberi szem működéséhez hasonló, hiszen a fejünk mozgatása közben a tárgyak nem homályosodnak vagy mosodnak el, annak ellenére hogy a szem által észlelt fizikai környezet folyamatosan változik.

Free photos of Portrait

Forrás: www.pixabay.com

Kezdetben az eredmények nem voltak túl kecsegtetőek, – a teszt az volt, hogy 60 000 fekete-fehér képet kellett 10 kategóriába sorolni. A szem mozgása és az ezzel megváltozó vizuális bemenet nem volt elég pontos még, így az eltolt képekkel való betanítás után a tesztet újra el kellett végezni – ez a teszt jó eredménnyel zárult.

Benucci legújabb fejlesztése a CNN, vagyis a konvolúciós neurális hálózat, amely a különböző tárgyak stabil felismerésében segítheti majd az önvezető autókat. A CNN optimalizálja a szem mozgása közben a tárgyak osztályozását egy vizuális jelenet folyamán – a CNN tulajdonképpen egy tanulási algoritmusnak tekinthető, amely képet kap bemenetként és fontosságot, azaz tanulható súlyokat és torzításokat rendel a kép tárgyaihoz és ezzel a módszerrel különbözteti meg őket egymástól. Ez azért fontos, hogy az önvezető autók hibázási lehetőségét a minimálisra csökkentsük.

Benucci szerint  „a szemmozgások és efferens másolataik utánzásának előnyei azt jelentik, hogy a gépi látásérzékelőt irányított típusú mozgásokra kényszerítjük, miközben tájékoztatjuk a kapcsolódó képek feldolgozásáért felelős látóhálózatát a saját maguk által generált mozgásokról”.

A kutatás azonban itt nem ér véget, a következő lépésben a kutatók a neuromorf technológiákkal dolgozó kollégákkal folytatják majd az együttműködést. Az ötlet az, hogy tényleges szilícium alapú áramköröket valósítsanak meg a jelen tanulmányban kiemelt elvek alapján, és teszteljék, így képesek-e  javítani a gépi látás képességét a valós alkalmazásokban.

RELATED POST

Írj egy választ