A szemmozgás tanulmányozása segítheti az önvezető autók fejlesztését?

31 augusztus 2022, 22:59

Andrea Benucci olasz származású kutató biológiai tudományterületen kutató csapatával tárgyak gyors és pontos felismerésére szolgáló mesterséges neurális hálózatok létrehozásának módszerét fejlesztette ki. A kutatás a RIKEN Agytudományi központban, Japánban zajlott, ahol Benucci a Neurális áramkörök és viselkedés laboratóriumának csoportvezetője.

A munkacsoport az érzékszervi feldolgozás idegrendszeri alapjait vizsgálja, ezen belül a látást. Az általuk használt kísérleti eszközök az optogenetika, az optikai képalkotás és az elektródák rögzítésének módszerein alapulnak.

A kutatás részletei a PLOS Computational Biology szakfolyóiratban jelentek meg. A folyóirat havonta megjelenő, nyílt hozzáférésű tudományos folyóirat, amelyet 2005-ben hoztak létre, a  Public Library of Science a Nemzetközi Számítógépes Biológiai Társasággal együttműködve adja ki.

A tudományos cikkben ismertetik, hogy a kutatás eredményei sikeresen alkalmazhatóak a gépi „látásra”, a gépi tanulásra is, amely lényege az, hogy az önvezetésre szánt jármű megtanulja azt, hogy hogyan ismerje fel a fontos jellemzőket a közlekedés folyamán. Az elve az emberi szem működéséhez hasonló, hiszen a fejünk mozgatása közben a tárgyak nem homályosodnak vagy mosodnak el, annak ellenére hogy a szem által észlelt fizikai környezet folyamatosan változik.

Free photos of Portrait

Forrás: www.pixabay.com

Kezdetben az eredmények nem voltak túl kecsegtetőek, – a teszt az volt, hogy 60 000 fekete-fehér képet kellett 10 kategóriába sorolni. A szem mozgása és az ezzel megváltozó vizuális bemenet nem volt elég pontos még, így az eltolt képekkel való betanítás után a tesztet újra el kellett végezni – ez a teszt jó eredménnyel zárult.

Benucci legújabb fejlesztése a CNN, vagyis a konvolúciós neurális hálózat, amely a különböző tárgyak stabil felismerésében segítheti majd az önvezető autókat. A CNN optimalizálja a szem mozgása közben a tárgyak osztályozását egy vizuális jelenet folyamán – a CNN tulajdonképpen egy tanulási algoritmusnak tekinthető, amely képet kap bemenetként és fontosságot, azaz tanulható súlyokat és torzításokat rendel a kép tárgyaihoz és ezzel a módszerrel különbözteti meg őket egymástól. Ez azért fontos, hogy az önvezető autók hibázási lehetőségét a minimálisra csökkentsük.

Benucci szerint  „a szemmozgások és efferens másolataik utánzásának előnyei azt jelentik, hogy a gépi látásérzékelőt irányított típusú mozgásokra kényszerítjük, miközben tájékoztatjuk a kapcsolódó képek feldolgozásáért felelős látóhálózatát a saját maguk által generált mozgásokról”.

A kutatás azonban itt nem ér véget, a következő lépésben a kutatók a neuromorf technológiákkal dolgozó kollégákkal folytatják majd az együttműködést. Az ötlet az, hogy tényleges szilícium alapú áramköröket valósítsanak meg a jelen tanulmányban kiemelt elvek alapján, és teszteljék, így képesek-e  javítani a gépi látás képességét a valós alkalmazásokban.

Írj egy választ

A megjegyzésnek legalább 5 karakter hosszúnak kell lennie!

Kérjük, fogadja el a szabályzatot!

Nincs hozzászólás. Legyél az első!