A szem képalkotó technológia az autóknak is segíthet jobban látni
Annak ellenére, hogy a robotoknak nincs retinájuk, a kulcsa annak, hogy természetesebben és biztonságosabban láthassák a világot, és kölcsönhatásba léphessenek vele, az optikai koherencia-tomográfia (OCT) készülékekben rejlik, amelyeket általában a szemészek rendelőiben találhatunk meg.
Az egyik képalkotó technológia, amelyet sok robotikai cég integrál érzékelőcsomagjaiba, a Light Detection and Ranging, vagy röviden a LiDAR. A jelenleg az önvezető autók fejlesztőitől nagy figyelmet és befektetést kiváltó megközelítés lényegében radarszerűen működik, de ahelyett, hogy széles rádióhullámokat küldene ki és visszaverődéseket keresne, lézerek rövid fényimpulzusait használja.
A hagyományos LiDAR azonban számos hátránnyal rendelkezik, amelyek megnehezítik a használatát számos 3D látási alkalmazásban. Mivel nagyon gyenge visszavert fényjelek észlelését igényli, más LiDAR rendszerek vagy akár a környező napfény is könnyen túlterhelheti az érzékelőt. Korlátozott mélységi felbontása is van, és veszélyesen hosszú ideig tarthat egy nagy terület, például autópálya vagy gyári padló sűrű átvizsgálása. E kihívások leküzdése érdekében a kutatók a LiDAR egyik formáját, az úgynevezett frekvenciamodulált folyamatos hullámot (FMCW) LiDAR-t használják.
„Az FMCW LiDAR ugyanazt a működési elvet használja, mint az OCT, amelyet az orvosbiológiai mérnöki terület az 1990-es évek eleje óta fejleszt” – mondta Ruobing Qian, Joseph Izatt, Michael J. Fitzpatrick orvosbiológiai mérnöki professzor laboratóriumában dolgozó PhD-hallgató. Duke-nál. „De 30 évvel ezelőtt senki sem tudta, hogy az autonóm autók vagy robotok létezni fognak, ezért a technológia a szöveti képalkotásra összpontosított. Most, hogy hasznos legyen ezeken a feltörekvő területeken, meg kell cserélnünk rendkívül nagy felbontási képességeit nagyobb távolságra és sebességre.”
A Nature Communications folyóiratban március 29-én megjelent cikkben a Duke csapata bemutatja, hogy az OCT-kutatásuk során elsajátított néhány trükk 25-szörösére javíthatja a korábbi FMCW LiDAR adatátvitelt, miközben továbbra is szubmilliméteres mélységpontosságot ér el.
Az OCT az ultrahang optikai analógja, amely úgy működik, hogy hanghullámokat küld a tárgyakba, és megméri, mennyi idő alatt térnek vissza. A fényhullámok visszatérési idejének időzítéséhez az OCT eszközök azt mérik, hogy a fázisuk mennyit tolódott el az azonos távolságot megtett, de más objektummal nem kölcsönhatásba lépő azonos fényhullámokhoz képest.
Az FMCW LiDAR hasonló megközelítést alkalmaz néhány módosítással. A technológia lézersugarat bocsát ki, amely folyamatosan vált a különböző frekvenciák között. Amikor az érzékelő fényt gyűjt a visszaverődési idejének méréséhez, különbséget tud tenni az adott frekvenciaminta és bármely más fényforrás között, lehetővé téve, hogy mindenféle fényviszonyok között, nagyon nagy sebességgel működjön. Ezután méri a fáziseltolódást az akadálytalan nyalábokkal szemben, ami sokkal pontosabb módja a távolság meghatározásának, mint a jelenlegi LiDAR rendszerek.
„Nagyon izgalmas volt látni, hogy a biológiai sejtléptékű képalkotó technológia, amelyen évtizedek óta dolgozunk, hogyan használható közvetlenül a nagyméretű, valós idejű 3D-s látásmódra” – mondta Izatt. „Pontosan ezekre a képességekre van szükség ahhoz, hogy a robotok biztonságosan lássanak és interakcióba lépjenek az emberekkel, vagy akár az avatarokat élő 3D-s videóra cseréljék a kiterjesztett valóságban.”
A LiDAR-t használó korábbi alkalmazások többsége forgó tükrökre támaszkodott, amelyek a lézerrel a táj felett pásztáztak. Bár ez a megközelítés jól működik, alapvetően korlátozza a mechanikus tükör sebessége, függetlenül attól, hogy milyen erős lézert használ.
A Duke kutatói ehelyett egy prizmaszerűen működő diffrakciós rácsot használnak, amely a lézert a forrástól távolodó frekvenciák szivárványává bontja. Mivel az eredeti lézer még mindig gyorsan átsöpör egy frekvenciatartományon, ez azt jelenti, hogy a LiDAR sugarat sokkal gyorsabban söpri, mint ahogy egy mechanikus tükör el tud forgatni. Ez lehetővé teszi, hogy a rendszer gyorsan lefedjen egy széles területet anélkül, hogy nagymértékben veszítene a mélységből vagy a helymeghatározási pontosságból.
Míg az OCT eszközöket mikroszkopikus struktúrák profilozására használják akár több milliméter mélységig egy objektumon belül, addig a robotizált 3D-s látórendszereknek csak az emberi léptékű objektumok felületét kell meghatározniuk. Ennek elérése érdekében a kutatók leszűkítették az OCT által használt frekvenciatartományt, és csak a tárgyak felületéről generált csúcsjelet keresték. Ez egy kis felbontásba kerül a rendszernek, de sokkal nagyobb képtartományban és sebességgel, mint a hagyományos LiDAR.
Az eredmény egy FMCW LiDAR rendszer, amely szubmilliméteres lokalizációs pontosságot és 25-ször nagyobb adatátvitelt tesz lehetővé, mint a korábbi bemutatók. Az eredmények azt mutatják, hogy a megközelítés elég gyors és pontos ahhoz, hogy valós időben rögzítse a mozgó emberi testrészek részleteit – például egy bólogató fejet vagy egy szorító kezet.
„Ugyanúgy, ahogyan az elektronikus kamerák mindenütt elterjedtek, víziónk a LiDAR-alapú 3D kamerák új generációjának kifejlesztése, amelyek elég gyorsak és képesek a 3D látás mindenféle termékbe történő integrálására” – mondta Izatt. „A körülöttünk lévő világ 3D-s, tehát ha azt akarjuk, hogy a robotok és más automatizált rendszerek természetesen és biztonságosan kommunikáljanak velünk, akkor látniuk kell minket, ahogyan mi is látjuk őket.”