रूमबा के बाद से रोबोट एक लंबा सफर तय कर चुके हैं। आज, ड्रोन डोर टू डोर डिलीवर करना शुरू कर रहे हैं, सेल्फ-ड्राइविंग कारें कुछ सड़कों को नेविगेट कर रही हैं, रोबो-डॉग्स पहले उत्तरदाताओं का समर्थन कर रहे हैं, और अभी भी अधिक बॉट्स बैकफ्लिप कर रहे हैं और कारखाने के फर्श पर मदद कर रहे हैं। फिर भी, लुका कार्लोन को लगता है कि सबसे अच्छा आना बाकी है।
कार्लोन, जिन्होंने हाल ही में एमआईटी के एरोनॉटिक्स एंड एस्ट्रोनॉटिक्स (एयरोस्ट्रो) विभाग में एक एसोसिएट प्रोफेसर के रूप में कार्यकाल प्राप्त किया, द स्पार्क लैब का निर्देशन करता है, जहां वह और उनके छात्र मनुष्यों और रोबोटों के बीच एक महत्वपूर्ण अंतराल कर रहे हैं: धारणा। समूह सैद्धांतिक और प्रायोगिक अनुसंधान करता है, सभी ने अपने पर्यावरण के बारे में एक रोबोट की जागरूकता का विस्तार करने की दिशा में मानवीय धारणा को उन तरीकों से विस्तारित किया है। और धारणा, जैसा कि कार्लोन अक्सर कहता है, पता लगाने से अधिक है।
जबकि रोबोट अपने परिवेश में वस्तुओं का पता लगाने और पहचानने की क्षमता के मामले में छलांग और सीमा से बढ़े हैं, उनके पास अभी भी बहुत कुछ सीखने के लिए है जब यह अपने पर्यावरण के उच्च-स्तरीय अर्थ बनाने की बात आती है। मनुष्यों के रूप में, हम न केवल उनके आकृतियों और लेबल के लिए बल्कि उनके भौतिकी के एक सहज ज्ञान के साथ वस्तुओं को देखते हैं – कैसे उन्हें हेरफेर किया जा सकता है और कैसे स्थानांतरित किया जा सकता है – और वे एक दूसरे, उनके बड़े वातावरण और खुद से कैसे संबंधित हैं।
इस तरह की मानव-स्तरीय धारणा है कि कार्लोन और उसका समूह रोबोट को प्रदान करने की उम्मीद कर रहे हैं, उन तरीकों से जो उन्हें सुरक्षित रूप से और मूल रूप से अपने घरों, कार्यस्थलों और अन्य असंरचित वातावरणों में लोगों के साथ बातचीत करने में सक्षम बनाते हैं।
2017 में MIT संकाय में शामिल होने के बाद से, कार्लोन ने विभिन्न अनुप्रयोगों के लिए धारणा और दृश्य-समझ को लागू करने और लागू करने में अपनी टीम का नेतृत्व किया है, जिसमें स्वायत्त भूमिगत खोज-और-बचाव वाहनों, ड्रोन शामिल हैं, जो फ्लाई पर वस्तुओं को उठा सकते हैं और हेरफेर कर सकते हैं और स्व-ड्राइविंग कारों को हेरफेर कर सकते हैं। वे घरेलू रोबोटों के लिए भी उपयोगी हो सकते हैं जो प्राकृतिक भाषा के आदेशों का पालन करते हैं और संभावित रूप से उच्च-स्तरीय प्रासंगिक सुराग के आधार पर मानव की जरूरतों का भी अनुमान लगाते हैं।
“धारणा वास्तविक दुनिया में हमारी मदद करने के लिए रोबोट प्राप्त करने की दिशा में एक बड़ी अड़चन है,” कार्लोन कहते हैं। “अगर हम रोबोट धारणा के लिए अनुभूति और तर्क के तत्वों को जोड़ सकते हैं, तो मेरा मानना है कि वे बहुत अच्छा कर सकते हैं।”
क्षितिज का विस्तार करना
कार्लोन का जन्म और पालन -पोषण सालेर्नो, इटली के पास हुआ था, जो दर्शनीय अमाल्फी तट के करीब था, जहां वह तीन लड़कों में सबसे छोटा था। उनकी मां एक सेवानिवृत्त प्राथमिक विद्यालय की शिक्षक हैं जिन्होंने गणित पढ़ाया है, और उनके पिता एक सेवानिवृत्त इतिहास प्रोफेसर और प्रकाशक हैं, जिन्होंने हमेशा अपने ऐतिहासिक शोध के लिए एक विश्लेषणात्मक दृष्टिकोण लिया है। भाइयों ने अनजाने में अपने माता -पिता की मानसिकता को अपनाया हो सकता है, क्योंकि तीनों ने इंजीनियर बन गए – पुराने दो ने इलेक्ट्रॉनिक्स और मैकेनिकल इंजीनियरिंग का पीछा किया, जबकि कार्लोन रोबोटिक्स, या मेकैट्रोनिक्स पर उतरे, जैसा कि उस समय जाना जाता था।
वह मैदान में नहीं आया, हालांकि, अपने स्नातक अध्ययन में देर तक। कार्लोन ने ट्यूरिन के पॉलिटेक्निक विश्वविद्यालय में भाग लिया, जहां उन्होंने शुरू में सैद्धांतिक कार्य पर ध्यान केंद्रित किया, विशेष रूप से नियंत्रण सिद्धांत पर – एक ऐसा क्षेत्र जो गणित को लागू करने के लिए गणित को लागू करता है जो स्वचालित रूप से भौतिक प्रणालियों के व्यवहार को नियंत्रित करता है, जैसे कि पावर ग्रिड, विमान, कार और रोबोट। फिर, अपने वरिष्ठ वर्ष में, कार्लोन ने रोबोटिक्स पर एक कोर्स के लिए साइन अप किया, जिसमें हेरफेर में अग्रिमों का पता लगाया गया और कैसे रोबोट को स्थानांतरित करने और कार्य करने के लिए प्रोग्राम किया जा सकता है।
“यह पहली नजर में प्यार था। एक रोबोट के मस्तिष्क को विकसित करने और इसे स्थानांतरित करने और पर्यावरण के साथ बातचीत करने के लिए एल्गोरिदम और गणित का उपयोग करना सबसे अधिक पूर्ण अनुभवों में से एक है,” कार्लोन कहते हैं। “मैंने तुरंत फैसला किया कि मैं जीवन में क्या करना चाहता हूं।”
वह ट्यूरिन के पॉलिटेक्निक विश्वविद्यालय और मिलान के पॉलिटेक्निक विश्वविद्यालय में एक दोहरे डिग्री कार्यक्रम में चले गए, जहां उन्होंने क्रमशः मेकैट्रोनिक्स और ऑटोमेशन इंजीनियरिंग में मास्टर डिग्री प्राप्त की। इस कार्यक्रम के हिस्से के रूप में, जिसे अल्टा स्कूओला पोलिटेक्निका कहा जाता है, कार्लोन ने प्रबंधन में पाठ्यक्रम भी लिए, जिसमें वह और विभिन्न शैक्षणिक पृष्ठभूमि के छात्रों को एक नए उत्पाद डिजाइन के लिए एक विपणन पिच की अवधारणा, निर्माण और आकर्षित करने के लिए टीम बनानी थी। कार्लोन की टीम ने एक टच-फ्री टेबल लैंप विकसित किया, जो उपयोगकर्ता के हाथ से चलने वाले कमांड का पालन करने के लिए डिज़ाइन किया गया था। परियोजना ने उन्हें विभिन्न दृष्टिकोणों से इंजीनियरिंग के बारे में सोचने के लिए प्रेरित किया।
“यह अलग -अलग भाषाओं को बोलने की तरह था,” वे कहते हैं। “यह इंजीनियरिंग बुलबुले से परे देखने की आवश्यकता के लिए एक शुरुआती प्रदर्शन था और इस बारे में सोचें कि तकनीकी कार्य कैसे बनाया जाए जो वास्तविक दुनिया को प्रभावित कर सकता है।”
अगली पीढ़ी
कार्लोन मेक्ट्रोनिक्स में पीएचडी को पूरा करने के लिए ट्यूरिन में रहे। उस समय के दौरान, उन्हें एक थीसिस विषय चुनने की स्वतंत्रता दी गई थी, जिसके बारे में वह गया था, जैसा कि वह याद करता है, “थोड़ा भोलेपन से।”
“मैं एक विषय की खोज कर रहा था जिसे समुदाय को अच्छी तरह से समझा जाता था, और जिसके लिए कई शोधकर्ताओं का मानना था कि कहने के लिए और कुछ नहीं था।” कार्लोन कहते हैं। “मैंने इस विषय को कम करके आंका था कि यह विषय कैसे स्थापित था, और मुझे लगा कि मैं अभी भी इसमें कुछ नया योगदान दे सकता हूं, और मैं भाग्यशाली था कि मैं ऐसा करूं।”
प्रश्न में विषय “एक साथ स्थानीयकरण और मानचित्रण,” या स्लैम था – एक रोबोट के वातावरण के नक्शे को उत्पन्न करने और अद्यतन करने की समस्या थी, साथ ही साथ रोबोट उस वातावरण के भीतर जहां पर नज़र रखती है। कार्लोन समस्या को दूर करने के लिए एक रास्ता लेकर आया था, जैसे कि एल्गोरिदम एक प्रारंभिक अनुमान के साथ शुरू किए बिना अधिक सटीक नक्शे उत्पन्न कर सकता है, जैसा कि अधिकांश स्लैम विधियों ने उस समय किया था। उनके काम ने एक ऐसे क्षेत्र को खोलने में मदद की, जहां अधिकांश रोबोटिस्टों ने सोचा कि कोई मौजूदा एल्गोरिदम से बेहतर नहीं कर सकता है।
“स्लैम चीजों की ज्यामिति का पता लगाने के बारे में है और उन चीजों के बीच एक रोबोट कैसे चलता है,” कार्लोन कहते हैं। “अब मैं एक समुदाय का हिस्सा हूं, जो स्लैम की अगली पीढ़ी है?”
एक उत्तर की तलाश में, उन्होंने जॉर्जिया टेक में एक पोस्टडॉक स्थिति को स्वीकार किया, जहां वह कोडिंग और कंप्यूटर विजन में काम करते हैं – एक ऐसा क्षेत्र जो पूर्वव्यापी में, अंधेपन के साथ एक ब्रश से प्रेरित हो सकता है: जैसा कि वह इटली में पीएचडी को पूरा कर रहा था, उसे एक चिकित्सा जटिलता का सामना करना पड़ा, जिसने उसकी दृष्टि को गंभीर रूप से प्रभावित किया।
“एक साल के लिए, मैं आसानी से एक आंख खो सकता था,” कार्लोन कहते हैं। “यह कुछ ऐसा था जो मुझे दृष्टि के महत्व और कृत्रिम दृष्टि के बारे में सोच रहा था।”
वह अच्छी चिकित्सा देखभाल प्राप्त करने में सक्षम था, और स्थिति पूरी तरह से हल हो गई, जैसे कि वह अपना काम जारी रख सकता है। जॉर्जिया टेक में, उनके सलाहकार, फ्रैंक डेलार्ट ने उन्हें कंप्यूटर विजन में कोड करने के तरीके दिखाए और जटिल, तीन आयामी समस्याओं के सुरुचिपूर्ण गणितीय अभ्यावेदन तैयार किए। उनके सलाहकार भी एक ओपन-सोर्स स्लैम लाइब्रेरी विकसित करने वाले पहले लोगों में से एक थे, जिसे GTSAM कहा जाता है, जिसे कार्लोन ने जल्दी से एक अमूल्य संसाधन माना। अधिक मोटे तौर पर, उन्होंने देखा कि सभी को सॉफ्टवेयर उपलब्ध कराने से रोबोटिक्स में प्रगति के लिए एक बड़ी संभावना है।
“ऐतिहासिक रूप से, स्लैम में प्रगति बहुत धीमी रही है, क्योंकि लोगों ने अपने कोड को मालिकाना रखा है, और प्रत्येक समूह को अनिवार्य रूप से खरोंच से शुरू करना था,” कार्लोन कहते हैं। “तब ओपन-सोर्स पाइपलाइनों ने पॉप अप करना शुरू कर दिया, और यह एक गेम चेंजर था, जिसने पिछले 10 वर्षों में हमने जो प्रगति देखी है, वह काफी हद तक बढ़ गई है।”
स्थानिक एआई
जॉर्जिया टेक के बाद, कार्लोन 2015 में सूचना और निर्णय प्रणालियों (LIDS) के लिए प्रयोगशाला में एक पोस्टडॉक के रूप में MIT में आया। उस समय के दौरान, उन्होंने एरोनॉटिक्स और एस्ट्रोनॉटिक्स के प्रोफेसर, सर्टैक करमन के साथ सहयोग किया, जिसमें सॉफ्टवेयर विकसित करने में मदद करने के लिए पाम-आकार के ड्रोन बहुत कम ऑन-बोर्ड पावर का उपयोग करके अपने परिवेश को नेविगेट करने में मदद करते थे। एक साल बाद, उन्हें अनुसंधान वैज्ञानिक के रूप में पदोन्नत किया गया, और फिर 2017 में, कार्लोन ने एयरोस्ट्रो में एक संकाय की स्थिति स्वीकार कर ली।
“एक बात जो मुझे एमआईटी में प्यार हो गई थी, वह यह थी कि सभी निर्णय सवालों से प्रेरित होते हैं: हमारे मूल्य क्या हैं? हमारा मिशन क्या है? यह कम-स्तरीय लाभ के बारे में कभी नहीं है। प्रेरणा वास्तव में समाज को बेहतर बनाने के बारे में है,” कार्लोन कहते हैं। “एक मानसिकता के रूप में, यह बहुत ताज़ा रहा है।”
आज, कार्लोन का समूह एक रोबोट के परिवेश का प्रतिनिधित्व करने के तरीके विकसित कर रहा है, जो उनके ज्यामितीय आकार और शब्दार्थ को चित्रित करने से परे है। वह एल्गोरिदम को विकसित करने के लिए गहरी सीखने और बड़े भाषा मॉडल का उपयोग कर रहा है जो रोबोट को उच्च-स्तरीय लेंस के माध्यम से अपने वातावरण को देखने में सक्षम बनाता है, इसलिए बोलने के लिए। पिछले छह वर्षों में, उनकी प्रयोगशाला ने 60 से अधिक ओपन-सोर्स रिपॉजिटरी जारी की हैं, जिनका उपयोग दुनिया भर में हजारों शोधकर्ताओं और चिकित्सकों द्वारा किया जाता है। उनके काम का थोक एक बड़े, उभरते हुए क्षेत्र में फिट बैठता है, जिसे “स्थानिक एआई” के रूप में जाना जाता है।
“स्थानिक एआई स्टेरॉयड पर स्लैम की तरह है,” कार्लोन कहते हैं। “संक्षेप में, यह दुनिया को सोचने और समझने के लिए रोबोट को सक्षम करने के साथ करना है जैसा कि मनुष्य करते हैं, उन तरीकों से जो उपयोगी हो सकते हैं।”
यह एक बहुत बड़ा उपक्रम है, जो व्यापक प्रभाव डाल सकता है, अधिक सहज, इंटरैक्टिव रोबोट को घर पर, कार्यस्थल में, सड़कों पर और दूरदराज के और संभावित खतरनाक क्षेत्रों में मदद करने के लिए अधिक सहज, इंटरैक्टिव रोबोट को सक्षम करने के मामले में। कार्लोन का कहना है कि आगे बहुत काम होगा, ताकि मानव दुनिया को कैसे समझे, इसके करीब आने के लिए।
“मेरी 2 वर्षीय जुड़वां बेटियां हैं, और मैं उन्हें वस्तुओं में हेरफेर करते हुए देखता हूं, एक समय में 10 अलग-अलग खिलौनों को ले जाता हूं, आसानी से अव्यवस्थित कमरों में नेविगेट करता हूं, और जल्दी से नए वातावरण के लिए अनुकूलित करता हूं। रोबोट की धारणा अभी तक मेल नहीं खा सकती है, एक बच्चा क्या कर सकता है,” कार्लोन कहते हैं। “लेकिन हमारे पास शस्त्रागार में नए उपकरण हैं। और भविष्य उज्ज्वल है।”
।