Saturday, April 19, 2025

विज़न-आधारित स्पर्श सेंसर में शून्य-शॉट ट्रांसफर के लिए सेंसर-अपरिवर्तनीय स्पर्श प्रतिनिधित्व – Gadgets Solutions

-

स्पर्शक संवेदी भौतिक दुनिया के साथ विचार करने और बातचीत करने के लिए बुद्धिमान प्रणालियों के लिए एक महत्वपूर्ण तौर -तरीक है। गेलसाइट सेंसर और इसके वेरिएंट प्रभावशाली स्पर्श प्रौद्योगिकियों के रूप में उभरे हैं, जो स्पर्श डेटा को दृश्य छवियों में बदलकर संपर्क सतहों के बारे में विस्तृत जानकारी प्रदान करते हैं। हालांकि, दृष्टि-आधारित स्पर्शक संवेदी में डिजाइन और विनिर्माण विविधताओं के कारण सेंसर के बीच हस्तांतरणीयता का अभाव है, जिसके परिणामस्वरूप स्पर्श संकेतों में महत्वपूर्ण अंतर होता है। ऑप्टिकल डिज़ाइन या विनिर्माण प्रक्रियाओं में मामूली अंतर सेंसर आउटपुट में पर्याप्त विसंगतियां पैदा कर सकते हैं, जिससे मशीन लर्निंग मॉडल एक सेंसर पर प्रशिक्षित होते हैं, जो दूसरों पर लागू होने पर खराब प्रदर्शन करते हैं।

कंप्यूटर विजन मॉडल को व्यापक रूप से उनके स्वाभाविक दृश्य प्रकृति के कारण दृष्टि-आधारित स्पर्श छवियों पर लागू किया गया है। शोधकर्ताओं ने दृष्टि समुदाय से प्रतिनिधित्व सीखने के तरीकों को अनुकूलित किया है, जिसमें विपरीत सीखने के लिए विशिष्ट कार्यों के लिए स्पर्श और दृश्य-टक्टाइल अभ्यावेदन विकसित करने के लिए लोकप्रिय है। ऑटो-एन्कोडिंग प्रतिनिधित्व दृष्टिकोण भी खोजे जाते हैं, कुछ शोधकर्ताओं ने स्पर्श अभ्यावेदन सीखने के लिए नकाबपोश ऑटो-एन्कोडर (एमएई) का उपयोग किया है। सामान्य-उद्देश्य मल्टीमॉडल अभ्यावेदन जैसे तरीके एलएलएम फ्रेमवर्क में कई स्पर्शात्मक डेटासेट का उपयोग करते हैं, टोकन के रूप में सेंसर प्रकारों को एन्कोडिंग करते हैं। इन प्रयासों के बावजूद, वर्तमान तरीकों को अक्सर बड़े डेटासेट की आवश्यकता होती है, सेंसर प्रकारों को निश्चित श्रेणियों के रूप में माना जाता है, और अनदेखी सेंसर को सामान्य बनाने के लिए लचीलेपन की कमी होती है।

इलिनोइस विश्वविद्यालय के शोधकर्ताओं ने उरबाना-शैंपेन के शोधकर्ताओं ने सेंसर-इनवेरिएंट स्पर्श अभ्यावेदन (एसआईटीआर) प्रस्तावित किया, जो एक शून्य-शॉट तरीके से विभिन्न विज़न-आधारित स्पर्शक सेंसर में स्थानांतरित करने के लिए एक स्पर्शनीय प्रतिनिधित्व था। यह इस आधार पर आधारित है कि सेंसर हस्तांतरणीयता को प्राप्त करने के लिए विविध सेंसर विविधताओं के संपर्क में आने के माध्यम से प्रभावी सेंसर-अपरिवर्तनीय अभ्यावेदन सीखने की आवश्यकता होती है। यह तीन मुख्य नवाचारों का उपयोग करता है: एक ट्रांसफॉर्मर एनकोडर के साथ व्यक्तिगत सेंसर को चिह्नित करने के लिए आसान-से-एक्वायर कैलिब्रेशन छवियों का उपयोग करना, कई सेंसर में स्पर्श डेटा के ज्यामितीय पहलुओं पर जोर देने के लिए पर्यवेक्षित विपरीत सीखने का उपयोग करना, और एक बड़े पैमाने पर सिंथेटिक डेटासेट विकसित करना जो 100 सेंसर कॉन्फ़िगरेशन में 1M उदाहरणों में शामिल होता है।

विज़न-आधारित स्पर्श सेंसर में शून्य-शॉट ट्रांसफर के लिए सेंसर-अपरिवर्तनीय स्पर्श प्रतिनिधित्व
 – Gadgets Solutions

शोधकर्ताओं ने टकराने की छवि और सेंसर के लिए अंशांकन छवियों का एक सेट नेटवर्क के लिए इनपुट के रूप में उपयोग किया। सेंसर पृष्ठभूमि को पिक्सेल-वार रंग परिवर्तनों को अलग करने के लिए सभी इनपुट छवियों से घटाया जाता है। विज़न ट्रांसफार्मर (वीआईटी) के बाद, इन छवियों को रेखीय रूप से टोकन में अनुमानित किया जाता है, अंशांकन छवियों के साथ केवल एक बार प्रति सेंसर के लिए टोकन की आवश्यकता होती है। इसके अलावा, दो पर्यवेक्षण संकेत प्रशिक्षण प्रक्रिया का मार्गदर्शन करते हैं: आउटपुट पैच टोकन के लिए एक पिक्सेल-वार नॉर्मल मैप पुनर्निर्माण हानि और क्लास टोकन के लिए एक विपरीत हानि। प्री-ट्रेनिंग के दौरान, एक हल्का डिकोडर एनकोडर के आउटपुट से एक सामान्य मानचित्र के रूप में संपर्क सतह को फिर से संगठित करता है। इसके अलावा, SITR समानता को परिभाषित करने के लिए लेबल की जानकारी का उपयोग करके पारंपरिक विपरीत दृष्टिकोणों का विस्तार करते हुए, पर्यवेक्षित कंट्रास्टिव लर्निंग (SCL) को नियुक्त करता है।

शोधकर्ताओं के वास्तविक दुनिया डेटासेट का उपयोग करते हुए ऑब्जेक्ट वर्गीकरण परीक्षणों में, SITR विभिन्न सेंसर में स्थानांतरित होने पर सभी बेसलाइन मॉडल को बेहतर बनाता है। जबकि अधिकांश मॉडल नो-ट्रांसफर सेटिंग्स में अच्छा प्रदर्शन करते हैं, वे अलग-अलग सेंसर पर परीक्षण करने पर सामान्यीकरण करने में विफल होते हैं। यह SITR की सार्थक, सेंसर-अपरिवर्तनीय सुविधाओं को पकड़ने की क्षमता को दर्शाता है जो सेंसर डोमेन में बदलाव के बावजूद मजबूत बने हुए हैं। पोज़ आकलन कार्यों में, जहां लक्ष्य प्रारंभिक और अंतिम स्पर्श छवियों का उपयोग करके 3-डीओएफ स्थिति परिवर्तनों का अनुमान लगाना है, एसआईटीआर बेसलाइन की तुलना में लगभग 50% तक रूट माध्य वर्ग त्रुटि को कम करता है। वर्गीकरण परिणामों के विपरीत, इमेजनेट पूर्व-प्रशिक्षण केवल मामूली रूप से मुद्रा अनुमान प्रदर्शन में सुधार करता है, यह दर्शाता है कि प्राकृतिक छवियों से सीखी गई विशेषताएं सटीक प्रतिगमन कार्यों के लिए स्पर्श डोमेन में प्रभावी रूप से स्थानांतरित नहीं हो सकती हैं।

इस पत्र में, शोधकर्ताओं ने SITR को पेश किया, जो एक स्पर्शनीय प्रतिनिधित्व ढांचा है जो विभिन्न दृष्टि-आधारित स्पर्शक सेंसर में एक शून्य-शॉट तरीके से स्थानांतरित होता है। उन्होंने सिंथेटिक और वास्तविक दुनिया के डेटा का उपयोग करके बड़े पैमाने पर, सेंसर-संरेखित डेटासेट का निर्माण किया और घने, सेंसर-अपरिवर्तनीय सुविधाओं को पकड़ने के लिए SITR को प्रशिक्षित करने के लिए एक विधि विकसित की। SITR स्पर्शक संवेदन के लिए एक एकीकृत दृष्टिकोण की ओर एक कदम का प्रतिनिधित्व करता है, जहां मॉडल बिना किसी रिट्रेनिंग या फाइन-ट्यूनिंग के विभिन्न सेंसर प्रकारों में मूल रूप से सामान्य रूप से सामान्य हो सकते हैं। इस सफलता में इन होनहार सेंसर प्रौद्योगिकियों को अपनाने और कार्यान्वयन के लिए एक महत्वपूर्ण बाधा को हटाकर रोबोटिक हेरफेर और स्पर्श अनुसंधान में प्रगति को तेज करने की क्षमता है।


चेक आउट कागज और कोड। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट

🔥


सज्जाद अंसारी IIT खड़गपुर से अंतिम वर्ष के स्नातक हैं। एक तकनीकी उत्साही के रूप में, वह एआई प्रौद्योगिकियों के प्रभाव और उनके वास्तविक दुनिया के निहितार्थों के प्रभाव को समझने पर ध्यान देने के साथ एआई के व्यावहारिक अनुप्रयोगों में देरी करता है। वह स्पष्ट और सुलभ तरीके से जटिल एआई अवधारणाओं को स्पष्ट करने का लक्ष्य रखता है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

FOLLOW US

150,000FansLike
35,000FollowersFollow
100,000SubscribersSubscribe

Related Stories

Translate »