Tuesday, April 8, 2025

एंथ्रोपिक से यह एआई पेपर एट्रिब्यूशन ग्राफ़ का परिचय देता है: क्लाउड 3.5 हाइकू में आंतरिक तर्क का पता लगाने के लिए एक नई व्याख्या विधि – Gadgets Solutions

-

जबकि बड़ी भाषा मॉडल (एलएलएम) के आउटपुट सुसंगत और उपयोगी दिखाई देते हैं, इन व्यवहारों का मार्गदर्शन करने वाले अंतर्निहित तंत्र काफी हद तक अज्ञात रहते हैं। चूंकि ये मॉडल तेजी से संवेदनशील और उच्च-दांव वातावरण में तैनात हो रहे हैं, इसलिए यह समझना महत्वपूर्ण हो गया है कि वे क्या करते हैं और वे कैसे करते हैं।

मुख्य चुनौती आंतरिक चरणों को उजागर करने में निहित है जो एक मॉडल को एक विशिष्ट प्रतिक्रिया के लिए ले जाता है। गणना सैकड़ों परतों और अरबों मापदंडों में होती है, जिससे इसमें शामिल प्रक्रियाओं को अलग करना मुश्किल हो जाता है। इन चरणों की स्पष्ट समझ के बिना, उनके व्यवहार पर भरोसा करना या डीबग करना कठिन हो जाता है, विशेष रूप से तर्क, योजना, या तथ्यात्मक विश्वसनीयता की आवश्यकता वाले कार्यों में। शोधकर्ता इस प्रकार इन मॉडलों को रिवर्स-इंजीनियरिंग पर ध्यान केंद्रित करते हैं ताकि यह पता लगाया जा सके कि आंतरिक रूप से सूचना और निर्णय कैसे किए जाते हैं।

मौजूदा व्याख्या के तरीके जैसे कि ध्यान दें और फ़ीचर एट्रिब्यूशन मॉडल व्यवहार में आंशिक दृश्य पेश करते हैं। जबकि ये उपकरण इस बात को उजागर करने में मदद करते हैं कि इनपुट टोकन आउटपुट में योगदान करते हैं, वे अक्सर तर्क की पूरी श्रृंखला का पता लगाने या मध्यवर्ती चरणों की पहचान करने में विफल होते हैं। इसके अलावा, ये उपकरण आमतौर पर सतह-स्तरीय व्यवहारों पर ध्यान केंद्रित करते हैं और गहरी कम्प्यूटेशनल संरचनाओं में लगातार अंतर्दृष्टि प्रदान नहीं करते हैं। इसने कई चरणों में आंतरिक अभ्यावेदन के माध्यम से तर्क का पता लगाने के लिए अधिक संरचित, बारीक-दाने वाले तरीकों की आवश्यकता पैदा की है।

एंथ्रोपिक से यह एआई पेपर एट्रिब्यूशन ग्राफ़ का परिचय देता है: क्लाउड 3.5 हाइकू में आंतरिक तर्क का पता लगाने के लिए एक नई व्याख्या विधि
 – Gadgets Solutions

इसे संबोधित करने के लिए, एंथ्रोपिक के शोधकर्ताओं ने एक नई तकनीक पेश की, जिसे एट्रिब्यूशन ग्राफ़ कहा जाता है। ये रेखांकन शोधकर्ताओं को एकल फॉरवर्ड पास के दौरान एक मॉडल के भीतर सुविधाओं के बीच सूचना के आंतरिक प्रवाह का पता लगाने की अनुमति देते हैं। ऐसा करने से, वे मध्यवर्ती अवधारणाओं या तर्क चरणों की पहचान करने का प्रयास करते हैं जो अकेले मॉडल के आउटपुट से दिखाई नहीं देते हैं। एट्रिब्यूशन रेखांकन कम्प्यूटेशनल पाथवे के बारे में परिकल्पना उत्पन्न करते हैं, जो एक मॉडल का अनुसरण करता है, जिसे तब गड़बड़ी प्रयोगों का उपयोग करके परीक्षण किया जाता है। यह दृष्टिकोण बड़े मॉडलों के “वायरिंग आरेख” को प्रकट करने की दिशा में एक महत्वपूर्ण कदम है, बहुत कुछ जैसे कि न्यूरोसाइंटिस्ट मस्तिष्क गतिविधि को कैसे मैप करते हैं।

शोधकर्ताओं ने अक्टूबर 2024 में एन्थ्रोपिक द्वारा जारी एक हल्के भाषा मॉडल को क्लाउड 3.5 हाइकू के लिए एट्रिब्यूशन ग्राफ लागू किया। यह विधि एक विशिष्ट इनपुट द्वारा सक्रिय व्याख्या योग्य विशेषताओं की पहचान करके शुरू होती है। इन सुविधाओं को अंतिम आउटपुट पर उनके प्रभाव को निर्धारित करने के लिए पता लगाया जाता है। उदाहरण के लिए, जब एक पहेली या कविता के साथ संकेत दिया जाता है, तो मॉडल लाइनों को लिखने से पहले तुकबंदी शब्दों के एक सेट का चयन करता है, योजना का एक रूप। एक अन्य उदाहरण में, मॉडल इस सवाल का जवाब देने के लिए एक मध्यवर्ती कदम के रूप में “टेक्सास” की पहचान करता है, “डलास युक्त राज्य की राजधानी क्या है?” जिसे यह सही ढंग से “ऑस्टिन” के रूप में हल करता है। रेखांकन मॉडल आउटपुट को प्रकट करते हैं और यह आंतरिक रूप से विचारों के बीच कैसे प्रतिनिधित्व करता है और संक्रमण करता है।

एट्रिब्यूशन ग्राफ के प्रदर्शन के परिणामों ने क्लाउड 3.5 हाइकू के भीतर कई उन्नत व्यवहारों को उजागर किया। कविता कार्यों में, मॉडल पूर्व-योजनाओं को प्रत्येक पंक्ति की रचना करने से पहले शब्दों को गाया जाता है, जो अग्रिम तर्क दिखाते हैं। मल्टी-हॉप प्रश्नों में, मॉडल आंतरिक मध्यवर्ती अभ्यावेदन बनाता है, जैसे कि उत्तर के रूप में ऑस्टिन का निर्धारण करने से पहले टेक्सास के साथ डलास को जोड़ना। यह बहुभाषी इनपुट के लिए भाषा-विशिष्ट और अमूर्त सर्किट दोनों का लाभ उठाता है, बाद में पहले के मॉडलों की तुलना में क्लाउड 3.5 हाइकू में अधिक प्रमुख हो गया है। इसके अलावा, मॉडल चिकित्सा तर्क कार्यों में आंतरिक रूप से निदान करता है और अनुवर्ती प्रश्नों को सूचित करने के लिए उनका उपयोग करता है। इन निष्कर्षों से पता चलता है कि मॉडल स्पष्ट निर्देश के बिना योजना, आंतरिक लक्ष्य-निर्धारण और स्टेपवाइज तार्किक कटौती को अमूर्त कर सकता है।

यह शोध एक मूल्यवान व्याख्या उपकरण के रूप में एट्रिब्यूशन ग्राफ़ प्रस्तुत करता है जो भाषा मॉडल में तर्क की छिपी परतों को प्रकट करता है। इस पद्धति को लागू करके, एंथ्रोपिक की टीम ने दिखाया है कि क्लाउड 3.5 हाइकू जैसे मॉडल केवल मानवीय प्रतिक्रियाओं की नकल नहीं करते हैं – वे स्तरित, संरचित चरणों के माध्यम से गणना करते हैं। यह मॉडल व्यवहार के गहरे ऑडिट के लिए दरवाजा खोलता है, जिससे उन्नत एआई सिस्टम की अधिक पारदर्शी और जिम्मेदार तैनाती की अनुमति मिलती है।


चेक आउट कागज़। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट

🔥


निखिल मार्कटेकपोस्ट में एक प्रशिक्षु सलाहकार है। वह भारतीय प्रौद्योगिकी संस्थान, खड़गपुर में सामग्रियों में एक एकीकृत दोहरी डिग्री का पीछा कर रहा है। निखिल एक एआई/एमएल उत्साही है जो हमेशा बायोमैटेरियल्स और बायोमेडिकल साइंस जैसे क्षेत्रों में अनुप्रयोगों पर शोध कर रहा है। भौतिक विज्ञान में एक मजबूत पृष्ठभूमि के साथ, वह नई प्रगति की खोज कर रहा है और योगदान करने के अवसर पैदा कर रहा है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

FOLLOW US

150,000FansLike
35,000FollowersFollow
100,000SubscribersSubscribe

Related Stories

Translate »