LightProf: एक हल्के एआई फ्रेमवर्क जो छोटे पैमाने पर भाषा मॉडल को ज्ञान ग्राफ़ (KGS) पर जटिल तर्क देने में सक्षम बनाता है, जो संरचित संकेतों का उपयोग कर रहा है – Gadgets Solutions

बड़े भाषा मॉडल (एलएलएम) ने प्राकृतिक भाषा प्रसंस्करण में क्रांति ला दी है, जिसमें व्यापक प्रशिक्षण डेटा और विशाल मापदंडों के माध्यम से जटिल शून्य-शॉट कार्यों पर क्षमताओं के साथ। हालांकि, एलएलएम अक्सर सीमित कार्य-विशिष्ट पूर्व ज्ञान और समझ क्षमताओं के कारण ज्ञान-गहन कार्यों के साथ संघर्ष करते हैं। एलएलएम को प्रभावी तर्क के लिए विश्वसनीय और लगातार अद्यतन किए गए ज्ञान के आधार तक पहुंच की आवश्यकता है, ज्ञान रेखांकन (केजी) अपने संरचित सिमेंटिक फ्रेमवर्क के कारण आदर्श उम्मीदवार होने के साथ। केजीएस पर एलएलएम तर्क के लिए वर्तमान दृष्टिकोण दो बाधाओं का सामना करते हैं: व्यापक पाठ के रूप में केजी सामग्री का प्रतिनिधित्व करना ग्राफ संरचना के भीतर समृद्ध तार्किक संबंधों को व्यक्त करने में विफल रहता है, और पुनर्प्राप्ति और तर्क प्रक्रियाएं कई एलएलएम कॉल और पर्याप्त तर्क शक्ति की मांग करती हैं।

प्रॉम्प्ट इंजीनियरिंग मॉडल मापदंडों को संशोधित किए बिना विभिन्न अनुप्रयोगों में एलएलएम क्षमताओं का विस्तार करने के लिए एक महत्वपूर्ण तकनीक के रूप में उभरा है। यह क्षेत्र सरल शून्य-शॉट से विकसित हुआ है और कुछ-शॉट चेन-ऑफ-थॉट (कॉट), ट्री-ऑफ-थॉट्स (टोट), और ग्राफ-ऑफ-थॉट्स (गॉट) जैसे अधिक जटिल दृष्टिकोणों के लिए संकेत देता है। केजी-आधारित एलएलएम तर्क ने कर्षण प्राप्त किया है क्योंकि केजी स्पष्ट, संरचित ज्ञान प्रदान करते हैं जो स्पष्ट तार्किक संरचनाओं के साथ एलएलएमएस के ज्ञान जागरूकता को बढ़ाता है। Kaping, KGGPT, STRUCTGPT, TOG, और KNOWLEDGENAVIGATOR जैसे अधिक लचीले समाधान LLM को सिमेंटिक समानता पुनर्प्राप्ति, मल्टी-स्टेप रीज़निंग फ्रेमवर्क, और बीम खोज के साथ विभिन्न तकनीकों के साथ KG तथ्यात्मक जानकारी का उपयोग करते हुए किलो की खोज क्षमताओं को बढ़ाने के लिए KGs पर संकेत देता है।

बीजिंग विश्वविद्यालय के पदों और दूरसंचार के शोधकर्ताओं, हांग्जो डियानजी विश्वविद्यालय, सिंगापुर प्रबंधन विश्वविद्यालय, नेशनल यूनिवर्सिटी ऑफ सिंगापुर, चीनी विज्ञान अकादमी में कंप्यूटिंग टेक्नोलॉजी इंस्टीट्यूट, और शीआन जियाओटोंग विश्वविद्यालय ने लाइटप्रोफ, एक लाइटवेट और कुशल त्वरित सीखने के फ्रेमवर्क का प्रस्ताव दिया है। Retevembed-Reason फ्रेमवर्क छोटे पैमाने पर LLM को KGS पर स्थिर पुनर्प्राप्ति और कुशल तर्क करने में सक्षम बनाता है। इसमें तीन मुख्य घटक शामिल हैं: पुनर्प्राप्ति, एम्बेडिंग और तर्क मॉड्यूल। पुनर्प्राप्ति संबंधों का उपयोग मौलिक पुनर्प्राप्ति इकाइयों के रूप में करता है और प्रश्न शब्दार्थ के आधार पर गुंजाइश को सीमित करता है, एम्बेडिंग एक कॉम्पैक्ट ट्रांसफार्मर-आधारित ज्ञान एडाप्टर का उपयोग करता है, और तर्क ने ध्यान से डिजाइन किए गए संकेतों के साथ एम्बेडेड प्रतिनिधित्व वैक्टर को जोड़ती है। LightProf प्रशिक्षण के दौरान केवल ज्ञान एडाप्टर ट्यूनिंग की आवश्यकता होती है, जबकि LightProf विभिन्न ओपन-सोर्स LLMS और KGs का समर्थन करता है।

LightProf: एक हल्के एआई फ्रेमवर्क जो छोटे पैमाने पर भाषा मॉडल को ज्ञान ग्राफ़ (KGS) पर जटिल तर्क देने में सक्षम बनाता है, जो संरचित संकेतों का उपयोग कर रहा है
– Gadgets Solutions

LightProf का मूल्यांकन दो फ्रीबेस-आधारित सार्वजनिक डेटासेट पर किया जाता है: WebQuestionsSp (WebQsp) और ComplexWebquestions (CWQ)। WebQSP कम प्रश्नों (4,737) के साथ एक बेंचमार्क के रूप में कार्य करता है, लेकिन एक बड़ा किलो, और CWQ कॉम्प्लेक्स किलो प्रश्न के लिए डिज़ाइन किया गया है, जो WebQSP पर निर्मित 34,689 प्रश्न-उत्तर जोड़े के साथ उत्तर देता है। प्रदर्शन को मैच सटीकता (हिट्स@1) का उपयोग करके मापा जाता है, जो मूल्यांकन करता है कि क्या मॉडल का शीर्ष उत्तर सही है। LightProf की तुलना बेसलाइन विधियों की तीन श्रेणियों के खिलाफ की जाती है: पूर्ण ठीक-ट्यूनिंग दृष्टिकोण (KV-MEM, EmbedKGQA, ट्रांसफरनेट, NSM, आदि), वेनिला LLM विधियों (Llama श्रृंखला मॉडल की विशेषता), और LLM+KGS विधियों (जैसे कि स्ट्रक्चरगिप्ट, टॉगल, जानकार, और एजेंटबेंच)।

LightProf अत्याधुनिक मॉडल को महत्वपूर्ण रूप से बेहतर बनाता है, WebQSP डेटासेट पर 83.7% सटीकता और अधिक चुनौतीपूर्ण CWQ डेटासेट पर 59.3% प्राप्त करता है। ये परिणाम किलो प्रश्न के उत्तर देने में मल्टी-हॉप और जटिल तर्क चुनौतियों को संभालने में लाइटप्रोफ की प्रभावशीलता को मान्य करते हैं। फ्रेमवर्क के भीतर विभिन्न एलएलएम को एकीकृत करते समय, लाइटप्रोफ मूल मॉडल की आधारभूत क्षमताओं की परवाह किए बिना लगातार प्रदर्शन को बढ़ाता है। यह प्लग-एंड-प्ले इंटीग्रेशन रणनीति महंगी एलएलएम फाइन-ट्यूनिंग की आवश्यकता को समाप्त करती है। स्ट्रक्चरगिप्ट के खिलाफ दक्षता मूल्यांकन लाइटप्रोफ के बेहतर संसाधन उपयोग को प्रकट करता है, प्रसंस्करण समय में 30% की कमी, इनपुट टोकन उपयोग में 98% की कमी, और प्रति अनुरोध में काफी कम टोकन।

अंत में, शोधकर्ताओं ने लाइटप्रोफ, एक उपन्यास ढांचा पेश किया, जो एलएलएम के तर्क को सटीक पुनर्प्राप्ति और कुशल एन्कोडिंग के माध्यम से बढ़ाता है। यह इकाइयों के रूप में स्थिर संबंधों का उपयोग करके KGs का नमूना लेकर पुनर्प्राप्ति गुंजाइश का वर्णन करता है। शोधकर्ताओं ने एक जटिल ज्ञान एडेप्टर विकसित किया जो प्रभावी रूप से ग्राफ संरचनाओं को पार्स करता है और छोटे एलएलएम के साथ कुशल तर्क को सक्षम करने के लिए सूचना को एकीकृत करता है। यह प्रोजेक्टर घटक के माध्यम से एलएलएम इनपुट स्पेस के साथ व्यापक संरेखण प्राप्त करते हुए कम टोकन में ग्राफ़ को कम करने के लिए मानता है। भविष्य के अनुसंधान दिशाओं में मजबूत सामान्यीकरण क्षमताओं के साथ केजी एनकोडर विकसित करना शामिल है, जिन्हें मल्टीमॉडल किलो को संभालने में सक्षम एकीकृत क्रॉस-मोडल एनकोडर को पीछे हटाने और डिजाइन किए बिना अनदेखी केजी डेटा पर लागू किया जा सकता है।

चेक आउट कागज़। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।

सज्जाद अंसारी IIT खड़गपुर से अंतिम वर्ष के स्नातक हैं। एक तकनीकी उत्साही के रूप में, वह एआई प्रौद्योगिकियों के प्रभाव और उनके वास्तविक दुनिया के निहितार्थों के प्रभाव को समझने पर ध्यान देने के साथ एआई के व्यावहारिक अनुप्रयोगों में देरी करता है। वह स्पष्ट और सुलभ तरीके से जटिल एआई अवधारणाओं को स्पष्ट करने का लक्ष्य रखता है।

नेशनल ज्योग्राफिक द्वारा अपनी तस्वीरों को साझा करने के लिए यहां आपका शॉट है – Gadgets Solutions

स्टेप बाय स्टेप गाइड को टेक्स्ट को उच्च-गुणवत्ता वाले ऑडियो में परिवर्तित करने पर एक ओपन सोर्स टीटीएस मॉडल का उपयोग करके हगिंग फेस का उपयोग करना: पायथन में विस्तृत ऑडियो फाइल विश्लेषण और डायग्नोस्टिक टूल्स सहित – Gadgets Solutions

LEAVE A REPLY Cancel reply

FOLLOW US

LATEST POSTS

Related Stories

EDITOR PICKS

POPULAR POSTS

POPULAR CATEGORY

ABOUT US

FOLLOW US