Friday, April 4, 2025

स्नोफ्लेक ने एक्सट का प्रस्ताव किया: एक उपन्यास एआई फ्रेमवर्क जो ऑफ-पॉलिसी और ऑन-पॉलीसी डीपीओ के साथ सीओटी तर्क को मिलाकर ओपन-सोर्स एलएलएम को पुनरावृत्त रूप से अनुकूलित करता है, केवल प्रतिक्रिया के रूप में निष्पादन सटीकता पर निर्भर करता है – Gadgets Solutions

-

टेक्स्ट-टू-एसक्यूएल अनुवाद, प्राकृतिक भाषा के प्रश्नों को संरचित एसक्यूएल स्टेटमेंट में बदलने का कार्य, उपयोगकर्ता के अनुकूल डेटाबेस इंटरैक्शन की सुविधा के लिए आवश्यक है। हालांकि, कार्य में महत्वपूर्ण जटिलताएं शामिल हैं, विशेष रूप से स्कीमा लिंकिंग, कंपोजिटल एसक्यूएल सिंटैक्स को संभालना, और उपयोगकर्ता प्रश्नों में अस्पष्टताओं को हल करना। जबकि बड़ी भाषा मॉडल (एलएलएम) ने विभिन्न डोमेन में मजबूत क्षमताओं को दिखाया है, पाठ-से-एसक्यूएल संदर्भों के भीतर चेन-ऑफ-थॉ पर (सीओटी) जैसी संरचित तर्क तकनीकों की प्रभावकारिता सीमित बनी हुई है। पूर्व-कठोर कार्यप्रणाली के लिए आवश्यकता को इंगित करते हुए, संरचित तर्क के बिना शून्य-शॉट सीओटी या प्रत्यक्ष वरीयता अनुकूलन (डीपीओ) को नियोजित करने वाले पूर्व प्रयासों ने सीमांत सुधारों का संकेत दिया।

स्नोफ्लेक एक्सॉट का परिचय देता है, एक संरचित ढांचा, जिसे सीओटी तर्क और पुनरावृत्ति वरीयता अनुकूलन के संयोजन के माध्यम से ओपन-सोर्स एलएलएम को अनुकूलित करने के लिए डिज़ाइन किया गया है, विशेष रूप से ऑफ-पॉलिसी और ऑन-पॉलीसी डीपीओ का उपयोग विशेष रूप से निष्पादन सटीकता प्रतिक्रिया द्वारा निर्देशित किया गया है। EXCOT बाहरी इनाम मॉडल और मानव एनोटेशन के साथ फैलाव करता है, आंतरिक रूप से उत्पन्न तर्क चरणों और निष्पादन परिणामों पर निर्भर करता है। विधि दो प्रमुख चरणों में संचालित होती है: शुरू में, यह ऑफ-पॉलीसी डीपीओ के माध्यम से मान्य उम्मीदवार सीओटी डेटा उत्पन्न करता है, जो पर्यवेक्षित फाइन-ट्यूनिंग के लिए आधार बनाता है। इसके बाद, मॉडल पुनरावृत्त रूप से ऑन-पॉलीसी डीपीओ के माध्यम से सीओटी डेटा को उत्पन्न और परिष्कृत करता है, जिससे निष्पादन शुद्धता से प्राप्त प्रतिक्रिया के माध्यम से सटीकता में सुधार होता है।

स्नोफ्लेक ने एक्सट का प्रस्ताव किया: एक उपन्यास एआई फ्रेमवर्क जो ऑफ-पॉलिसी और ऑन-पॉलीसी डीपीओ के साथ सीओटी तर्क को मिलाकर ओपन-सोर्स एलएलएम को पुनरावृत्त रूप से अनुकूलित करता है, केवल प्रतिक्रिया के रूप में निष्पादन सटीकता पर निर्भर करता है
 – Gadgets Solutions

EXCOT विस्तृत COT तर्क को नियोजित करता है, विशेष रूप से एक विभाजन-और-विजेता रणनीति को अपनाता है जिसमें जटिल प्रश्नों को सरल उप-क्वेरी में विघटित किया जाता है। प्रत्येक उप-क्वेरी का विश्लेषण किया जाता है और एक सुसंगत अंतिम क्वेरी में एकीकृत होने से पहले स्वतंत्र रूप से हल किया जाता है। यह संरचित अपघटन मॉडल को SQL संचालन में सामान्य रूप से अधिक प्रभावी ढंग से जटिलता और नेस्टेड संरचनाओं का प्रबंधन करने में सक्षम बनाता है। निष्पादन-आधारित सत्यापन शुद्धता मूल्यांकन के लिए मुख्य तंत्र के रूप में कार्य करता है, जहां उत्पन्न क्वेरी को जमीनी-सत्य परिणामों के खिलाफ उनके निष्पादन आउटपुट की तुलना करके मान्य किया जाता है। गलत और सही प्रश्नों को व्यवस्थित रूप से जोड़ा जाता है, जो वरीयता-आधारित सीखने के लिए स्पष्ट संकेत प्रदान करता है। ऑन-पॉलीसी डीपीओ चरण में पुनरावृत्ति शोधन मॉडल की तर्क सटीकता को उत्तरोत्तर बढ़ाता है।

EXCOT के प्रायोगिक मूल्यांकन ने निष्पादन सटीकता में महत्वपूर्ण सुधारों का प्रदर्शन किया। विशेष रूप से, LLAMA-3.1 70B मॉडल के साथ, EXCOT ने 57.37% से 68.51% से बर्ड डेवलपमेंट सेट पर निष्पादन सटीकता को ऊंचा किया, और स्पाइडर टेस्ट सेट प्रदर्शन को 78.81% से बढ़ाकर 86.59% तक बढ़ा दिया। तुलनात्मक प्रदर्शन संवर्द्धन QWEN-2.5-Coder 32B मॉडल के साथ दर्ज किए गए थे। ये परिणाम इन बेंचमार्क के लिए एकल-मॉडल मूल्यांकन में एक अग्रणी दृष्टिकोण के रूप में Excot की स्थिति, Xiyansql और Openai वेरिएंट सहित मालिकाना मॉडल जैसे स्थापित तरीकों को पार करते हैं। विशेष रूप से, सुधारों ने लगातार उच्च क्वेरी वैधता दर (98%से अधिक) को बनाए रखा, सिंटैक्टिक परिशुद्धता के साथ सिमेंटिक शुद्धता में वृद्धि की पुष्टि की।

अंत में, EXCOT टेक्स्ट-टू-एसक्यूएल कार्यों पर लागू ओपन-सोर्स एलएलएम के लिए संरचित तर्क अनुकूलन में एक व्यवस्थित प्रगति का प्रतिनिधित्व करता है। वरीयता अनुकूलन के साथ संरचित सीओटी तर्क को एकीकृत करके, केवल निष्पादन-आधारित प्रतिक्रिया द्वारा निर्देशित, EXCOT प्रभावी रूप से पिछले तरीकों में पहचाने गए सीमाओं को संबोधित करता है। इसकी पुनरावृत्ति शोधन क्षमता बाहरी इनाम संरचनाओं या मैनुअल एनोटेशन पर निर्भरता के बिना निरंतर सुधार सुनिश्चित करती है। आगे के शोध इस ढांचे को अधिक जटिल स्कीमा वातावरण और अतिरिक्त संरचित तर्क कार्यों के लिए बढ़ा सकते हैं, इस प्रकार संरचित क्वेरी उत्पादन संदर्भों में एलएलएम की प्रयोज्यता और विश्वसनीयता को व्यापक बना सकते हैं।


चेक आउट कागज, github पृष्ठ और विवरण। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट

🔥


Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

FOLLOW US

150,000FansLike
35,000FollowersFollow
100,000SubscribersSubscribe

Related Stories

Translate »