टेक्स्ट-टू-एसक्यूएल अनुवाद, प्राकृतिक भाषा के प्रश्नों को संरचित एसक्यूएल स्टेटमेंट में बदलने का कार्य, उपयोगकर्ता के अनुकूल डेटाबेस इंटरैक्शन की सुविधा के लिए आवश्यक है। हालांकि, कार्य में महत्वपूर्ण जटिलताएं शामिल हैं, विशेष रूप से स्कीमा लिंकिंग, कंपोजिटल एसक्यूएल सिंटैक्स को संभालना, और उपयोगकर्ता प्रश्नों में अस्पष्टताओं को हल करना। जबकि बड़ी भाषा मॉडल (एलएलएम) ने विभिन्न डोमेन में मजबूत क्षमताओं को दिखाया है, पाठ-से-एसक्यूएल संदर्भों के भीतर चेन-ऑफ-थॉ पर (सीओटी) जैसी संरचित तर्क तकनीकों की प्रभावकारिता सीमित बनी हुई है। पूर्व-कठोर कार्यप्रणाली के लिए आवश्यकता को इंगित करते हुए, संरचित तर्क के बिना शून्य-शॉट सीओटी या प्रत्यक्ष वरीयता अनुकूलन (डीपीओ) को नियोजित करने वाले पूर्व प्रयासों ने सीमांत सुधारों का संकेत दिया।
स्नोफ्लेक एक्सॉट का परिचय देता है, एक संरचित ढांचा, जिसे सीओटी तर्क और पुनरावृत्ति वरीयता अनुकूलन के संयोजन के माध्यम से ओपन-सोर्स एलएलएम को अनुकूलित करने के लिए डिज़ाइन किया गया है, विशेष रूप से ऑफ-पॉलिसी और ऑन-पॉलीसी डीपीओ का उपयोग विशेष रूप से निष्पादन सटीकता प्रतिक्रिया द्वारा निर्देशित किया गया है। EXCOT बाहरी इनाम मॉडल और मानव एनोटेशन के साथ फैलाव करता है, आंतरिक रूप से उत्पन्न तर्क चरणों और निष्पादन परिणामों पर निर्भर करता है। विधि दो प्रमुख चरणों में संचालित होती है: शुरू में, यह ऑफ-पॉलीसी डीपीओ के माध्यम से मान्य उम्मीदवार सीओटी डेटा उत्पन्न करता है, जो पर्यवेक्षित फाइन-ट्यूनिंग के लिए आधार बनाता है। इसके बाद, मॉडल पुनरावृत्त रूप से ऑन-पॉलीसी डीपीओ के माध्यम से सीओटी डेटा को उत्पन्न और परिष्कृत करता है, जिससे निष्पादन शुद्धता से प्राप्त प्रतिक्रिया के माध्यम से सटीकता में सुधार होता है।

EXCOT विस्तृत COT तर्क को नियोजित करता है, विशेष रूप से एक विभाजन-और-विजेता रणनीति को अपनाता है जिसमें जटिल प्रश्नों को सरल उप-क्वेरी में विघटित किया जाता है। प्रत्येक उप-क्वेरी का विश्लेषण किया जाता है और एक सुसंगत अंतिम क्वेरी में एकीकृत होने से पहले स्वतंत्र रूप से हल किया जाता है। यह संरचित अपघटन मॉडल को SQL संचालन में सामान्य रूप से अधिक प्रभावी ढंग से जटिलता और नेस्टेड संरचनाओं का प्रबंधन करने में सक्षम बनाता है। निष्पादन-आधारित सत्यापन शुद्धता मूल्यांकन के लिए मुख्य तंत्र के रूप में कार्य करता है, जहां उत्पन्न क्वेरी को जमीनी-सत्य परिणामों के खिलाफ उनके निष्पादन आउटपुट की तुलना करके मान्य किया जाता है। गलत और सही प्रश्नों को व्यवस्थित रूप से जोड़ा जाता है, जो वरीयता-आधारित सीखने के लिए स्पष्ट संकेत प्रदान करता है। ऑन-पॉलीसी डीपीओ चरण में पुनरावृत्ति शोधन मॉडल की तर्क सटीकता को उत्तरोत्तर बढ़ाता है।
EXCOT के प्रायोगिक मूल्यांकन ने निष्पादन सटीकता में महत्वपूर्ण सुधारों का प्रदर्शन किया। विशेष रूप से, LLAMA-3.1 70B मॉडल के साथ, EXCOT ने 57.37% से 68.51% से बर्ड डेवलपमेंट सेट पर निष्पादन सटीकता को ऊंचा किया, और स्पाइडर टेस्ट सेट प्रदर्शन को 78.81% से बढ़ाकर 86.59% तक बढ़ा दिया। तुलनात्मक प्रदर्शन संवर्द्धन QWEN-2.5-Coder 32B मॉडल के साथ दर्ज किए गए थे। ये परिणाम इन बेंचमार्क के लिए एकल-मॉडल मूल्यांकन में एक अग्रणी दृष्टिकोण के रूप में Excot की स्थिति, Xiyansql और Openai वेरिएंट सहित मालिकाना मॉडल जैसे स्थापित तरीकों को पार करते हैं। विशेष रूप से, सुधारों ने लगातार उच्च क्वेरी वैधता दर (98%से अधिक) को बनाए रखा, सिंटैक्टिक परिशुद्धता के साथ सिमेंटिक शुद्धता में वृद्धि की पुष्टि की।

अंत में, EXCOT टेक्स्ट-टू-एसक्यूएल कार्यों पर लागू ओपन-सोर्स एलएलएम के लिए संरचित तर्क अनुकूलन में एक व्यवस्थित प्रगति का प्रतिनिधित्व करता है। वरीयता अनुकूलन के साथ संरचित सीओटी तर्क को एकीकृत करके, केवल निष्पादन-आधारित प्रतिक्रिया द्वारा निर्देशित, EXCOT प्रभावी रूप से पिछले तरीकों में पहचाने गए सीमाओं को संबोधित करता है। इसकी पुनरावृत्ति शोधन क्षमता बाहरी इनाम संरचनाओं या मैनुअल एनोटेशन पर निर्भरता के बिना निरंतर सुधार सुनिश्चित करती है। आगे के शोध इस ढांचे को अधिक जटिल स्कीमा वातावरण और अतिरिक्त संरचित तर्क कार्यों के लिए बढ़ा सकते हैं, इस प्रकार संरचित क्वेरी उत्पादन संदर्भों में एलएलएम की प्रयोज्यता और विश्वसनीयता को व्यापक बना सकते हैं।
चेक आउट कागज, github पृष्ठ और विवरण। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।
🔥 ।

Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।
