Saturday, April 19, 2025

SQL-R1: एक सुदृढीकरण सीखने-आधारित NL2SQL मॉडल जो पारदर्शी और सटीक SQL पीढ़ी के साथ जटिल प्रश्नों में बड़े सिस्टम को बेहतर बनाता है – Gadgets Solutions

-

डेटाबेस के लिए प्राकृतिक भाषा इंटरफ़ेस कृत्रिम बुद्धिमत्ता के भीतर एक बढ़ता हुआ ध्यान है, विशेष रूप से क्योंकि यह उपयोगकर्ताओं को सादे मानव भाषा का उपयोग करके संरचित डेटाबेस के साथ बातचीत करने की अनुमति देता है। यह क्षेत्र, जिसे अक्सर NL2SQL (SQL से प्राकृतिक भाषा) के रूप में जाना जाता है, उपयोगकर्ता के अनुकूल प्रश्नों को SQL कमांड में बदलने पर केंद्रित है, जिन्हें सीधे डेटाबेस पर निष्पादित किया जा सकता है। इसका उद्देश्य गैर-तकनीकी उपयोगकर्ताओं के लिए डेटा एक्सेस को सरल बनाना और वित्त, हेल्थकेयर और रिटेल जैसे विभिन्न क्षेत्रों में डेटा सिस्टम की उपयोगिता को व्यापक बनाना है। एलएलएम के उदय के साथ, महत्वपूर्ण प्रगति ने इन रूपांतरणों को अधिक सटीक और संदर्भ-जागरूक बना दिया है, खासकर जब सरल प्रश्नों या संरचित डेटाबेस लेआउट से निपटते हैं।

प्रगति के बावजूद, प्राकृतिक भाषा को सटीक SQL में परिवर्तित करना जटिल स्थितियों में मुश्किल बना हुआ है जिसमें कई टेबल जॉइन, नेस्टेड क्वेरी, या अस्पष्ट शब्दार्थ शामिल हैं। चुनौती केवल सिंटैक्टिक रूप से सही SQL उत्पन्न करने के बारे में नहीं है, बल्कि उन प्रश्नों का उत्पादन करना है जो उपयोगकर्ता के इरादे को सही ढंग से दर्शाते हैं और इसे डोमेन में सामान्यीकृत किया जा सकता है। मानक दृष्टिकोण उच्च-दांव वाले क्षेत्रों में पैमाने पर संघर्ष करते हैं जहां व्याख्या और परिशुद्धता महत्वपूर्ण हैं। इसके अलावा, कई वर्तमान मॉडल निश्चित स्कीमा और प्रशिक्षण डेटा संरचनाओं पर बहुत अधिक निर्भर करते हैं, जो नए या विकसित वातावरण में उनके प्रदर्शन को बाधित करता है।

अधिकांश NL2SQL सिस्टम आज पर्यवेक्षित फाइन-ट्यूनिंग पर भरोसा करते हैं, जहां बड़े भाषा मॉडल को एनोटेट डेटासेट पर प्रशिक्षित किया जाता है जो सही SQL उत्तर के साथ प्रश्नों को जोड़ते हैं। जबकि इस पद्धति ने ध्यान देने योग्य सुधारों को जन्म दिया है, यह अनुकूलनशीलता और व्याख्या में सीमाओं का परिचय देता है। क्योंकि इन मॉडलों को विशिष्ट डेटासेट और स्कीमा के लिए ट्यून किया जाता है, वे अक्सर अपरिचित परिदृश्यों में विफल होते हैं। इसके अलावा, वे एक कठोर पीढ़ी की रणनीति का पालन करते हैं, जो इनपुट डेटा से विचलन होने पर विफलताओं को जन्म दे सकता है। इन प्रणालियों में आम तौर पर अपनी तर्क प्रक्रियाओं में पारदर्शिता की कमी होती है, जो डोमेन में उनकी उपयोगिता को सीमित करते हैं जहां स्पष्ट निर्णय लेने वाले ट्रेल्स आवश्यक हैं।

आइडिया रिसर्च, द हांगकांग यूनिवर्सिटी ऑफ साइंस एंड टेक्नोलॉजी (गुआंगज़ौ), द यूनिवर्सिटी ऑफ चाइनीज एकेडमी ऑफ साइंसेज, और Dataarc Tech Ltd. के शोधकर्ताओं ने पेश किया। SQL-R1। यह नया NL2SQL मॉडल पारंपरिक पर्यवेक्षित सीखने के बजाय सुदृढीकरण सीखने का लाभ उठाता है। SQL-R1 अपने प्रदर्शन को बेहतर बनाने के लिए प्रशिक्षण के दौरान प्रतिक्रिया तंत्र का उपयोग करता है। एनोटेट उदाहरणों से केवल सीखने के बजाय, मॉडल SQL उम्मीदवारों को उत्पन्न करके, उन्हें निष्पादित करके और परिणाम पर संरचित प्रतिक्रिया प्राप्त करके सीखता है। इस प्रतिक्रिया में यह शामिल है कि क्या SQL वाक्यात्मक रूप से सही था, चाहे वह उचित परिणाम का उत्पादन करे, और यह कितना कुशल और व्याख्यात्मक था। यह गतिशील सीखने की प्रक्रिया मॉडल को समय के साथ अपनी SQL पीढ़ी की रणनीतियों को अनुकूलित करने की अनुमति देती है और जटिल या अपरिचित परिदृश्यों में सामान्यीकरण में सुधार करती है।

SQL-R1: एक सुदृढीकरण सीखने-आधारित NL2SQL मॉडल जो पारदर्शी और सटीक SQL पीढ़ी के साथ जटिल प्रश्नों में बड़े सिस्टम को बेहतर बनाता है
 – Gadgets Solutions

SQL-R1 का निर्माण करने के लिए, शोधकर्ताओं ने सबसे पहले SynSQL-2.5M नामक एक बड़े सिंथेटिक डेटासेट से तैयार किए गए 200,000 नमूनों पर पर्यवेक्षण किया। यह प्रक्रिया, जिसे एक कोल्ड स्टार्ट के रूप में जाना जाता है, यह सुनिश्चित करता है कि मॉडल बुनियादी निर्देशों का पालन कर सकता है और सरल SQL आउटपुट उत्पन्न कर सकता है। इसके बाद, सुदृढीकरण सीखने को समूह सापेक्ष नीति अनुकूलन (जीआरपीओ) एल्गोरिथ्म का उपयोग करके पेश किया गया था। मॉडल ने प्रत्येक क्वेरी के लिए कई SQL उम्मीदवारों को उत्पन्न किया और एक समग्र स्कोरिंग फ़ंक्शन के आधार पर पुरस्कृत किया गया। इस फ़ंक्शन में चार मेट्रिक्स शामिल थे: प्रारूप इनाम (+1 या -1 सिंटैक्स शुद्धता के आधार पर), निष्पादन इनाम (निष्पादन योग्य क्वेरी के लिए +2, -2 विफलताओं के लिए), परिणाम इनाम (सही क्वेरी आउटपुट के लिए +3, गलत लोगों के लिए -3), और रीजनिंग ट्रेस की गहराई और स्पष्टता के आधार पर लंबाई इनाम। इनमें से प्रत्येक स्कोर ने मॉडल की आंतरिक निर्णय लेने की प्रक्रिया को अपडेट करने में योगदान दिया।

SQL-R1 का मूल्यांकन दो उद्योग-मानक NL2SQL बेंचमार्क: स्पाइडर और बर्ड पर किया गया था। स्पाइडर डेवलपमेंट सेट पर, मॉडल ने 87.6% निष्पादन सटीकता हासिल की, और स्पाइडर टेस्ट सेट पर, यह 88.7% प्राप्त हुआ। बर्ड डेटासेट के लिए, जो 37 डोमेन से 95 डेटाबेस को कवर करता है, मॉडल ने 66.6%स्कोर किया। ये परिणाम GPT-4 जैसे बंद-स्रोत समाधानों सहित बड़े मॉडलों के साथ प्रतिस्पर्धी या बेहतर हैं। विशेष रूप से, SQL-R1 ने QWEN2.5-CODER-7B मॉडल का उपयोग किया, जो कई विकल्पों की तुलना में काफी छोटा है, यह दर्शाता है कि सुदृढीकरण सीखने के साथ संयुक्त होने पर उच्च सटीकता को कुशल आर्किटेक्चर के साथ प्राप्त किया जा सकता है। एक पृथक अध्ययन ने प्रत्येक इनाम घटक के योगदान की पुष्टि की। उदाहरण के लिए, प्रारूप इनाम को हटाने के कारण, सटीकता 63.1% से 60.4% तक गिर गई। परिणाम इनाम को हटाने के कारण 0.7% की गिरावट आई, यह दर्शाता है कि इनाम तंत्र में प्रत्येक तत्व मॉडल का मार्गदर्शन करने में एक भूमिका निभाता है।

SQL-R1 पर शोध से कई प्रमुख takeaways:

  • SQL-R1 ने स्पाइडर टेस्ट सेट पर 88.7% सटीकता और बर्ड डेवलपमेंट सेट पर 66.6%, केवल 7B बेस मॉडल (Qwen2.5-Coder-7b) का उपयोग करके 66.6% प्राप्त किया।
  • मॉडल ने सुदृढीकरण सीखने के लिए पर्यवेक्षित फाइन-ट्यूनिंग और 5,000 जटिल नमूनों के लिए SynSQL-2.5M डेटासेट से 200,000 नमूनों का उपयोग किया।
  • जीआरपीओ एल्गोरिथ्म ने सुदृढीकरण सीखने को संचालित किया, जिसमें कोई मूल्य मॉडल की आवश्यकता नहीं थी और सापेक्ष प्रदर्शन स्कोर के साथ कुशलता से काम किया।
  • इनाम फ़ंक्शन में चार घटक शामिल थे: प्रारूप (+1/-1), निष्पादन (+2/-2), परिणाम (+3/-3), और लंबाई (आनुपातिक)।
  • SQL-R1 ने GPT-4 जैसे बड़े मॉडलों को बेहतर बनाया, उस मॉडल आर्किटेक्चर और फीडबैक प्रशिक्षण को उजागर करना आकार के रूप में महत्वपूर्ण है।
  • एब्लेशन स्टडीज ने प्रत्येक इनाम के महत्व का खुलासा किया: प्रारूप इनाम को हटाने से प्रदर्शन में 2.7% की गिरावट आई, जबकि निष्पादन इनाम को समाप्त करने से सटीकता 2.4% तक गिर गई।
  • दृष्टिकोण पारदर्शिता को बढ़ावा देता है, क्योंकि मॉडल ‘का उपयोग करके तर्क के निशान प्रदान करता है’‘ और ‘‘टैग, एंड-यूज़र व्याख्या में सुधार।

यह रहा कागज़। इसके अलावा, हमें फॉलो करना न भूलें ट्विटर और हमारे साथ जुड़ें तार -चैनल और लिंक्डइन जीआरओयूपी। हमारे साथ जुड़ने के लिए मत भूलना 90K+ एमएल सबरेडिट

🔥


Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

FOLLOW US

150,000FansLike
35,000FollowersFollow
100,000SubscribersSubscribe

Related Stories

Translate »