एआई कोडिंग टूल में डिबगिंग समस्या
कोड जनरेशन और पूरा होने में महत्वपूर्ण प्रगति के बावजूद, एआई कोडिंग उपकरण डिबगिंग में चुनौतियों का सामना करना जारी रखते हैं – सॉफ्टवेयर विकास का एक अभिन्न अंग। जबकि बड़ी भाषा मॉडल (LLM) कोड स्निपेट उत्पन्न कर सकते हैं और कभी -कभी फिक्स की पेशकश कर सकते हैं, वे अक्सर रनटाइम त्रुटियों को संबोधित करते समय या पारंपरिक डिबगिंग टूल का उपयोग करके तार्किक दोषों के माध्यम से नेविगेट करते समय लड़खड़ाते हैं। मानव डेवलपर्स नियमित रूप से पायथन जैसे इंटरैक्टिव डिबगर्स पर भरोसा करते हैं pdb
चर का निरीक्षण करने, निष्पादन का पता लगाने और कार्यक्रम प्रवाह को समझने के लिए। ये उपकरण खोजपूर्ण तर्क की सुविधा प्रदान करते हैं – एक आयाम काफी हद तक वर्तमान एलएलएम की क्षमताओं से अनुपस्थित है। यह अंतर एक मौलिक सीमा पर प्रकाश डालता है: अधिकांश एलएलएम गतिशील प्रतिक्रिया के लिए सीमित समर्थन के साथ स्थैतिक वातावरण में काम करते हैं, जिससे प्रभावी डिबगिंग के लिए आवश्यक पुनरावृत्ति तर्क में संलग्न होना मुश्किल हो जाता है।
डिबग-जीआईएम- टूल-यूजिंग एजेंटों के लिए एक रूपरेखा
यह पता लगाने के लिए कि LLM किस हद तक इंटरैक्टिव डिबगिंग टूल का उपयोग कर सकते हैं pdb
Microsoft ने पेश किया है डिबग-गाईम-एक पायथन-आधारित वातावरण का मूल्यांकन करने के लिए डिज़ाइन किया गया है कि एआई एजेंट यथार्थवादी कोड-मरम्मत कार्यों में कैसे प्रदर्शन करते हैं। DEBUG-GYM एक संरचित सेटिंग प्रदान करता है जहां LLM- आधारित एजेंट डिबगिंग कमांड को नियोजित कर सकते हैं, रनटाइम व्यवहार की जांच कर सकते हैं और सक्रिय अन्वेषण के माध्यम से अपने दृष्टिकोण को परिष्कृत कर सकते हैं। केवल सुधारों की भविष्यवाणी करने के बजाय, डीबग-जीआईएम में एजेंट समाधानों का प्रस्ताव करने से पहले सबूत इकट्ठा करने के लिए अपने वातावरण के साथ बातचीत कर सकते हैं। सक्रिय, टूल-असिस्टेड डिबगिंग का यह मॉडल सॉफ्टवेयर की मरम्मत के लिए मानव दृष्टिकोण को अधिक बारीकी से दर्शाता है और जटिल परिदृश्यों में तर्क रणनीतियों के आकलन के लिए अनुमति देता है।

तकनीकी वास्तुकला और सुविधाएँ
डीबग-जीआईएम को इंटरैक्टिव, टूल-अवेयर कोडिंग एजेंटों के साथ प्रयोग का समर्थन करने के लिए बनाया गया है। यह त्रुटि-प्रवण पायथन कार्यक्रमों के साथ एजेंटों को प्रस्तुत करता है और एक नियंत्रित इंटरफ़ेस के माध्यम से डिबगिंग टूल तक पहुंच प्रदान करता है। सिस्टम के मुख्य घटकों में शामिल हैं:
- बग्गी प्रोग्राम परिदृश्य: ज्ञात दोषों के साथ पायथन स्क्रिप्ट का एक क्यूरेट सेट, सिंटैक्स, रनटाइम और तार्किक त्रुटियों को फैले हुए।
- डिबगर एक्सेस: एक टूल इंटरफ़ेस, जो पायथन में उपयोग किए गए लोगों के लिए कमांड को उजागर करता है
pdb
स्टैक निरीक्षण, स्टेप-थ्रू निष्पादन और चर मूल्यांकन सहित। - अवलोकन और एक्शन स्पेस: ट्रेसबैक डेटा और वैरिएबल मान जैसे संरचित इनपुट एजेंट को प्रदान किए जाते हैं, जो तब कमांड या कोड एडिट के साथ प्रतिक्रिया कर सकते हैं।
आर्किटेक्चर नियतात्मक निष्पादन का समर्थन करता है और मॉड्यूलर है, जिससे एजेंटों और डिबगिंग टूल के आसान प्रतिस्थापन या वृद्धि को सक्षम किया जाता है। पर्यावरण सार्वजनिक रूप से एक ओपन-सोर्स लाइसेंस के तहत उपलब्ध है, सहयोग और तुलनात्मक मूल्यांकन को प्रोत्साहित करता है।

मूल्यांकन और अवलोकन
डीबग-जीआईएम का उपयोग करके प्रारंभिक प्रयोगों से पता चलता है कि इंटरैक्टिव टूल का लाभ उठाने में सक्षम एजेंट जटिल बग को हल करने के लिए बेहतर तरीके से सुसज्जित हैं। Microsoft के मूल्यांकन के अनुसार, LLMS ने डिबगिंग कमांड जारी किए और व्याख्या की – जैसे कि स्टैक फ्रेम के माध्यम से चर प्रिंट या नेविगेशन – स्थिर समकक्षों की तुलना में अधिक सटीक और कुशल कोड मरम्मत का वर्णन किया। 150 विविध बग मामलों से मिलकर एक बेंचमार्क में, इंटरैक्टिव एजेंटों ने एक विशेष रूप से उच्च सफलता दर हासिल की, कम पुनरावृत्तियों के साथ आधी से अधिक समस्याओं को हल किया।
फ्रेमवर्क एजेंट व्यवहार में दृश्यता भी प्रदान करता है। शोधकर्ता टूल उपयोग पैटर्न का विश्लेषण कर सकते हैं, जांच कर सकते हैं कि एजेंट उत्पादक डिबगिंग रणनीतियों से विचलित हो सकते हैं, और सामान्य विफलता बिंदुओं की पहचान कर सकते हैं। आत्मनिरीक्षण का यह स्तर एजेंट नीतियों के पुनरावृत्त विकास का समर्थन करता है और अकेले पाठ की तुलना में अमीर प्रतिक्रिया का उपयोग करके ठीक-ट्यूनिंग मॉडल के लिए रास्ते खोलता है।
इसके अलावा, डीबग-जीआईएम प्रशिक्षण प्रतिमानों का समर्थन करता है जैसे कि इंटरेक्शन इतिहास से सुदृढीकरण सीखने के लिए, भविष्य के मॉडल को न केवल मानव प्रदर्शनों से, बल्कि डिबगिंग कार्यों के संरचित अनुक्रमों से भी सीखने की अनुमति देता है।
निष्कर्ष
DEBUG-GYM LLM- आधारित कोडिंग टूल को आगे बढ़ाने के लिए एक व्यावहारिक और आगे की दिखने वाला दृष्टिकोण प्रदान करता है। इंटरैक्टिव डिबगिंग के लिए समर्थन को शामिल करके, यह वास्तविक दुनिया के डेवलपर वर्कफ़्लोज़ के साथ अधिक निकटता से संरेखित करता है। पर्यावरण गतिशील कोड मरम्मत में एजेंट क्षमताओं के सटीक माप को सक्षम करता है और अन्वेषण से सीखने वाले एजेंटों को प्रशिक्षित करने और मूल्यांकन करने के लिए आवश्यक मचान प्रदान करता है।
जबकि वर्तमान सिस्टम अभी भी बारीक रनटाइम संदर्भों को समझने में सीमाओं का सामना करते हैं, डिबग-जीआईएम विकासशील एजेंटों के लिए ग्राउंडवर्क देता है जो बाहरी उपकरणों का उपयोग करके बग्स के माध्यम से व्यवस्थित रूप से तर्क दे सकता है। निष्क्रिय कोड सुझाव से सक्रिय समस्या-समाधान के लिए यह बदलाव पेशेवर सॉफ्टवेयर विकास वातावरण में एलएलएम को एकीकृत करने की दिशा में एक सार्थक कदम का प्रतिनिधित्व करता है।
चेक आउट कागज और परियोजना। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।

Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।
