क्या LLMS मनुष्यों की तरह डिबग कर सकता है? Microsoft AI कोडिंग एजेंटों के लिए DEBUG-GYM का परिचय देता है – Gadgets Solutions

एआई कोडिंग टूल में डिबगिंग समस्या

कोड जनरेशन और पूरा होने में महत्वपूर्ण प्रगति के बावजूद, एआई कोडिंग उपकरण डिबगिंग में चुनौतियों का सामना करना जारी रखते हैं – सॉफ्टवेयर विकास का एक अभिन्न अंग। जबकि बड़ी भाषा मॉडल (LLM) कोड स्निपेट उत्पन्न कर सकते हैं और कभी -कभी फिक्स की पेशकश कर सकते हैं, वे अक्सर रनटाइम त्रुटियों को संबोधित करते समय या पारंपरिक डिबगिंग टूल का उपयोग करके तार्किक दोषों के माध्यम से नेविगेट करते समय लड़खड़ाते हैं। मानव डेवलपर्स नियमित रूप से पायथन जैसे इंटरैक्टिव डिबगर्स पर भरोसा करते हैं pdb चर का निरीक्षण करने, निष्पादन का पता लगाने और कार्यक्रम प्रवाह को समझने के लिए। ये उपकरण खोजपूर्ण तर्क की सुविधा प्रदान करते हैं – एक आयाम काफी हद तक वर्तमान एलएलएम की क्षमताओं से अनुपस्थित है। यह अंतर एक मौलिक सीमा पर प्रकाश डालता है: अधिकांश एलएलएम गतिशील प्रतिक्रिया के लिए सीमित समर्थन के साथ स्थैतिक वातावरण में काम करते हैं, जिससे प्रभावी डिबगिंग के लिए आवश्यक पुनरावृत्ति तर्क में संलग्न होना मुश्किल हो जाता है।

डिबग-जीआईएम- टूल-यूजिंग एजेंटों के लिए एक रूपरेखा

यह पता लगाने के लिए कि LLM किस हद तक इंटरैक्टिव डिबगिंग टूल का उपयोग कर सकते हैं pdbMicrosoft ने पेश किया है डिबग-गाईम-एक पायथन-आधारित वातावरण का मूल्यांकन करने के लिए डिज़ाइन किया गया है कि एआई एजेंट यथार्थवादी कोड-मरम्मत कार्यों में कैसे प्रदर्शन करते हैं। DEBUG-GYM एक संरचित सेटिंग प्रदान करता है जहां LLM- आधारित एजेंट डिबगिंग कमांड को नियोजित कर सकते हैं, रनटाइम व्यवहार की जांच कर सकते हैं और सक्रिय अन्वेषण के माध्यम से अपने दृष्टिकोण को परिष्कृत कर सकते हैं। केवल सुधारों की भविष्यवाणी करने के बजाय, डीबग-जीआईएम में एजेंट समाधानों का प्रस्ताव करने से पहले सबूत इकट्ठा करने के लिए अपने वातावरण के साथ बातचीत कर सकते हैं। सक्रिय, टूल-असिस्टेड डिबगिंग का यह मॉडल सॉफ्टवेयर की मरम्मत के लिए मानव दृष्टिकोण को अधिक बारीकी से दर्शाता है और जटिल परिदृश्यों में तर्क रणनीतियों के आकलन के लिए अनुमति देता है।

क्या LLMS मनुष्यों की तरह डिबग कर सकता है? Microsoft AI कोडिंग एजेंटों के लिए DEBUG-GYM का परिचय देता है
– Gadgets Solutions

तकनीकी वास्तुकला और सुविधाएँ

डीबग-जीआईएम को इंटरैक्टिव, टूल-अवेयर कोडिंग एजेंटों के साथ प्रयोग का समर्थन करने के लिए बनाया गया है। यह त्रुटि-प्रवण पायथन कार्यक्रमों के साथ एजेंटों को प्रस्तुत करता है और एक नियंत्रित इंटरफ़ेस के माध्यम से डिबगिंग टूल तक पहुंच प्रदान करता है। सिस्टम के मुख्य घटकों में शामिल हैं:

बग्गी प्रोग्राम परिदृश्य: ज्ञात दोषों के साथ पायथन स्क्रिप्ट का एक क्यूरेट सेट, सिंटैक्स, रनटाइम और तार्किक त्रुटियों को फैले हुए।
डिबगर एक्सेस: एक टूल इंटरफ़ेस, जो पायथन में उपयोग किए गए लोगों के लिए कमांड को उजागर करता है pdbस्टैक निरीक्षण, स्टेप-थ्रू निष्पादन और चर मूल्यांकन सहित।
अवलोकन और एक्शन स्पेस: ट्रेसबैक डेटा और वैरिएबल मान जैसे संरचित इनपुट एजेंट को प्रदान किए जाते हैं, जो तब कमांड या कोड एडिट के साथ प्रतिक्रिया कर सकते हैं।

आर्किटेक्चर नियतात्मक निष्पादन का समर्थन करता है और मॉड्यूलर है, जिससे एजेंटों और डिबगिंग टूल के आसान प्रतिस्थापन या वृद्धि को सक्षम किया जाता है। पर्यावरण सार्वजनिक रूप से एक ओपन-सोर्स लाइसेंस के तहत उपलब्ध है, सहयोग और तुलनात्मक मूल्यांकन को प्रोत्साहित करता है।

मूल्यांकन और अवलोकन

डीबग-जीआईएम का उपयोग करके प्रारंभिक प्रयोगों से पता चलता है कि इंटरैक्टिव टूल का लाभ उठाने में सक्षम एजेंट जटिल बग को हल करने के लिए बेहतर तरीके से सुसज्जित हैं। Microsoft के मूल्यांकन के अनुसार, LLMS ने डिबगिंग कमांड जारी किए और व्याख्या की – जैसे कि स्टैक फ्रेम के माध्यम से चर प्रिंट या नेविगेशन – स्थिर समकक्षों की तुलना में अधिक सटीक और कुशल कोड मरम्मत का वर्णन किया। 150 विविध बग मामलों से मिलकर एक बेंचमार्क में, इंटरैक्टिव एजेंटों ने एक विशेष रूप से उच्च सफलता दर हासिल की, कम पुनरावृत्तियों के साथ आधी से अधिक समस्याओं को हल किया।

फ्रेमवर्क एजेंट व्यवहार में दृश्यता भी प्रदान करता है। शोधकर्ता टूल उपयोग पैटर्न का विश्लेषण कर सकते हैं, जांच कर सकते हैं कि एजेंट उत्पादक डिबगिंग रणनीतियों से विचलित हो सकते हैं, और सामान्य विफलता बिंदुओं की पहचान कर सकते हैं। आत्मनिरीक्षण का यह स्तर एजेंट नीतियों के पुनरावृत्त विकास का समर्थन करता है और अकेले पाठ की तुलना में अमीर प्रतिक्रिया का उपयोग करके ठीक-ट्यूनिंग मॉडल के लिए रास्ते खोलता है।

इसके अलावा, डीबग-जीआईएम प्रशिक्षण प्रतिमानों का समर्थन करता है जैसे कि इंटरेक्शन इतिहास से सुदृढीकरण सीखने के लिए, भविष्य के मॉडल को न केवल मानव प्रदर्शनों से, बल्कि डिबगिंग कार्यों के संरचित अनुक्रमों से भी सीखने की अनुमति देता है।

निष्कर्ष

DEBUG-GYM LLM- आधारित कोडिंग टूल को आगे बढ़ाने के लिए एक व्यावहारिक और आगे की दिखने वाला दृष्टिकोण प्रदान करता है। इंटरैक्टिव डिबगिंग के लिए समर्थन को शामिल करके, यह वास्तविक दुनिया के डेवलपर वर्कफ़्लोज़ के साथ अधिक निकटता से संरेखित करता है। पर्यावरण गतिशील कोड मरम्मत में एजेंट क्षमताओं के सटीक माप को सक्षम करता है और अन्वेषण से सीखने वाले एजेंटों को प्रशिक्षित करने और मूल्यांकन करने के लिए आवश्यक मचान प्रदान करता है।

जबकि वर्तमान सिस्टम अभी भी बारीक रनटाइम संदर्भों को समझने में सीमाओं का सामना करते हैं, डिबग-जीआईएम विकासशील एजेंटों के लिए ग्राउंडवर्क देता है जो बाहरी उपकरणों का उपयोग करके बग्स के माध्यम से व्यवस्थित रूप से तर्क दे सकता है। निष्क्रिय कोड सुझाव से सक्रिय समस्या-समाधान के लिए यह बदलाव पेशेवर सॉफ्टवेयर विकास वातावरण में एलएलएम को एकीकृत करने की दिशा में एक सार्थक कदम का प्रतिनिधित्व करता है।

चेक आउट कागज और परियोजना। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।

Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।

क्या LLMS मनुष्यों की तरह डिबग कर सकता है? Microsoft AI कोडिंग एजेंटों के लिए DEBUG-GYM का परिचय देता है – Gadgets Solutions

एआई कोडिंग टूल में डिबगिंग समस्या

डिबग-जीआईएम- टूल-यूजिंग एजेंटों के लिए एक रूपरेखा

तकनीकी वास्तुकला और सुविधाएँ

मूल्यांकन और अवलोकन

निष्कर्ष

LEAVE A REPLY Cancel reply

FOLLOW US

LATEST POSTS

Related Stories

EDITOR PICKS

POPULAR POSTS

POPULAR CATEGORY

ABOUT US

FOLLOW US