Tuesday, April 22, 2025

LOCAGENT से मिलें: ग्राफ-आधारित AI एजेंट स्केलेबल सॉफ्टवेयर रखरखाव के लिए कोड स्थानीयकरण को बदलना – Gadgets Solutions

-

सॉफ्टवेयर रखरखाव सॉफ्टवेयर विकास जीवनचक्र का एक अभिन्न अंग है, जहां डेवलपर्स अक्सर बग को ठीक करने, नई सुविधाओं को लागू करने और प्रदर्शन का अनुकूलन करने के लिए मौजूदा कोडबेस को फिर से देखते हैं। इस चरण में एक महत्वपूर्ण कार्य कोड स्थानीयकरण है, एक कोडबेस में विशिष्ट स्थानों को इंगित करना जिसे संशोधित किया जाना चाहिए। इस प्रक्रिया ने आधुनिक सॉफ्टवेयर परियोजनाओं के बढ़ते पैमाने और जटिलता के साथ महत्व प्राप्त किया है। स्वचालन और एआई-चालित उपकरणों पर बढ़ती निर्भरता ने बग डिटेक्शन, कोड खोज और सुझाव जैसे सहायक कार्यों में बड़े भाषा मॉडल (एलएलएम) को एकीकृत किया है। हालांकि, भाषा कार्यों में एलएलएम की उन्नति के बावजूद, इन मॉडलों को जटिल कोडबेस के शब्दार्थ और संरचनाओं को समझने में सक्षम करना एक तकनीकी चुनौती बनी हुई है, शोधकर्ताओं ने दूर करने का प्रयास किया।

समस्याओं के बारे में बात करते हुए, सॉफ्टवेयर रखरखाव में सबसे लगातार समस्याओं में से एक एक कोडबेस के प्रासंगिक भागों की सटीक रूप से पहचान करना है जो उपयोगकर्ता-रिपोर्ट किए गए मुद्दों या सुविधा अनुरोधों के आधार पर परिवर्तनों की आवश्यकता है। अक्सर, प्राकृतिक भाषा में विवरण जारी करते हैं लक्षणों का उल्लेख करते हैं लेकिन कोड में वास्तविक मूल कारण नहीं। यह डिस्कनेक्ट डेवलपर्स और स्वचालित टूल के लिए सटीक कोड तत्वों को अपडेट की आवश्यकता वाले सटीक कोड तत्वों से जोड़ने के लिए मुश्किल बनाता है। इसके अलावा, पारंपरिक तरीके जटिल कोड निर्भरता के साथ संघर्ष करते हैं, खासकर जब प्रासंगिक कोड कई फ़ाइलों को फैलाता है या पदानुक्रमित तर्क की आवश्यकता होती है। खराब कोड स्थानीयकरण अक्षम बग रिज़ॉल्यूशन, अपूर्ण पैच और लंबे समय तक विकास चक्रों में योगदान देता है।

कोड स्थानीयकरण के लिए पूर्व के तरीके ज्यादातर घने पुनर्प्राप्ति मॉडल या एजेंट-आधारित दृष्टिकोणों पर निर्भर करते हैं। घने पुनर्प्राप्ति के लिए पूरे कोडबेस को एक खोज योग्य वेक्टर स्थान में एम्बेड करने की आवश्यकता होती है, जिसे बड़े रिपॉजिटरी के लिए बनाए रखना और अपडेट करना मुश्किल है। ये सिस्टम अक्सर खराब प्रदर्शन करते हैं जब जारी किए गए विवरण में प्रासंगिक कोड के सीधे संदर्भ की कमी होती है। दूसरी ओर, कुछ हालिया दृष्टिकोण एजेंट-आधारित मॉडल का उपयोग करते हैं जो कोडबेस के मानव-जैसे अन्वेषण का अनुकरण करते हैं। हालांकि, वे अक्सर निर्देशिका ट्रैवर्सल पर भरोसा करते हैं और इनहेरिटेंस या फ़ंक्शन आह्वान जैसे गहरे सिमेंटिक लिंक की समझ की कमी करते हैं। यह कोड तत्वों के बीच जटिल संबंधों को संभालने की उनकी क्षमता को स्पष्ट रूप से जुड़ा नहीं है।

येल विश्वविद्यालय, दक्षिणी कैलिफोर्निया विश्वविद्यालय, स्टैनफोर्ड विश्वविद्यालय के शोधकर्ताओं की एक टीम, और ऑल हैंड्स एआई ने कोड स्थानीयकरण को बदलने के लिए एक ग्राफ-निर्देशित एजेंट ढांचा विकसित किया। लेक्सिकल मैचिंग या स्टेटिक एम्बेडिंग के आधार पर, Locagent पूरे कोडबेस को निर्देशित विषम रेखांकन में परिवर्तित करता है। इन ग्राफ़ में निर्देशिकाओं, फ़ाइलों, कक्षाओं और कार्यों और किनारों के लिए नोड्स शामिल हैं, जो फ़ंक्शन आह्वान, फ़ाइल आयात और वर्ग विरासत जैसे संबंधों को पकड़ने के लिए हैं। यह संरचना एजेंट को कोड अमूर्त के कई स्तरों पर तर्क करने की अनुमति देती है। सिस्टम तब Searchentity, TraverseGraph, और restreventity जैसे उपकरणों को लागू करता है ताकि LLMS को सिस्टम चरण-दर-चरण का पता लगाने की अनुमति मिल सके। विरल पदानुक्रमित अनुक्रमण का उपयोग संस्थाओं तक तेजी से पहुंच सुनिश्चित करता है, और ग्राफ डिज़ाइन मल्टी-हॉप ट्रैवर्सल का समर्थन करता है, जो कोडबेस के दूर के हिस्सों में कनेक्शन खोजने के लिए आवश्यक है।

LOCAGENT से मिलें: ग्राफ-आधारित AI एजेंट स्केलेबल सॉफ्टवेयर रखरखाव के लिए कोड स्थानीयकरण को बदलना
 – Gadgets Solutions

Locagent सेकंड के भीतर अनुक्रमण करता है और वास्तविक समय के उपयोग का समर्थन करता है, जिससे यह डेवलपर्स और संगठनों के लिए व्यावहारिक हो जाता है। शोधकर्ताओं ने सफल स्थानीयकरण प्रक्षेपवक्रों के एक क्यूरेट सेट पर दो ओपन-सोर्स मॉडल, QWEN2.5-7B, और QWEN2.5-32B को ठीक किया। इन मॉडलों ने मानक बेंचमार्क पर प्रभावशाली प्रदर्शन किया। उदाहरण के लिए, SWE-Bench-Lite डेटासेट पर, Locagent ने Qwen2.5-32b का उपयोग करके 92.7% फ़ाइल-स्तरीय सटीकता हासिल की, जबकि क्लाउड -3.5 के साथ 86.13% और अन्य मॉडलों से कम स्कोर। नए पेश किए गए LOC-Bench डेटासेट पर, जिसमें बग रिपोर्ट (282), फीचर अनुरोध (203), सुरक्षा मुद्दों (31), और प्रदर्शन समस्याओं (144) में 660 उदाहरण शामिल हैं, Locagent ने फिर से प्रतिस्पर्धी परिणाम दिखाए, फाइल स्तर पर 84.59% ACC@5 और 87.06% ACC@10 को प्राप्त किया। यहां तक ​​कि छोटे QWEN2.5-7B मॉडल ने उच्च लागत वाले मालिकाना मॉडल के करीब प्रदर्शन किया, जबकि केवल $ 0.05 प्रति उदाहरण की लागत, क्लाउड -3.5 की $ 0.66 लागत के विपरीत।

मुख्य तंत्र एक विस्तृत ग्राफ-आधारित अनुक्रमण प्रक्रिया पर निर्भर करता है। प्रत्येक नोड, चाहे किसी वर्ग या फ़ंक्शन का प्रतिनिधित्व करता हो, विशिष्ट रूप से एक पूरी तरह से योग्य नाम द्वारा पहचाना जाता है और लचीले कीवर्ड खोज के लिए BM25 का उपयोग करके अनुक्रमित किया जाता है। मॉडल एजेंटों को एक तर्क श्रृंखला का अनुकरण करने में सक्षम बनाता है जो समस्या-प्रासंगिक कीवर्ड निकालने के साथ शुरू होता है, ग्राफ ट्रैवर्सल के माध्यम से आगे बढ़ता है, और विशिष्ट नोड्स के लिए कोड पुनर्प्राप्ति के साथ समाप्त होता है। इन क्रियाओं को कई पुनरावृत्तियों पर भविष्यवाणी स्थिरता के आधार पर एक विश्वास आकलन दृष्टिकोण का उपयोग करके स्कोर किया जाता है। विशेष रूप से, जब शोधकर्ताओं ने Traversgraph या Searchentity जैसे उपकरणों को अक्षम कर दिया, तो प्रदर्शन उनके महत्व को उजागर करते हुए 18%तक गिर गया। इसके अलावा, मल्टी-हॉप तर्क महत्वपूर्ण था; ट्रैवर्सल हॉप्स को फिक्सिंग ने फ़ंक्शन-लेवल सटीकता में 71.53% से 66.79% तक गिरावट का कारण बना।

जब GitHub अंक संकल्प जैसे डाउनस्ट्रीम कार्यों पर लागू किया जाता है, तो Locagent ने बेसलाइन एजेंटलेस सिस्टम में 33.58% से समस्या पास दर (पास@10) को बढ़ा दिया, जो ठीक-ट्यून किए गए Qwen2.5-32B मॉडल के साथ 37.59% हो गया। फ्रेमवर्क की मॉड्यूलरिटी और ओपन-सोर्स प्रकृति इसे वाणिज्यिक एलएलएम के लिए इन-हाउस विकल्पों की तलाश करने वाले संगठनों के लिए एक सम्मोहक समाधान बनाती है। रखरखाव कार्यों के व्यापक प्रतिनिधित्व के साथ, LOC-Bench की शुरूआत, पूर्व-प्रशिक्षण डेटा से संदूषण के बिना उचित मूल्यांकन सुनिश्चित करती है।

Locagent पर शोध के कुछ प्रमुख takeaways में निम्नलिखित शामिल हैं:

  • Locagent बहु-स्तरीय कोड तर्क के लिए कोडबेस को विषम ग्राफ में बदल देता है।
  • इसने Qwen2.5-32b के साथ SWE-Bench-Lite पर 92.7% फ़ाइल-स्तरीय सटीकता प्राप्त की।
  • मालिकाना मॉडल की तुलना में कोड स्थानीयकरण लागत लगभग 86% कम हो गई। 660 उदाहरणों के साथ LOC-Bench डेटासेट पेश किया: 282 बग्स, 203 सुविधाएँ, 31 सुरक्षा, 144 प्रदर्शन।
  • फाइन-ट्यून्ड मॉडल (QWEN2.5-7B, QWEN2.5-32B) ने क्लाउड -3.5 की तुलना में तुलना की।
  • ट्रैवर्सग्राफ और सर्चेंटिटी जैसे उपकरण आवश्यक साबित हुए, सटीकता के साथ अक्षम होने पर।
  • GitHub जारी करने की दरों में सुधार करके वास्तविक दुनिया की उपयोगिता का प्रदर्शन किया।
  • यह मालिकाना एलएलएम समाधानों के लिए एक स्केलेबल, लागत-कुशल और प्रभावी विकल्प प्रदान करता है।

चेक आउट पेपर और गिथब पेज। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट


Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

FOLLOW US

150,000FansLike
35,000FollowersFollow
100,000SubscribersSubscribe

Related Stories

Translate »