बड़े भाषा मॉडल (LLMS) के साथ एकीकृत खोज इंजन प्रौद्योगिकियों में तेजी से प्रगति ने मुख्य रूप से Google के GPT-4O खोज पूर्वावलोकन और Perplexity के सोनार रीजनिंग प्रो जैसे मालिकाना समाधानों का पक्ष लिया है। जबकि ये मालिकाना प्रणालियां मजबूत प्रदर्शन की पेशकश करती हैं, उनकी बंद-स्रोत प्रकृति महत्वपूर्ण चुनौतियां पैदा करती है, विशेष रूप से पारदर्शिता, नवाचार और सामुदायिक सहयोग से संबंधित है। यह विशिष्टता अनुकूलन को सीमित करती है और खोज-संवर्धित एआई के साथ व्यापक शैक्षणिक और उद्यमशीलता सगाई को बाधित करती है।
इन सीमाओं के जवाब में, वाशिंगटन विश्वविद्यालय, प्रिंसटन विश्वविद्यालय, और यूसी बर्कले के शोधकर्ताओं ने ओपन डीप सर्च (ओडीएस) -एक ओपन-सोर्स सर्च एआई फ्रेमवर्क पेश किया है जो किसी भी उपयोगकर्ता-चयनित एलएलएम के साथ एक मॉड्यूलर तरीके से सीमलेस एकीकरण के लिए डिज़ाइन किया गया है। ओडीएस में दो केंद्रीय घटक शामिल हैं: ओपन सर्च टूल और ओपन रीजनिंग एजेंट। साथ में, ये घटक सामग्री पुनर्प्राप्ति और तर्क सटीकता को बढ़ाकर आधार एलएलएम की क्षमताओं में काफी सुधार करते हैं।

ओपन सर्च टूल एक उन्नत पुनर्प्राप्ति पाइपलाइन के माध्यम से खुद को अलग करता है, जिसमें एक बुद्धिमान क्वेरी रीफ्रैसिंग विधि होती है जो कई शब्दार्थ से संबंधित प्रश्नों को उत्पन्न करके उपयोगकर्ता के इरादे को बेहतर ढंग से कैप्चर करती है। यह दृष्टिकोण विशेष रूप से खोज परिणामों की सटीकता और विविधता में सुधार करता है। इसके अलावा, उपकरण प्रासंगिकता के अनुसार खोज परिणामों को व्यवस्थित रूप से फ़िल्टर करने के लिए परिष्कृत चंकिंग और फिर से रैंकिंग तकनीकों को नियोजित करता है। पुनर्प्राप्ति घटक को पूरक करते हुए, ओपन रीजनिंग एजेंट दो अलग-अलग कार्यप्रणाली के माध्यम से संचालित होता है: चेन-ऑफ-थॉट रिएक्ट एजेंट और चेन-ऑफ-कोड कोडेक्ट एजेंट। ये एजेंट उपयोगकर्ता प्रश्नों की व्याख्या करते हैं, उपकरण उपयोग का प्रबंधन करते हैं – जिसमें खोज और गणना शामिल हैं – और व्यापक, प्रासंगिक सटीक प्रतिक्रियाएं उत्पन्न करते हैं।

अनुभवजन्य मूल्यांकन ओडीएस की प्रभावशीलता को रेखांकित करता है। डीपसेक-आर 1 के साथ एकीकृत, एक उन्नत ओपन-सोर्स रीजनिंग मॉडल, ओडीएस-वी 2 सिंपलक्यू बेंचमार्क पर 88.3% सटीकता और फ्रेम बेंचमार्क पर 75.3% प्राप्त करता है। यह प्रदर्शन विशेष रूप से Perplexity के सोनार रीज़निंग प्रो जैसे मालिकाना विकल्पों को पार करता है, जो क्रमशः इन बेंचमार्क पर 85.8% और 44.4% स्कोर करता है। Openai के GPT-4O खोज पूर्वावलोकन की तुलना में, ODS-V2 फ्रेम बेंचमार्क पर एक महत्वपूर्ण लाभ दिखाता है, 9.7% अधिक सटीकता प्राप्त करता है। ये परिणाम प्रतिस्पर्धी प्रदान करने के लिए ओडीएस की क्षमता को दर्शाते हैं, और विशिष्ट क्षेत्रों में बेहतर, मालिकाना प्रणालियों के सापेक्ष प्रदर्शन।
ODS की एक महत्वपूर्ण विशेषता उपकरणों का इसका अनुकूली उपयोग है, जैसा कि अतिरिक्त वेब खोजों के बारे में रणनीतिक निर्णय लेने से प्रदर्शित होता है। सरल प्रश्नों के लिए, जैसा कि SimpleQA में देखा गया है, ODS अतिरिक्त खोजों को कम करता है, कुशल संसाधन उपयोग का प्रदर्शन करता है। इसके विपरीत, जटिल मल्टी-हॉप क्वेरी के लिए, जैसा कि फ्रेम बेंचमार्क में है, ओडीएस उचित रूप से वेब खोजों के अपने उपयोग को बढ़ाता है, इस प्रकार क्वेरी जटिलता के अनुरूप बुद्धिमान संसाधन प्रबंधन का अनुकरण करता है।

अंत में, ओपन डीप सर्च विविध एलएलएम के साथ संगत एक ओपन-सोर्स फ्रेमवर्क प्रदान करके खोज-संवर्धित एआई को लोकतंत्रीकरण करने की दिशा में एक उल्लेखनीय उन्नति का प्रतिनिधित्व करता है। यह एआई अनुसंधान समुदाय के भीतर नवाचार और पारदर्शिता को प्रोत्साहित करता है और परिष्कृत खोज और तर्क क्षमताओं के विकास में व्यापक भागीदारी का समर्थन करता है। एडेप्टिव रीजनिंग मेथोडोलॉजी के साथ उन्नत पुनर्प्राप्ति तकनीकों को प्रभावी ढंग से एकीकृत करके, ओडीएस ओपन-सोर्स एआई विकास में सार्थक रूप से योगदान देता है, खोज-एकीकृत बड़े भाषा मॉडल में भविष्य की खोज के लिए एक मजबूत मानक स्थापित करता है।
चेक आउट पेपर और गिथब पेज। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।

Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।