Monday, April 21, 2025

Huawei Noah’s Ark Lab ने ड्रीम 7B जारी किया: उन्नत योजना और लचीली निष्कर्ष क्षमताओं के साथ एक शक्तिशाली खुला प्रसार तर्क मॉडल – Gadgets Solutions

-

एलएलएम ने उद्योगों में विभिन्न अनुप्रयोगों को बदलते हुए, कृत्रिम बुद्धिमत्ता में क्रांति ला दी है। Autoregresive (AR) मॉडल वर्तमान पाठ पीढ़ी पर हावी हैं, जिसमें GPT-4, DEEPSEEK और क्लाउड जैसे प्रमुख सिस्टम हैं, जो अनुक्रमिक बाएं-से-दाएं आर्किटेक्चर का उपयोग करते हैं। प्रभावशाली क्षमताओं के बावजूद, अगली पीढ़ी के वास्तुशिल्प प्रतिमानों के बारे में मौलिक प्रश्न एआर मॉडल के रूप में उभरे हैं, जो पैमाने पर सीमाओं को प्रदर्शित करते हैं। इन चुनौतियों में जटिल तर्क कठिनाइयों, अपर्याप्त दीर्घकालिक योजना और विस्तारित संदर्भों में सामंजस्य बनाए रखने के संघर्ष शामिल हैं। ये सन्निहित एआई, स्वायत्त एजेंटों, और लंबे-क्षितिज निर्णय लेने वाली प्रणालियों में उभरते अनुप्रयोगों के लिए समस्याग्रस्त हैं, जहां सफलता के लिए निरंतर तर्क और प्रासंगिक समझ आवश्यक हैं।

असतत प्रसार मॉडल (डीएमएस) अनुक्रम पीढ़ी के लिए ऑटोरेग्रेसिव दृष्टिकोणों के लिए एक आशाजनक विकल्प हैं। एआर मॉडल के विपरीत जो क्रमिक रूप से टोकन उत्पन्न करते हैं, डीएमएस पूरी तरह से शोर वाले राज्य से समानांतर में सभी अनुक्रमों को परिष्कृत करता है। यह अंतर महत्वपूर्ण लाभ प्रदान करता है: द्विदिश प्रासंगिक मॉडलिंग वैश्विक सामंजस्य को बढ़ाता है, लचीली नियंत्रणीय पीढ़ी स्वाभाविक रूप से पुनरावृत्ति शोधन के माध्यम से होती है, और कुशल शोर-टू-डेटा मैपिंग के माध्यम से मौलिक नमूनाकरण त्वरण के लिए क्षमता मौजूद है। हाल की प्रगति भाषा कार्यों में प्रसार की बढ़ती क्षमता को दर्शाती है, जिसमें 7B मापदंडों के लिए diffullama और llada स्केलिंग जैसे मॉडल हैं, जबकि पारा कोडर कोड जनरेशन में प्रभावशाली अनुमान दक्षता दिखाता है।

हांगकांग विश्वविद्यालय और हुआवेई नूह की आर्क लैब के शोधकर्ताओं ने ड्रीम 7 बी (डिफ्यूजन रीजनिंग मॉडल) जारी किया, जो अब तक का सबसे शक्तिशाली खुला प्रसार बड़ा भाषा मॉडल है। मॉडल सामान्य कार्यों, गणित और कोडिंग बेंचमार्क पर समान आकार के एआर मॉडल से मेल खाता है या उससे अधिक है। ड्रीम 7 बी असाधारण शून्य-शॉट प्लानिंग क्षमताओं और अनुमान लचीलेपन को दर्शाता है, जो संरचित कार्यों पर दीपसेक वी 3 (671 बी) जैसे बड़े मॉडलों को बेहतर बनाता है। DOLMA और OPENCODER सहित विविध डेटासेट से 580B टोकन पर प्रशिक्षित, मॉडल QWEN2.5 7B से ऑटोरेग्रेसिव वेट इनिशियलाइज़ेशन के साथ मास्क-आधारित प्रसार को नियोजित करता है। इसकी वास्तुकला शक्तिशाली द्विदिश संदर्भ प्रसंस्करण, मनमानी-आदेश उत्पादन, संक्रमित क्षमताओं और समायोज्य गुणवत्ता-गति ट्रेडऑफ़्स को निष्क्रियता के दौरान सक्षम बनाती है।

ड्रीम 7 बी प्रसार भाषा मॉडलिंग में पिछले काम पर बनाता है, RDM की सैद्धांतिक नींव और Diffullama की अनुकूलन रणनीति का उपयोग करता है। यह विविध अनुप्रयोगों के लिए डिज़ाइन किए गए वास्तुकला के साथ एक मुखौटा प्रसार प्रतिमान को लागू करता है। प्रशिक्षण डेटा पाठ, गणित और स्रोतों से कोड का उपयोग करता है, जिसमें डोलमा V1.7, OpenCoder और DCLM-BASELINE शामिल हैं। प्रीट्रेनिंग ने 580 बिलियन टोकन का उपयोग किया, जो कि 96 एनवीडिया एच 800 जीपीयू पर 256 घंटे से अधिक के बिना अप्राप्य हानि स्पाइक्स के बिना निष्पादित किया गया। 1B पैरामीटर स्तर पर व्यापक डिजाइन प्रयोग ने महत्वपूर्ण घटकों की पहचान की, जिसमें QWEN2.5 और Llama3 जैसे ऑटोरेग्रेसिव मॉडल से वजन आरंभीकरण शामिल है, साथ ही संदर्भ-अनुकूली टोकन-स्तरीय शोर पुनर्निर्धारण के साथ-साथ ड्रीम 7B प्रशिक्षण के लिए आवश्यक साबित हुआ।

Huawei Noah’s Ark Lab ने ड्रीम 7B जारी किया: उन्नत योजना और लचीली निष्कर्ष क्षमताओं के साथ एक शक्तिशाली खुला प्रसार तर्क मॉडल
 – Gadgets Solutions

प्रस्तावित विधि का मूल्यांकन काउंटडाउन और सुदोकू कार्यों पर समायोज्य नियोजन कठिनाई के साथ किया जाता है, जो कि LLADA 8B, QWEN2.5 7B, LLAMA3 8B, और DEEPSEEK V3 671B के खिलाफ तुलना करता है। यह समान रूप से आकार के आधारभूत मॉडल को बेहतर बनाता है, दोनों प्रसार मॉडल ऑटोरेग्रेसिव विकल्पों को पार करते हैं। ये प्रसार मॉडल कभी-कभी अपने बड़े पैमाने पर पैरामीटर की गिनती के बावजूद डीपसेक वी 3 से अधिक से अधिक होते हैं, जो बहु-समावेशी समस्या-समाधान और विशिष्ट-उद्देश्य कार्यों के लिए प्रसार मॉडल की प्रभावशीलता दिखाते हैं। विधि ने तीन युगों में तुलु 3 और SMOLLM2 डेटासेट से 1.8M निर्देश जोड़े का उपयोग करके ठीक-ट्यूनिंग पोस्ट-ट्रेनिंग की देखरेख की। परिणाम ऑटोरेग्रेसिव मॉडल प्रदर्शन से मेल करने के लिए ड्रीम की क्षमता का संकेत देते हैं:

अंत में, शोधकर्ताओं ने ड्रीम 7 बी की शुरुआत की, जो सावधानीपूर्वक विकसित प्रशिक्षण पद्धति के माध्यम से दक्षता, स्केलेबिलिटी और लचीलेपन की विशेषता वाले प्रसार भाषा मॉडल के एक सफलता परिवार का प्रतिनिधित्व करता है। ये मॉडल सामान्य कार्यों, गणित और कोडिंग अनुप्रयोगों में समान आकार के प्रमुख ऑटोरेग्रेसिव मॉडल के साथ तुलनात्मक रूप से प्रदर्शन करते हैं। ड्रीम की सबसे विशिष्ट ताकत उन्नत नियोजन परिदृश्यों और लचीली अनुमान क्षमताओं में उभरती है, जहां इसकी प्रसार-आधारित वास्तुकला पारंपरिक ऑटोरेसिव दृष्टिकोणों पर महत्वपूर्ण लाभ प्रदान करती है। यह उपलब्धि भाषा मॉडल विकास में एक सम्मोहक वैकल्पिक पथ के रूप में प्रसार मॉडल की व्यवहार्यता को दर्शाती है।


चेक आउट ड्रीम-ऑर्ग/ड्रीम-वी 0-इंस्ट्रक्ट -7 बी और ड्रीम-ऑर्ग/ड्रीम-वी 0-बेस -7 बी। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट

🔥


सज्जाद अंसारी IIT खड़गपुर से अंतिम वर्ष के स्नातक हैं। एक तकनीकी उत्साही के रूप में, वह एआई प्रौद्योगिकियों के प्रभाव और उनके वास्तविक दुनिया के निहितार्थों के प्रभाव को समझने पर ध्यान देने के साथ एआई के व्यावहारिक अनुप्रयोगों में देरी करता है। वह स्पष्ट और सुलभ तरीके से जटिल एआई अवधारणाओं को स्पष्ट करने का लक्ष्य रखता है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

FOLLOW US

150,000FansLike
35,000FollowersFollow
100,000SubscribersSubscribe

Related Stories

Translate »