चूंकि आर्टिफिशियल इंटेलिजेंस एंटरप्राइज सिस्टम में एकीकृत करना जारी रखता है, इसलिए लचीलेपन, दक्षता और पारदर्शिता को संयोजित करने वाले मॉडलों की मांग बढ़ गई है। मौजूदा समाधान अक्सर इन सभी आवश्यकताओं को पूरा करने के लिए संघर्ष करते हैं। ओपन-सोर्स मॉडल में डोमेन-विशिष्ट क्षमताओं की कमी हो सकती है, जबकि मालिकाना प्रणाली कभी-कभी पहुंच या अनुकूलनशीलता को सीमित करती है। यह कमी विशेष रूप से भाषण मान्यता, तार्किक तर्क, और पुनर्प्राप्ति-अनुमानित पीढ़ी (RAG) से जुड़े कार्यों में स्पष्ट है, जहां तकनीकी विखंडन और टूलचेन असंगति परिचालन अड़चनें पैदा करते हैं।
आईबीएम भाषण, तर्क और पुनर्प्राप्ति में अपडेट के साथ ग्रेनाइट 3.3 जारी करता है
आईबीएम ने ग्रेनाइट 3.3 को पेश किया है, जो उद्यम अनुप्रयोगों के लिए खुले तौर पर उपलब्ध फाउंडेशन मॉडल का एक सेट है। यह रिलीज़ तीन डोमेन में अपग्रेड प्रदान करता है: भाषण प्रसंस्करण, तर्क क्षमताएं और पुनर्प्राप्ति तंत्र। ग्रेनाइट स्पीच 3.3 8 बी आईबीएम का पहला ओपन स्पीच-टू-टेक्स्ट (एसटीटी) और ऑटोमैटिक स्पीच ट्रांसलेशन (एएसटी) मॉडल है। यह कानाफूसी-आधारित प्रणालियों की तुलना में उच्च प्रतिलेखन सटीकता और बेहतर अनुवाद गुणवत्ता प्राप्त करता है। मॉडल को कम कलाकृतियों के परिचय के साथ लंबे ऑडियो अनुक्रमों को संभालने के लिए डिज़ाइन किया गया है, वास्तविक दुनिया के परिदृश्यों में प्रयोज्य को बढ़ाता है।
ग्रेनाइट 3.3 8B निर्देश फिल-इन-द-मिडिल (FIM) पाठ पीढ़ी के समर्थन और प्रतीकात्मक और गणितीय तर्क में सुधार के लिए कोर मॉडल की क्षमताओं का विस्तार करता है। ये संवर्द्धन बेंचमार्क प्रदर्शन में परिलक्षित होते हैं, जिसमें Math500 डेटासेट पर Llama 3.1 8B और क्लाउड 3.5 HAIKU शामिल हैं।

तकनीकी नींव और वास्तुकला
ग्रेनाइट भाषण 3.3 8 बी एक मॉड्यूलर आर्किटेक्चर का उपयोग करता है जिसमें एक भाषण एनकोडर और लोरा-आधारित ऑडियो एडेप्टर शामिल हैं। यह डिज़ाइन बेस मॉडल की सामान्यीकरण क्षमता को बनाए रखते हुए कुशल डोमेन-विशिष्ट फाइन-ट्यूनिंग के लिए अनुमति देता है। मॉडल ट्रांसक्रिप्शन और ट्रांसलेशन कार्यों दोनों का समर्थन करता है, जो क्रॉस-लिंगुअल कंटेंट प्रोसेसिंग को सक्षम करता है।
ग्रेनाइट 3.3 निर्देश मॉडल में फिल-इन-द-मिडिल पीढ़ी को शामिल किया गया है, जो दस्तावेज़ संपादन और कोड पूर्णता जैसे कार्यों का समर्थन करते हैं। साथ ही, आईबीएम ने राग वर्कफ़्लोज़ के लिए सिलवाए गए पांच लोरा एडेप्टर का परिचय दिया। ये एडेप्टर बाहरी ज्ञान के बेहतर एकीकरण का समर्थन करते हैं, पीढ़ी के दौरान तथ्यात्मक सटीकता और प्रासंगिक प्रासंगिकता में सुधार करते हैं।
एक उल्लेखनीय जोड़ अनुकूली लोरा (अलोरा) है, जो निष्कर्ष सत्रों में कुंजी-मूल्य (केवी) कैश का पुन: उपयोग करता है। यह मेमोरी की खपत और विलंबता में कमी की ओर जाता है, विशेष रूप से स्ट्रीमिंग या मल्टी-हॉप पुनर्प्राप्ति वातावरण में। अलोरा को कम्प्यूटेशनल ओवरहेड और पुनर्प्राप्ति-भारी वर्कलोड में प्रदर्शन के बीच बेहतर व्यापार-बंद की पेशकश करने के लिए डिज़ाइन किया गया है।

बेंचमार्क परिणाम और प्लेटफ़ॉर्म समर्थन
ग्रेनाइट स्पीच 3.3 8 बी कई भाषाओं में ट्रांसक्रिप्शन और ट्रांसलेशन में व्हिस्पर-स्टाइल बेसलाइन पर बेहतर प्रदर्शन को प्रदर्शित करता है। मॉडल विस्तारित ऑडियो इनपुट पर मज़बूती से प्रदर्शन करता है, महत्वपूर्ण बहाव के बिना सुसंगतता और सटीकता बनाए रखता है।
प्रतीकात्मक तर्क में, ग्रेनाइट 3.3 निर्देश Math500 बेंचमार्क पर बेहतर सटीकता दिखाता है, 8B पैरामीटर पैमाने पर तुलनीय मॉडल से बेहतर प्रदर्शन करता है। रग-विशिष्ट लोरा और अलोरा एडेप्टर बढ़ाया पुनर्प्राप्ति एकीकरण और ग्राउंडिंग का प्रदर्शन करते हैं, जो कि गतिशील सामग्री और लंबे समय से संदर्भ प्रश्नों से जुड़े उद्यम अनुप्रयोगों के लिए महत्वपूर्ण हैं।
आईबीएम ने सभी मॉडलों, लोरा वेरिएंट और संबंधित उपकरणों को ओपन-सोर्स और एक्सेसिबल गले के माध्यम से सुलभ बनाया है। इसके अतिरिक्त, परिनियोजन विकल्प IBM के Watsonx.ai के साथ-साथ ओलामा, LMSTUDIO सहित तीसरे पक्ष के प्लेटफार्मों और प्रतिकृति के माध्यम से उपलब्ध हैं।
निष्कर्ष
ग्रेनाइट 3.3 आईबीएम के मजबूत, मॉड्यूलर और पारदर्शी एआई सिस्टम को विकसित करने के प्रयास में एक कदम आगे बढ़ाता है। रिलीज भाषण प्रसंस्करण, तार्किक निष्कर्ष और पुनर्प्राप्ति-अगस्त पीढ़ी में महत्वपूर्ण आवश्यकताओं को लक्षित करता है, जो कि औसत दर्जे के सुधारों में तकनीकी उन्नयन की पेशकश करता है। स्मृति-कुशल पुनर्प्राप्ति के लिए अलोरा का समावेश, भरने वाले कार्यों के लिए समर्थन, और बहुभाषी भाषण मॉडलिंग में प्रगति ग्रेनाइट 3.3 को उद्यम वातावरण के लिए एक तकनीकी रूप से ध्वनि विकल्प बनाते हैं। इसकी ओपन-सोर्स रिलीज़ ने व्यापक एआई समुदाय में अपनाने, प्रयोग और निरंतर विकास को प्रोत्साहित किया।
इसकी जाँच पड़ताल करो गले लगाने के चेहरे और तकनीकी विवरण पर मॉडल श्रृंखला। इसके अलावा, हमें फॉलो करना न भूलें ट्विटर और हमारे साथ जुड़ें तार -चैनल और लिंक्डइन जीआरओयूपी। हमारे साथ जुड़ने के लिए मत भूलना 90K+ एमएल सबरेडिट।
🔥 ।

Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।
