Monday, April 21, 2025

आईबीएम ग्रेनाइट 3.3 8 बी जारी करता है: एक नया भाषण-से-पाठ (एसटीटी) मॉडल जो स्वचालित भाषण मान्यता (एएसआर) और स्वचालित भाषण अनुवाद (एएसटी) में उत्कृष्टता प्राप्त करता है – Gadgets Solutions

-

चूंकि आर्टिफिशियल इंटेलिजेंस एंटरप्राइज सिस्टम में एकीकृत करना जारी रखता है, इसलिए लचीलेपन, दक्षता और पारदर्शिता को संयोजित करने वाले मॉडलों की मांग बढ़ गई है। मौजूदा समाधान अक्सर इन सभी आवश्यकताओं को पूरा करने के लिए संघर्ष करते हैं। ओपन-सोर्स मॉडल में डोमेन-विशिष्ट क्षमताओं की कमी हो सकती है, जबकि मालिकाना प्रणाली कभी-कभी पहुंच या अनुकूलनशीलता को सीमित करती है। यह कमी विशेष रूप से भाषण मान्यता, तार्किक तर्क, और पुनर्प्राप्ति-अनुमानित पीढ़ी (RAG) से जुड़े कार्यों में स्पष्ट है, जहां तकनीकी विखंडन और टूलचेन असंगति परिचालन अड़चनें पैदा करते हैं।

आईबीएम भाषण, तर्क और पुनर्प्राप्ति में अपडेट के साथ ग्रेनाइट 3.3 जारी करता है

आईबीएम ने ग्रेनाइट 3.3 को पेश किया है, जो उद्यम अनुप्रयोगों के लिए खुले तौर पर उपलब्ध फाउंडेशन मॉडल का एक सेट है। यह रिलीज़ तीन डोमेन में अपग्रेड प्रदान करता है: भाषण प्रसंस्करण, तर्क क्षमताएं और पुनर्प्राप्ति तंत्र। ग्रेनाइट स्पीच 3.3 8 बी आईबीएम का पहला ओपन स्पीच-टू-टेक्स्ट (एसटीटी) और ऑटोमैटिक स्पीच ट्रांसलेशन (एएसटी) मॉडल है। यह कानाफूसी-आधारित प्रणालियों की तुलना में उच्च प्रतिलेखन सटीकता और बेहतर अनुवाद गुणवत्ता प्राप्त करता है। मॉडल को कम कलाकृतियों के परिचय के साथ लंबे ऑडियो अनुक्रमों को संभालने के लिए डिज़ाइन किया गया है, वास्तविक दुनिया के परिदृश्यों में प्रयोज्य को बढ़ाता है।

ग्रेनाइट 3.3 8B निर्देश फिल-इन-द-मिडिल (FIM) पाठ पीढ़ी के समर्थन और प्रतीकात्मक और गणितीय तर्क में सुधार के लिए कोर मॉडल की क्षमताओं का विस्तार करता है। ये संवर्द्धन बेंचमार्क प्रदर्शन में परिलक्षित होते हैं, जिसमें Math500 डेटासेट पर Llama 3.1 8B और क्लाउड 3.5 HAIKU शामिल हैं।

आईबीएम ग्रेनाइट 3.3 8 बी जारी करता है: एक नया भाषण-से-पाठ (एसटीटी) मॉडल जो स्वचालित भाषण मान्यता (एएसआर) और स्वचालित भाषण अनुवाद (एएसटी) में उत्कृष्टता प्राप्त करता है
 – Gadgets Solutions

तकनीकी नींव और वास्तुकला

ग्रेनाइट भाषण 3.3 8 बी एक मॉड्यूलर आर्किटेक्चर का उपयोग करता है जिसमें एक भाषण एनकोडर और लोरा-आधारित ऑडियो एडेप्टर शामिल हैं। यह डिज़ाइन बेस मॉडल की सामान्यीकरण क्षमता को बनाए रखते हुए कुशल डोमेन-विशिष्ट फाइन-ट्यूनिंग के लिए अनुमति देता है। मॉडल ट्रांसक्रिप्शन और ट्रांसलेशन कार्यों दोनों का समर्थन करता है, जो क्रॉस-लिंगुअल कंटेंट प्रोसेसिंग को सक्षम करता है।

ग्रेनाइट 3.3 निर्देश मॉडल में फिल-इन-द-मिडिल पीढ़ी को शामिल किया गया है, जो दस्तावेज़ संपादन और कोड पूर्णता जैसे कार्यों का समर्थन करते हैं। साथ ही, आईबीएम ने राग वर्कफ़्लोज़ के लिए सिलवाए गए पांच लोरा एडेप्टर का परिचय दिया। ये एडेप्टर बाहरी ज्ञान के बेहतर एकीकरण का समर्थन करते हैं, पीढ़ी के दौरान तथ्यात्मक सटीकता और प्रासंगिक प्रासंगिकता में सुधार करते हैं।

एक उल्लेखनीय जोड़ अनुकूली लोरा (अलोरा) है, जो निष्कर्ष सत्रों में कुंजी-मूल्य (केवी) कैश का पुन: उपयोग करता है। यह मेमोरी की खपत और विलंबता में कमी की ओर जाता है, विशेष रूप से स्ट्रीमिंग या मल्टी-हॉप पुनर्प्राप्ति वातावरण में। अलोरा को कम्प्यूटेशनल ओवरहेड और पुनर्प्राप्ति-भारी वर्कलोड में प्रदर्शन के बीच बेहतर व्यापार-बंद की पेशकश करने के लिए डिज़ाइन किया गया है।

बेंचमार्क परिणाम और प्लेटफ़ॉर्म समर्थन

ग्रेनाइट स्पीच 3.3 8 बी कई भाषाओं में ट्रांसक्रिप्शन और ट्रांसलेशन में व्हिस्पर-स्टाइल बेसलाइन पर बेहतर प्रदर्शन को प्रदर्शित करता है। मॉडल विस्तारित ऑडियो इनपुट पर मज़बूती से प्रदर्शन करता है, महत्वपूर्ण बहाव के बिना सुसंगतता और सटीकता बनाए रखता है।

प्रतीकात्मक तर्क में, ग्रेनाइट 3.3 निर्देश Math500 बेंचमार्क पर बेहतर सटीकता दिखाता है, 8B पैरामीटर पैमाने पर तुलनीय मॉडल से बेहतर प्रदर्शन करता है। रग-विशिष्ट लोरा और अलोरा एडेप्टर बढ़ाया पुनर्प्राप्ति एकीकरण और ग्राउंडिंग का प्रदर्शन करते हैं, जो कि गतिशील सामग्री और लंबे समय से संदर्भ प्रश्नों से जुड़े उद्यम अनुप्रयोगों के लिए महत्वपूर्ण हैं।

आईबीएम ने सभी मॉडलों, लोरा वेरिएंट और संबंधित उपकरणों को ओपन-सोर्स और एक्सेसिबल गले के माध्यम से सुलभ बनाया है। इसके अतिरिक्त, परिनियोजन विकल्प IBM के Watsonx.ai के साथ-साथ ओलामा, LMSTUDIO सहित तीसरे पक्ष के प्लेटफार्मों और प्रतिकृति के माध्यम से उपलब्ध हैं।

निष्कर्ष

ग्रेनाइट 3.3 आईबीएम के मजबूत, मॉड्यूलर और पारदर्शी एआई सिस्टम को विकसित करने के प्रयास में एक कदम आगे बढ़ाता है। रिलीज भाषण प्रसंस्करण, तार्किक निष्कर्ष और पुनर्प्राप्ति-अगस्त पीढ़ी में महत्वपूर्ण आवश्यकताओं को लक्षित करता है, जो कि औसत दर्जे के सुधारों में तकनीकी उन्नयन की पेशकश करता है। स्मृति-कुशल पुनर्प्राप्ति के लिए अलोरा का समावेश, भरने वाले कार्यों के लिए समर्थन, और बहुभाषी भाषण मॉडलिंग में प्रगति ग्रेनाइट 3.3 को उद्यम वातावरण के लिए एक तकनीकी रूप से ध्वनि विकल्प बनाते हैं। इसकी ओपन-सोर्स रिलीज़ ने व्यापक एआई समुदाय में अपनाने, प्रयोग और निरंतर विकास को प्रोत्साहित किया।


इसकी जाँच पड़ताल करो गले लगाने के चेहरे और तकनीकी विवरण पर मॉडल श्रृंखला। इसके अलावा, हमें फॉलो करना न भूलें ट्विटर और हमारे साथ जुड़ें तार -चैनल और लिंक्डइन जीआरओयूपी। हमारे साथ जुड़ने के लिए मत भूलना 90K+ एमएल सबरेडिट

🔥


Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

FOLLOW US

150,000FansLike
35,000FollowersFollow
100,000SubscribersSubscribe

Related Stories

Translate »