Friday, April 11, 2025

नामांकित खुले स्रोत अत्याधुनिक मल्टीमॉडल एम्बेडिंग मॉडल – Gadgets Solutions

-

NOMIC ने “NOMIC EMBED MULTIMODAL” की रिलीज़ की घोषणा की है, जो एक ग्राउंडब्रेकिंग एम्बेडिंग मॉडल है जो दृश्य दस्तावेज़ पुनर्प्राप्ति कार्यों पर अत्याधुनिक प्रदर्शन को प्राप्त करता है। नया मॉडल मूल रूप से इंटरलेवेड टेक्स्ट, इमेज और स्क्रीनशॉट को संसाधित करता है, जो विडोर-वी 2 बेंचमार्क पर विजुअल डॉक्यूमेंट रिट्रीवल के लिए एक नया उच्च स्कोर स्थापित करता है। यह उन्नति पीडीएफ दस्तावेजों के साथ काम करने वाले पुनर्प्राप्ति संवर्धित पीढ़ी (आरएजी) अनुप्रयोगों के लिए विशेष रूप से महत्वपूर्ण है, जहां दृश्य और पाठ के संदर्भ को कैप्चर करना महत्वपूर्ण है।

दृश्य दस्तावेज़ पुनर्प्राप्ति में नई जमीन को तोड़ना

NOMIC EMBED MULTIMODAL 7B मॉडल ने Vidore-V2 बेंचमार्क पर 62.7 NDCG@5 स्कोर हासिल किया है, जो पिछले सर्वश्रेष्ठ प्रदर्शन करने वाले मॉडल पर 2.8-पॉइंट सुधार का प्रतिनिधित्व करता है। यह उन्नति दस्तावेज़ प्रसंस्करण के लिए मल्टीमॉडल एम्बेडिंग के विकास में एक महत्वपूर्ण मील का पत्थर है।

पारंपरिक पुनर्प्राप्ति प्रणालियों के विपरीत, जो मुख्य रूप से निकाले गए पाठ पर भरोसा करते हैं और अक्सर महत्वपूर्ण दृश्य तत्वों को याद करते हैं, NOMIC का नया मॉडल सीधे पाठ और दृश्य घटकों दोनों को एम्बेड करके दस्तावेजों की पूरी समृद्धि को कैप्चर करता है। यह दृष्टिकोण आमतौर पर दस्तावेज़ विश्लेषण में उपयोग की जाने वाली जटिल, त्रुटि-प्रवण प्रसंस्करण पाइपलाइनों की आवश्यकता को समाप्त करता है।

वास्तविक दुनिया के दस्तावेज़ चुनौतियों को हल करना

दस्तावेज़ स्वाभाविक रूप से मल्टीमॉडल हैं, पाठ, आंकड़े, पृष्ठ लेआउट, टेबल और यहां तक ​​कि फोंट के माध्यम से जानकारी व्यक्त करते हैं। पारंपरिक पाठ-केवल सिस्टम इस जटिलता के साथ संघर्ष करते हैं, अक्सर दृश्य और पाठ इनपुट या जटिल प्रीप्रोसेसिंग पाइपलाइनों के लिए अलग-अलग एनकोडर की आवश्यकता होती है।

NoMic Embed मल्टीमॉडल एक एकल मॉडल में इंटरलेवेड टेक्स्ट और इमेज इनपुट का समर्थन करके एक सुरुचिपूर्ण समाधान प्रदान करता है, जिससे यह आदर्श बन जाता है:

  • पीडीएफ दस्तावेज और शोध पत्र
  • अनुप्रयोगों और वेबसाइटों के स्क्रीनशॉट
  • नेत्रहीन समृद्ध सामग्री जहां लेआउट मायने रखता है
  • बहुभाषी दस्तावेज जहां दृश्य संदर्भ महत्वपूर्ण है

एक पूर्ण एम्बेडिंग पारिस्थितिकी तंत्र

NOMIC EMBED मल्टीमॉडल की रिलीज़ के साथ, NOMIC ने कई डोमेन में अत्याधुनिक प्रदर्शन प्राप्त करने वाले मॉडल के एक व्यापक सूट को अंतिम रूप दिया है:

  • नामिक एम्बेड मल्टीमॉडल: नवीनतम जोड़ जो इंटरलेवेड टेक्स्ट, इमेज और स्क्रीनशॉट पर अत्याधुनिक प्रदर्शन को प्राप्त करता है। यह दस्तावेज़ पुनर्प्राप्ति वर्कफ़्लो के लिए आदर्श है।
  • नॉमिक एम्बेड टेक्स्ट v2: एक शक्तिशाली बहुभाषी पाठ एम्बेडिंग मॉडल जो चमत्कार बेंचमार्क पर अत्याधुनिक प्रदर्शन को प्राप्त करता है। यह किसी भी भाषा में पाठ पुनर्प्राप्ति वर्कफ़्लो के लिए आदर्श है।
  • नामिक एम्बेड कोड: एक एम्बेडिंग मॉडल जो कोड खोज अनुप्रयोगों के लिए विशिष्ट है, कोडसर्चनेट बेंचमार्क पर एक अत्याधुनिक स्कोर प्राप्त करता है। यह कोड एजेंट अनुप्रयोगों के लिए आदर्श है।

यह पूर्ण पारिस्थितिकी तंत्र विविध डेटा प्रकारों को संभालने के लिए कटिंग-एज टूल के साथ डेवलपर्स को शुद्ध पाठ से लेकर जटिल मल्टीमॉडल दस्तावेजों और विशेष कोड रिपॉजिटरी तक प्रदान करता है। पारिस्थितिकी तंत्र में प्रत्येक मॉडल को अपने डोमेन में सर्वश्रेष्ठ-इन-क्लास प्रदर्शन प्रदान करते हुए आधुनिक राग वर्कफ़्लोज़ के साथ मूल रूप से काम करने के लिए डिज़ाइन किया गया है।

उपलब्धता

नॉमिक ने अपने मल्टीमॉडल एम्बेडिंग मॉडल को हगिंग फेस पर उपलब्ध कराया है, साथ ही इसी डेटासेट और गिथब रिपॉजिटरी के साथ, यह अत्याधुनिक तकनीक दुनिया भर में शोधकर्ताओं और डेवलपर्स के लिए सुलभ है।

यह रिलीज मल्टीमॉडल प्रतिनिधित्व सीखने और दस्तावेज़ समझ में एक महत्वपूर्ण कदम का प्रतिनिधित्व करता है, जो डेटा मोडलिटी के पूर्ण स्पेक्ट्रम में अत्याधुनिक एम्बेडिंग समाधान प्रदान करने के लिए NOMIC की दृष्टि को पूरा करता है।

उपलब्धता (Nomic ATLAS डेटा और एम्बेडिंग प्लेटफ़ॉर्म) में आगामी है (https://atlas.nomic.ai)


इस लेख के लिए विचार नेतृत्व/ संसाधनों के लिए नॉमिक टीम के लिए धन्यवाद। NOMIC टीम ने हमें आर्थिक रूप से और इस लेख के लिए सामग्री द्वारा समर्थन किया है।


नामांकित खुले स्रोत अत्याधुनिक मल्टीमॉडल एम्बेडिंग मॉडल
 – Gadgets Solutions

Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

FOLLOW US

150,000FansLike
35,000FollowersFollow
100,000SubscribersSubscribe

Related Stories

Translate »