आर्टिफिशियल इंटेलिजेंस (एआई) ने हाल के वर्षों में महत्वपूर्ण प्रगति की है, फिर भी चुनौतियां कुशल, लागत प्रभावी और उच्च प्रदर्शन वाले मॉडल को प्राप्त करने में बनी रहती हैं। बड़े भाषा मॉडल (एलएलएम) को विकसित करने के लिए अक्सर पर्याप्त कम्प्यूटेशनल संसाधनों और वित्तीय निवेश की आवश्यकता होती है, जो कई संगठनों के लिए निषेधात्मक हो सकता है। इसके अतिरिक्त, यह सुनिश्चित करना कि इन मॉडलों में मजबूत तर्क क्षमताएं हैं और उपभोक्ता-ग्रेड हार्डवेयर पर प्रभावी ढंग से तैनात किया जा सकता है एक बाधा बनी हुई है।
दीपसेक एआई ने इन चुनौतियों को संबोधित किया है, जो कि डीपसेक-वी 3-0324 की रिहाई के साथ, अपने वी 3 बड़े भाषा मॉडल के लिए एक महत्वपूर्ण उन्नयन है। यह नया मॉडल न केवल प्रदर्शन को बढ़ाता है, बल्कि एक प्रभावशाली गति से भी संचालित होता है 20 टोकन प्रति सेकंड एक मैक स्टूडियो पर, एक उपभोक्ता-ग्रेड डिवाइस। यह उन्नति ओपनईआई जैसे उद्योग के नेताओं के साथ प्रतिस्पर्धा को तेज करती है, उच्च गुणवत्ता वाले एआई मॉडल को अधिक सुलभ और कुशल बनाने के लिए दीपसेक की प्रतिबद्धता को प्रदर्शित करती है।
दीपसेक-वी 3-0324 अपने पूर्ववर्ती पर कई तकनीकी सुधारों का परिचय देता है। विशेष रूप से, यह तर्क क्षमताओं में महत्वपूर्ण वृद्धि को प्रदर्शित करता है, जिसमें बेंचमार्क स्कोर में पर्याप्त वृद्धि दिखाई देती है:
- MMLU-PRO: 75.9 → 81.2 (+5.3)
- GPQA: 59.1 → 68.4 (+9.3)
- Aime: 39.6 → 59.4 (+19.8)
- LiveCodebench: 39.2 → 49.2 (+10.0)
ये सुधार जटिल कार्यों की अधिक मजबूत समझ और प्रसंस्करण का संकेत देते हैं। इसके अतिरिक्त, मॉडल ने फ्रंट-एंड वेब डेवलपमेंट स्किल्स को बढ़ाया है, जो अधिक निष्पादन योग्य कोड और सौंदर्यवादी रूप से मनभावन वेब पेज और गेम इंटरफेस का उत्पादन करता है। इसकी चीनी लेखन प्रवीणता ने भी प्रगति देखी है, R1 लेखन शैली के साथ संरेखित किया गया है और मध्यम-से-लंबी-लंबी सामग्री की गुणवत्ता में सुधार किया गया है। इसके अलावा, फ़ंक्शन कॉलिंग सटीकता में वृद्धि हुई है, पिछले संस्करणों में मौजूद मुद्दों को संबोधित करते हुए।

MIT लाइसेंस के तहत दीपसेक-V3-0324 की रिहाई ने ओपन-सोर्स सहयोग के लिए डीपसेक एआई के समर्पण को रेखांकित किया, जिससे दुनिया भर में डेवलपर्स को प्रतिबंधात्मक लाइसेंसिंग बाधाओं के बिना इस तकनीक का उपयोग करने और निर्माण करने की अनुमति मिलती है। मैक स्टूडियो जैसे उपकरणों पर कुशलता से चलने की मॉडल की क्षमता, प्रति सेकंड 20 टोकन प्राप्त करना, इसकी व्यावहारिक प्रयोज्यता और दक्षता का उदाहरण देता है। यह प्रदर्शन स्तर न केवल उन्नत एआई को अधिक सुलभ बनाता है, बल्कि महंगे, विशेष हार्डवेयर पर निर्भरता को भी कम करता है, जिससे कई उपयोगकर्ताओं और संगठनों के लिए प्रवेश के लिए बाधा कम हो जाती है।
अंत में, दीपसेक एआई की डीपसेक-वी 3-0324 की रिहाई एआई परिदृश्य में एक महत्वपूर्ण मील का पत्थर है। प्रदर्शन, लागत और पहुंच से संबंधित प्रमुख चुनौतियों को संबोधित करके, डीपसेक ने ओपनईआई जैसी स्थापित संस्थाओं के लिए एक दुर्जेय प्रतियोगी के रूप में खुद को तैनात किया है। मॉडल की तकनीकी प्रगति और ओपन-सोर्स उपलब्धता ने एआई तकनीक को आगे बढ़ाने, नवाचार को बढ़ावा देने और विभिन्न क्षेत्रों में व्यापक गोद लेने का वादा किया।
चेक आउट चेहरे पर गले लगाने पर मॉडल। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।

Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।