Friday, April 4, 2025

Salesforce AI ने Bingoguard का परिचय दिया: एक LLM- आधारित मॉडरेशन सिस्टम जिसे बाइनरी सेफ्टी लेबल और गंभीरता दोनों स्तरों की भविष्यवाणी करने के लिए डिज़ाइन किया गया है – Gadgets Solutions

-

बड़ी भाषा मॉडल (एलएलएम) की उन्नति ने इंटरैक्टिव प्रौद्योगिकियों को काफी प्रभावित किया है, जो लाभ और चुनौतियों दोनों को प्रस्तुत करते हैं। इन मॉडलों से उत्पन्न एक प्रमुख मुद्दा हानिकारक सामग्री उत्पन्न करने की उनकी क्षमता है। पारंपरिक मॉडरेशन सिस्टम, आमतौर पर द्विआधारी वर्गीकरण (सुरक्षित बनाम असुरक्षित) को नियोजित करते हैं, जो कि हानिकारकता के अलग -अलग स्तरों को प्रभावी ढंग से अलग करने के लिए आवश्यक दानेदारता का अभाव है। यह सीमा या तो अत्यधिक प्रतिबंधात्मक मॉडरेशन, उपयोगकर्ता इंटरैक्शन को कम कर सकती है, या अपर्याप्त फ़िल्टरिंग कर सकती है, जो उपयोगकर्ताओं को हानिकारक सामग्री के लिए उजागर कर सकती है।

Salesforce AI, Bingoguard, एक LLM- आधारित मॉडरेशन सिस्टम का परिचय देता है, जिसे बाइनरी सुरक्षा लेबल और विस्तृत गंभीरता स्तरों की भविष्यवाणी करके द्विआधारी वर्गीकरण की अपर्याप्तता को संबोधित करने के लिए डिज़ाइन किया गया है। Bingoguard एक संरचित वर्गीकरण का उपयोग करता है, जिसमें हिंसक अपराध, यौन सामग्री, अपवित्रता, गोपनीयता आक्रमण और हथियार से संबंधित सामग्री सहित ग्यारह विशिष्ट क्षेत्रों में संभावित हानिकारक सामग्री को वर्गीकृत किया गया है। प्रत्येक श्रेणी में सौम्य (स्तर 0) से लेकर चरम जोखिम (स्तर 4) तक पांच स्पष्ट रूप से परिभाषित गंभीरता स्तर शामिल हैं। यह संरचना प्लेटफार्मों को उनके विशिष्ट सुरक्षा दिशानिर्देशों के अनुसार उनकी मॉडरेशन सेटिंग्स को ठीक करने में सक्षम बनाती है, जिससे अलग -अलग गंभीरता संदर्भों में उचित सामग्री प्रबंधन सुनिश्चित होता है।

Salesforce AI ने Bingoguard का परिचय दिया: एक LLM- आधारित मॉडरेशन सिस्टम जिसे बाइनरी सेफ्टी लेबल और गंभीरता दोनों स्तरों की भविष्यवाणी करने के लिए डिज़ाइन किया गया है
 – Gadgets Solutions

एक तकनीकी दृष्टिकोण से, Bingoguard अपने व्यापक प्रशिक्षण डेटासेट, Bingoguardtrain को इकट्ठा करने के लिए एक “जनरेट-तब-फ़िल्टर” कार्यप्रणाली को नियुक्त करता है, जिसमें 54,897 प्रविष्टियाँ शामिल हैं, जिसमें कई गंभीरता स्तर और सामग्री शैलियों को फैली हुई है। यह ढांचा शुरू में विभिन्न गंभीरता स्तरों के अनुरूप प्रतिक्रियाएं उत्पन्न करता है, बाद में परिभाषित गुणवत्ता और प्रासंगिकता मानकों के साथ संरेखण सुनिश्चित करने के लिए इन आउटपुट को फ़िल्टर करता है। विशेष LLM ध्यान से चयनित और विशेषज्ञ रूप से ऑडिट किए गए बीज डेटासेट का उपयोग करते हुए, प्रत्येक गंभीरता स्तर के लिए व्यक्तिगत ठीक-ट्यूनिंग प्रक्रियाओं से गुजरते हैं। यह ठीक-ट्यूनिंग गारंटी देता है कि उत्पन्न आउटपुट पूर्वनिर्धारित गंभीरता रूब्रिक्स के बारीकी से पालन करते हैं। परिणामी मॉडरेशन मॉडल, Bingoguard-8b, हानिकारक सामग्री के विभिन्न डिग्री के बीच सटीक भेदभाव को सक्षम करते हुए, इस सावधानीपूर्वक क्यूरेट किए गए डेटासेट का लाभ उठाता है। नतीजतन, मॉडरेशन सटीकता और लचीलेपन में काफी वृद्धि होती है।

Bingoguard के अनुभवजन्य मूल्यांकन मजबूत प्रदर्शन का संकेत देते हैं। Bingoguardtest के खिलाफ परीक्षण, एक विशेषज्ञ-लेबल वाला डेटासेट जिसमें 988 उदाहरण शामिल हैं, से पता चला है कि Bingoguard-8b 4.3%तक के सुधार के साथ, वाइल्डगार्ड और शील्डगैमा जैसे प्रमुख मॉडरेशन मॉडल की तुलना में उच्च पहचान सटीकता प्राप्त करता है। विशेष रूप से, बिंगोगुआर्ड कम-गंभीरता सामग्री (स्तर 1 और 2) की पहचान करने में बेहतर सटीकता का प्रदर्शन करता है, पारंपरिक रूप से द्विआधारी वर्गीकरण प्रणालियों के लिए मुश्किल है। इसके अतिरिक्त, गहराई से विश्लेषण ने अनुमानित “असुरक्षित” संभावनाओं और वास्तविक गंभीरता स्तर के बीच अपेक्षाकृत कमजोर सहसंबंध को उजागर किया, स्पष्ट रूप से गंभीरता के अंतर को शामिल करने की आवश्यकता को रेखांकित किया। ये निष्कर्ष वर्तमान मॉडरेशन विधियों में मौलिक अंतराल को चित्रित करते हैं जो मुख्य रूप से द्विआधारी वर्गीकरण पर भरोसा करते हैं।

अंत में, बिंगोगुआर्ड द्विआधारी सुरक्षा मूल्यांकन के साथ विस्तृत गंभीरता आकलन को एकीकृत करके एआई-चालित सामग्री मॉडरेशन की सटीकता और प्रभावशीलता को बढ़ाता है। यह दृष्टिकोण प्लेटफार्मों को अधिक सटीकता और संवेदनशीलता के साथ मॉडरेशन को संभालने की अनुमति देता है, जो अत्यधिक सतर्क और अपर्याप्त मॉडरेशन रणनीतियों दोनों से जुड़े जोखिमों को कम करता है। Salesforce का Bingoguard इस प्रकार तेजी से परिष्कृत AI- जनित इंटरैक्शन के भीतर सामग्री मॉडरेशन की जटिलताओं को संबोधित करने के लिए एक बेहतर ढांचा प्रदान करता है।


चेक आउट कागज़। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट

🔥


Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।

LEAVE A REPLY

Please enter your comment!
Please enter your name here

FOLLOW US

150,000FansLike
35,000FollowersFollow
100,000SubscribersSubscribe

Related Stories

Translate »