Salesforce AI ने Bingoguard का परिचय दिया: एक LLM- आधारित मॉडरेशन सिस्टम जिसे बाइनरी सेफ्टी लेबल और गंभीरता दोनों स्तरों की भविष्यवाणी करने के लिए डिज़ाइन किया गया है – Gadgets Solutions

बड़ी भाषा मॉडल (एलएलएम) की उन्नति ने इंटरैक्टिव प्रौद्योगिकियों को काफी प्रभावित किया है, जो लाभ और चुनौतियों दोनों को प्रस्तुत करते हैं। इन मॉडलों से उत्पन्न एक प्रमुख मुद्दा हानिकारक सामग्री उत्पन्न करने की उनकी क्षमता है। पारंपरिक मॉडरेशन सिस्टम, आमतौर पर द्विआधारी वर्गीकरण (सुरक्षित बनाम असुरक्षित) को नियोजित करते हैं, जो कि हानिकारकता के अलग -अलग स्तरों को प्रभावी ढंग से अलग करने के लिए आवश्यक दानेदारता का अभाव है। यह सीमा या तो अत्यधिक प्रतिबंधात्मक मॉडरेशन, उपयोगकर्ता इंटरैक्शन को कम कर सकती है, या अपर्याप्त फ़िल्टरिंग कर सकती है, जो उपयोगकर्ताओं को हानिकारक सामग्री के लिए उजागर कर सकती है।

Salesforce AI, Bingoguard, एक LLM- आधारित मॉडरेशन सिस्टम का परिचय देता है, जिसे बाइनरी सुरक्षा लेबल और विस्तृत गंभीरता स्तरों की भविष्यवाणी करके द्विआधारी वर्गीकरण की अपर्याप्तता को संबोधित करने के लिए डिज़ाइन किया गया है। Bingoguard एक संरचित वर्गीकरण का उपयोग करता है, जिसमें हिंसक अपराध, यौन सामग्री, अपवित्रता, गोपनीयता आक्रमण और हथियार से संबंधित सामग्री सहित ग्यारह विशिष्ट क्षेत्रों में संभावित हानिकारक सामग्री को वर्गीकृत किया गया है। प्रत्येक श्रेणी में सौम्य (स्तर 0) से लेकर चरम जोखिम (स्तर 4) तक पांच स्पष्ट रूप से परिभाषित गंभीरता स्तर शामिल हैं। यह संरचना प्लेटफार्मों को उनके विशिष्ट सुरक्षा दिशानिर्देशों के अनुसार उनकी मॉडरेशन सेटिंग्स को ठीक करने में सक्षम बनाती है, जिससे अलग -अलग गंभीरता संदर्भों में उचित सामग्री प्रबंधन सुनिश्चित होता है।

Salesforce AI ने Bingoguard का परिचय दिया: एक LLM- आधारित मॉडरेशन सिस्टम जिसे बाइनरी सेफ्टी लेबल और गंभीरता दोनों स्तरों की भविष्यवाणी करने के लिए डिज़ाइन किया गया है
– Gadgets Solutions

एक तकनीकी दृष्टिकोण से, Bingoguard अपने व्यापक प्रशिक्षण डेटासेट, Bingoguardtrain को इकट्ठा करने के लिए एक “जनरेट-तब-फ़िल्टर” कार्यप्रणाली को नियुक्त करता है, जिसमें 54,897 प्रविष्टियाँ शामिल हैं, जिसमें कई गंभीरता स्तर और सामग्री शैलियों को फैली हुई है। यह ढांचा शुरू में विभिन्न गंभीरता स्तरों के अनुरूप प्रतिक्रियाएं उत्पन्न करता है, बाद में परिभाषित गुणवत्ता और प्रासंगिकता मानकों के साथ संरेखण सुनिश्चित करने के लिए इन आउटपुट को फ़िल्टर करता है। विशेष LLM ध्यान से चयनित और विशेषज्ञ रूप से ऑडिट किए गए बीज डेटासेट का उपयोग करते हुए, प्रत्येक गंभीरता स्तर के लिए व्यक्तिगत ठीक-ट्यूनिंग प्रक्रियाओं से गुजरते हैं। यह ठीक-ट्यूनिंग गारंटी देता है कि उत्पन्न आउटपुट पूर्वनिर्धारित गंभीरता रूब्रिक्स के बारीकी से पालन करते हैं। परिणामी मॉडरेशन मॉडल, Bingoguard-8b, हानिकारक सामग्री के विभिन्न डिग्री के बीच सटीक भेदभाव को सक्षम करते हुए, इस सावधानीपूर्वक क्यूरेट किए गए डेटासेट का लाभ उठाता है। नतीजतन, मॉडरेशन सटीकता और लचीलेपन में काफी वृद्धि होती है।

Bingoguard के अनुभवजन्य मूल्यांकन मजबूत प्रदर्शन का संकेत देते हैं। Bingoguardtest के खिलाफ परीक्षण, एक विशेषज्ञ-लेबल वाला डेटासेट जिसमें 988 उदाहरण शामिल हैं, से पता चला है कि Bingoguard-8b 4.3%तक के सुधार के साथ, वाइल्डगार्ड और शील्डगैमा जैसे प्रमुख मॉडरेशन मॉडल की तुलना में उच्च पहचान सटीकता प्राप्त करता है। विशेष रूप से, बिंगोगुआर्ड कम-गंभीरता सामग्री (स्तर 1 और 2) की पहचान करने में बेहतर सटीकता का प्रदर्शन करता है, पारंपरिक रूप से द्विआधारी वर्गीकरण प्रणालियों के लिए मुश्किल है। इसके अतिरिक्त, गहराई से विश्लेषण ने अनुमानित “असुरक्षित” संभावनाओं और वास्तविक गंभीरता स्तर के बीच अपेक्षाकृत कमजोर सहसंबंध को उजागर किया, स्पष्ट रूप से गंभीरता के अंतर को शामिल करने की आवश्यकता को रेखांकित किया। ये निष्कर्ष वर्तमान मॉडरेशन विधियों में मौलिक अंतराल को चित्रित करते हैं जो मुख्य रूप से द्विआधारी वर्गीकरण पर भरोसा करते हैं।

अंत में, बिंगोगुआर्ड द्विआधारी सुरक्षा मूल्यांकन के साथ विस्तृत गंभीरता आकलन को एकीकृत करके एआई-चालित सामग्री मॉडरेशन की सटीकता और प्रभावशीलता को बढ़ाता है। यह दृष्टिकोण प्लेटफार्मों को अधिक सटीकता और संवेदनशीलता के साथ मॉडरेशन को संभालने की अनुमति देता है, जो अत्यधिक सतर्क और अपर्याप्त मॉडरेशन रणनीतियों दोनों से जुड़े जोखिमों को कम करता है। Salesforce का Bingoguard इस प्रकार तेजी से परिष्कृत AI- जनित इंटरैक्शन के भीतर सामग्री मॉडरेशन की जटिलताओं को संबोधित करने के लिए एक बेहतर ढांचा प्रदान करता है।

चेक आउट कागज़। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।

🔥 ।

Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।

बड़े भाषा मॉडल और सुदृढीकरण सीखने का उपयोग करके Gomoku में रणनीतिक निर्णय लेने को बढ़ाना – Gadgets Solutions

वाना उपयोगकर्ताओं को अपने डेटा पर प्रशिक्षित एआई मॉडल का एक टुकड़ा दे रहा है – Gadgets Solutions

LEAVE A REPLY Cancel reply

FOLLOW US

LATEST POSTS

Related Stories

EDITOR PICKS

POPULAR POSTS

POPULAR CATEGORY

ABOUT US

FOLLOW US