बड़ी भाषा मॉडल (एलएलएम) की उन्नति ने इंटरैक्टिव प्रौद्योगिकियों को काफी प्रभावित किया है, जो लाभ और चुनौतियों दोनों को प्रस्तुत करते हैं। इन मॉडलों से उत्पन्न एक प्रमुख मुद्दा हानिकारक सामग्री उत्पन्न करने की उनकी क्षमता है। पारंपरिक मॉडरेशन सिस्टम, आमतौर पर द्विआधारी वर्गीकरण (सुरक्षित बनाम असुरक्षित) को नियोजित करते हैं, जो कि हानिकारकता के अलग -अलग स्तरों को प्रभावी ढंग से अलग करने के लिए आवश्यक दानेदारता का अभाव है। यह सीमा या तो अत्यधिक प्रतिबंधात्मक मॉडरेशन, उपयोगकर्ता इंटरैक्शन को कम कर सकती है, या अपर्याप्त फ़िल्टरिंग कर सकती है, जो उपयोगकर्ताओं को हानिकारक सामग्री के लिए उजागर कर सकती है।
Salesforce AI, Bingoguard, एक LLM- आधारित मॉडरेशन सिस्टम का परिचय देता है, जिसे बाइनरी सुरक्षा लेबल और विस्तृत गंभीरता स्तरों की भविष्यवाणी करके द्विआधारी वर्गीकरण की अपर्याप्तता को संबोधित करने के लिए डिज़ाइन किया गया है। Bingoguard एक संरचित वर्गीकरण का उपयोग करता है, जिसमें हिंसक अपराध, यौन सामग्री, अपवित्रता, गोपनीयता आक्रमण और हथियार से संबंधित सामग्री सहित ग्यारह विशिष्ट क्षेत्रों में संभावित हानिकारक सामग्री को वर्गीकृत किया गया है। प्रत्येक श्रेणी में सौम्य (स्तर 0) से लेकर चरम जोखिम (स्तर 4) तक पांच स्पष्ट रूप से परिभाषित गंभीरता स्तर शामिल हैं। यह संरचना प्लेटफार्मों को उनके विशिष्ट सुरक्षा दिशानिर्देशों के अनुसार उनकी मॉडरेशन सेटिंग्स को ठीक करने में सक्षम बनाती है, जिससे अलग -अलग गंभीरता संदर्भों में उचित सामग्री प्रबंधन सुनिश्चित होता है।

एक तकनीकी दृष्टिकोण से, Bingoguard अपने व्यापक प्रशिक्षण डेटासेट, Bingoguardtrain को इकट्ठा करने के लिए एक “जनरेट-तब-फ़िल्टर” कार्यप्रणाली को नियुक्त करता है, जिसमें 54,897 प्रविष्टियाँ शामिल हैं, जिसमें कई गंभीरता स्तर और सामग्री शैलियों को फैली हुई है। यह ढांचा शुरू में विभिन्न गंभीरता स्तरों के अनुरूप प्रतिक्रियाएं उत्पन्न करता है, बाद में परिभाषित गुणवत्ता और प्रासंगिकता मानकों के साथ संरेखण सुनिश्चित करने के लिए इन आउटपुट को फ़िल्टर करता है। विशेष LLM ध्यान से चयनित और विशेषज्ञ रूप से ऑडिट किए गए बीज डेटासेट का उपयोग करते हुए, प्रत्येक गंभीरता स्तर के लिए व्यक्तिगत ठीक-ट्यूनिंग प्रक्रियाओं से गुजरते हैं। यह ठीक-ट्यूनिंग गारंटी देता है कि उत्पन्न आउटपुट पूर्वनिर्धारित गंभीरता रूब्रिक्स के बारीकी से पालन करते हैं। परिणामी मॉडरेशन मॉडल, Bingoguard-8b, हानिकारक सामग्री के विभिन्न डिग्री के बीच सटीक भेदभाव को सक्षम करते हुए, इस सावधानीपूर्वक क्यूरेट किए गए डेटासेट का लाभ उठाता है। नतीजतन, मॉडरेशन सटीकता और लचीलेपन में काफी वृद्धि होती है।

Bingoguard के अनुभवजन्य मूल्यांकन मजबूत प्रदर्शन का संकेत देते हैं। Bingoguardtest के खिलाफ परीक्षण, एक विशेषज्ञ-लेबल वाला डेटासेट जिसमें 988 उदाहरण शामिल हैं, से पता चला है कि Bingoguard-8b 4.3%तक के सुधार के साथ, वाइल्डगार्ड और शील्डगैमा जैसे प्रमुख मॉडरेशन मॉडल की तुलना में उच्च पहचान सटीकता प्राप्त करता है। विशेष रूप से, बिंगोगुआर्ड कम-गंभीरता सामग्री (स्तर 1 और 2) की पहचान करने में बेहतर सटीकता का प्रदर्शन करता है, पारंपरिक रूप से द्विआधारी वर्गीकरण प्रणालियों के लिए मुश्किल है। इसके अतिरिक्त, गहराई से विश्लेषण ने अनुमानित “असुरक्षित” संभावनाओं और वास्तविक गंभीरता स्तर के बीच अपेक्षाकृत कमजोर सहसंबंध को उजागर किया, स्पष्ट रूप से गंभीरता के अंतर को शामिल करने की आवश्यकता को रेखांकित किया। ये निष्कर्ष वर्तमान मॉडरेशन विधियों में मौलिक अंतराल को चित्रित करते हैं जो मुख्य रूप से द्विआधारी वर्गीकरण पर भरोसा करते हैं।

अंत में, बिंगोगुआर्ड द्विआधारी सुरक्षा मूल्यांकन के साथ विस्तृत गंभीरता आकलन को एकीकृत करके एआई-चालित सामग्री मॉडरेशन की सटीकता और प्रभावशीलता को बढ़ाता है। यह दृष्टिकोण प्लेटफार्मों को अधिक सटीकता और संवेदनशीलता के साथ मॉडरेशन को संभालने की अनुमति देता है, जो अत्यधिक सतर्क और अपर्याप्त मॉडरेशन रणनीतियों दोनों से जुड़े जोखिमों को कम करता है। Salesforce का Bingoguard इस प्रकार तेजी से परिष्कृत AI- जनित इंटरैक्शन के भीतर सामग्री मॉडरेशन की जटिलताओं को संबोधित करने के लिए एक बेहतर ढांचा प्रदान करता है।
चेक आउट कागज़। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।
🔥 ।

Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।
