बड़े भाषा मॉडल (एलएलएम) के व्यापक रूप से गोद लेने ने सामग्री निर्माण और खपत के परिदृश्य को काफी बदल दिया है। हालांकि, इसने सटीकता और तथ्यात्मक विश्वसनीयता के बारे में महत्वपूर्ण चुनौतियों को भी पेश किया है। LLMS द्वारा उत्पन्न सामग्री में अक्सर ऐसे दावे शामिल होते हैं जिनमें उचित सत्यापन की कमी होती है, संभवतः गलत सूचना के लिए अग्रणी होती है। इसलिए, प्रभावी तथ्य-जाँच के लिए इन आउटपुट से दावों को सटीक रूप से निकालना आवश्यक हो गया है, जो अंतर्निहित अस्पष्टताओं और संदर्भ निर्भरता के कारण चुनौतीपूर्ण है।
Microsoft AI रिसर्च ने हाल ही में LLM पर आधारित एक उन्नत दावा-निष्कर्षण विधि, विशेष रूप से LLM आउटपुट से दावों को निकालने में सटीकता, समझ और संदर्भ-जागरूकता को बढ़ाने के लिए डिज़ाइन की गई एक उन्नत दावा-निष्कर्षण विधि विकसित की है। स्पष्ट रूप से अस्पष्टता से निपटने के द्वारा मौजूदा तरीकों की सीमाओं को संबोधित करता है। अन्य दृष्टिकोणों के विपरीत, यह कई संभावित व्याख्याओं के साथ वाक्यों की पहचान करता है और केवल दावा निष्कर्षण के साथ आगे बढ़ता है जब इच्छित अर्थ को दिए गए संदर्भ के भीतर स्पष्ट रूप से निर्धारित किया जाता है। यह सावधान दृष्टिकोण उच्च सटीकता और विश्वसनीयता सुनिश्चित करता है, विशेष रूप से बाद के तथ्य-जाँच प्रयासों को लाभान्वित करता है।
एक तकनीकी दृष्टिकोण से, दावा है कि एक संरचित पाइपलाइन को नियोजित करता है जिसमें तीन प्रमुख चरण शामिल हैं: चयन, विघटन और अपघटन। चयन चरण के दौरान, दावा करने के लिए एलएलएम का लाभ उठाता है, जिसमें उन वाक्यों की पहचान की जाती है, जिनमें सत्यापित जानकारी होती है, जो तथ्यात्मक सामग्री के बिना उन लोगों को फ़िल्टर करती हैं। विघटन चरण में, यह विशिष्ट रूप से अस्पष्टता का पता लगाने और हल करने पर ध्यान केंद्रित करता है, जैसे कि अस्पष्ट संदर्भ या कई प्रशंसनीय व्याख्याएं। दावों को तभी निकाला जाता है जब अस्पष्टता को आत्मविश्वास से हल किया जा सकता है। अंतिम चरण, अपघटन, प्रत्येक स्पष्ट वाक्य को सटीक, संदर्भ-स्वतंत्र दावों में परिवर्तित करना शामिल है। यह संरचित प्रक्रिया परिणामी दावों की सटीकता और पूर्णता दोनों को बढ़ाती है।

BingCheck डेटासेट का उपयोग करके मूल्यांकन में-जो विषयों की एक विस्तृत श्रृंखला और जटिल LLM- जनित प्रतिक्रियाओं को शामिल करता है-पिछले तरीकों पर उल्लेखनीय सुधारों का अनुमान लगाया गया है। इसने 99%की उच्च प्रवेश दर हासिल की, जो निकाले गए दावों और मूल सामग्री के बीच एक मजबूत स्थिरता का संकेत देता है। कवरेज के बारे में, दावा किया गया है कि 96.7% की उच्च सटीकता दर बनाए रखते हुए, 87.6% सत्यापित सामग्री पर कब्जा कर लिया गया, जो तुलनीय दृष्टिकोणों से बेहतर प्रदर्शन कर रहा है। Decontextualization के लिए इसके व्यवस्थित दृष्टिकोण ने यह भी सुनिश्चित किया कि आवश्यक प्रासंगिक विवरणों को बरकरार रखा गया, जिसके परिणामस्वरूप पूर्व तरीकों की तुलना में बेहतर-ग्राउंडेड दावे थे।
कुल मिलाकर, क्लेमिफाई एलएलएम-जनित सामग्री से विश्वसनीय दावों के स्वचालित निष्कर्षण में एक सार्थक उन्नति का प्रतिनिधित्व करता है। एक संरचित और सावधान मूल्यांकन ढांचे के माध्यम से अस्पष्टता और प्रासंगिकता को संबोधित करके, दावा सटीकता और विश्वसनीयता के लिए एक नया मानक स्थापित करता है। जैसा कि एलएलएम-निर्मित सामग्री पर निर्भरता बढ़ती जा रही है, क्लेमिफ़ जैसे उपकरण इस सामग्री की भरोसेमंदता और तथ्यात्मक अखंडता को सुनिश्चित करने में एक महत्वपूर्ण भूमिका निभाएंगे।
चेक आउट कागज और तकनीकी विवरण। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 80K+ एमएल सब्रेडिट।

Asif Razzaq MarkTechPost Media Inc के सीईओ हैं .. एक दूरदर्शी उद्यमी और इंजीनियर के रूप में, ASIF सामाजिक अच्छे के लिए कृत्रिम बुद्धिमत्ता की क्षमता का उपयोग करने के लिए प्रतिबद्ध है। उनका सबसे हालिया प्रयास एक आर्टिफिशियल इंटेलिजेंस मीडिया प्लेटफॉर्म, मार्कटेकपोस्ट का शुभारंभ है, जो मशीन लर्निंग और डीप लर्निंग न्यूज के अपने गहन कवरेज के लिए खड़ा है, जो तकनीकी रूप से ध्वनि और आसानी से एक व्यापक दर्शकों द्वारा समझ में आता है। मंच 2 मिलियन से अधिक मासिक विचारों का दावा करता है, दर्शकों के बीच अपनी लोकप्रियता को दर्शाता है।