एक सटीक अंतर निदान (DDX) विकसित करना चिकित्सा देखभाल का एक मौलिक हिस्सा है, जिसे आमतौर पर एक चरण-दर-चरण प्रक्रिया के माध्यम से प्राप्त किया जाता है जो रोगी के इतिहास, शारीरिक परीक्षा और नैदानिक परीक्षणों को एकीकृत करता है। एलएलएम के उदय के साथ, इंटरैक्टिव, एआई-संचालित टूल का उपयोग करके इस नैदानिक यात्रा के कुछ हिस्सों का समर्थन और स्वचालित करने की क्षमता बढ़ रही है। एक एकल निदान के उत्पादन पर ध्यान केंद्रित करने वाले पारंपरिक एआई प्रणालियों के विपरीत, वास्तविक दुनिया के नैदानिक तर्क में लगातार अद्यतन करना और कई नैदानिक संभावनाओं का मूल्यांकन करना शामिल है क्योंकि अधिक रोगी डेटा उपलब्ध हो जाता है। यद्यपि डीप लर्निंग ने रेडियोलॉजी, नेत्र विज्ञान और त्वचाविज्ञान जैसे क्षेत्रों में सफलतापूर्वक डीडीएक्स उत्पन्न किया है, इन मॉडलों में आम तौर पर चिकित्सकों के साथ प्रभावी ढंग से संलग्न होने के लिए आवश्यक संवादात्मक, संवादी क्षमताओं की कमी होती है।
LLMS का आगमन भवन उपकरणों के लिए एक नया एवेन्यू प्रदान करता है जो प्राकृतिक भाषा बातचीत के माध्यम से DDX का समर्थन कर सकता है। जीपीटी -4 जैसे सामान्य-उद्देश्य वाले और मेड-पाम 2 जैसे मेडिकल-विशिष्ट वाले इन मॉडलों ने बहु-पसंद और मानकीकृत चिकित्सा परीक्षाओं पर उच्च प्रदर्शन दिखाया है। हालांकि ये बेंचमार्क शुरू में एक मॉडल के चिकित्सा ज्ञान का आकलन करते हैं, वे वास्तविक नैदानिक सेटिंग्स में इसकी उपयोगिता या जटिल मामलों के दौरान चिकित्सकों की सहायता करने की क्षमता को प्रतिबिंबित नहीं करते हैं। यद्यपि कुछ हालिया अध्ययनों ने चुनौतीपूर्ण मामले की रिपोर्टों पर एलएलएम का परीक्षण किया है, फिर भी इस बात की सीमित समझ है कि ये मॉडल क्लिनिशियन निर्णय लेने या वास्तविक समय के सहयोग के माध्यम से रोगी की देखभाल में सुधार कैसे कर सकते हैं।
Google के शोधकर्ताओं ने DDX के साथ सहायता करने में इसकी प्रभावशीलता का मूल्यांकन करने के लिए, नैदानिक नैदानिक तर्क के लिए एक बड़े भाषा मॉडल एमी को पेश किया। एमी के स्टैंडअलोन प्रदर्शन ने 20 चिकित्सकों और 302 जटिल वास्तविक दुनिया के चिकित्सा मामलों को शामिल करने वाले एक अध्ययन में अनएडेड चिकित्सकों को बेहतर बनाया। जब एक इंटरैक्टिव इंटरफ़ेस में एकीकृत किया जाता है, तो पारंपरिक उपकरणों के साथ एएमआईई का उपयोग करने वाले चिकित्सकों ने अकेले मानक संसाधनों का उपयोग करने वालों की तुलना में काफी अधिक सटीक और व्यापक डीडीएक्स सूचियों का उत्पादन किया। एमी ने न केवल नैदानिक सटीकता में सुधार किया, बल्कि चिकित्सकों की तर्क क्षमताओं को भी बढ़ाया। इसके प्रदर्शन ने भी स्वचालित मूल्यांकन में GPT-4 को पार कर लिया, वास्तविक दुनिया के नैदानिक अनुप्रयोगों के लिए वादा और विशेषज्ञ-स्तरीय समर्थन के लिए व्यापक पहुंच दिखाया।
एमी, एक भाषा मॉडल, चिकित्सा कार्यों के लिए ठीक-ठाक-ट्यून, ने DDX उत्पन्न करने में मजबूत प्रदर्शन का प्रदर्शन किया। इसकी सूचियों को गुणवत्ता, उपयुक्तता और समझ के लिए उच्च दर्जा दिया गया था। 54% मामलों में, एमी के डीडीएक्स में सही निदान शामिल था, जो अनसुनी चिकित्सकों को महत्वपूर्ण रूप से बेहतर बना रहा था। इसने 59% की शीर्ष -10 सटीकता हासिल की, जिसमें उचित निदान 29% मामलों में पहले स्थान पर था। एमी द्वारा सहायता प्राप्त चिकित्सकों ने भी खोज उपकरणों का उपयोग करने या अकेले काम करने की तुलना में अपनी नैदानिक सटीकता में सुधार किया। एएमआईई इंटरफ़ेस में नए होने के बावजूद, चिकित्सकों ने इसे पारंपरिक खोज विधियों के समान इस्तेमाल किया, इसकी व्यावहारिक प्रयोज्य दिखाया।
70 NEJM CPC मामलों के सबसेट का उपयोग करते हुए AMIE और GPT-4 के बीच तुलनात्मक विश्लेषण में, प्रत्यक्ष मानव मूल्यांकन की तुलना चूहे के विभिन्न सेटों के कारण सीमित थी। इसके बजाय, एक स्वचालित मीट्रिक जिसे मानव निर्णय के साथ यथोचित रूप से संरेखित करने के लिए दिखाया गया था, का उपयोग किया गया था। जबकि GPT-4 ने शीर्ष -1 सटीकता (हालांकि सांख्यिकीय रूप से महत्वपूर्ण नहीं) में एमी को मामूली रूप से बेहतर बनाया, एमी ने एन> 1 के लिए बेहतर शीर्ष-एन सटीकता का प्रदर्शन किया, एन> 2 के लिए उल्लेखनीय लाभ के साथ। इससे पता चलता है कि एमी ने अधिक संवादात्मक और उपयुक्त डीडीएक्स, वास्तविक-युद्ध नैदानिक तर्क में एक महत्वपूर्ण पहलू उत्पन्न किया। इसके अतिरिक्त, एएमआईई ने स्टैंडअलोन डीडीएक्स कार्यों में बोर्ड-प्रमाणित चिकित्सकों को बेहतर बनाया और एक सहायक उपकरण के रूप में चिकित्सक के प्रदर्शन में काफी सुधार किया, जो उच्च शीर्ष-एन सटीकता, डीडीएक्स गुणवत्ता और पारंपरिक खोज-आधारित सहायता की तुलना में समझ में आया।
कच्चे प्रदर्शन से परे, एमी का संवादात्मक इंटरफ़ेस सहज और कुशल था, जिसमें चिकित्सकों ने इसके उपयोग के बाद अपनी डीडीएक्स सूचियों में आत्मविश्वास बढ़ाया। जबकि सीमाएं मौजूद हैं-जैसे कि एमी की छवियों तक पहुंच की कमी और चिकित्सक सामग्री में सारणीबद्ध डेटा और सीपीसी-शैली के मामले की कृत्रिम प्रकृति प्रस्तुतियों में शैक्षिक समर्थन और नैदानिक सहायता के लिए मॉडल की क्षमता आशाजनक है, विशेष रूप से जटिल या संसाधन-सीमित सेटिंग्स में। बहरहाल, अध्ययन में क्लिनिकल वर्कफ़्लोज़ में एलएलएम के सावधानीपूर्वक एकीकरण की आवश्यकता पर जोर दिया गया है, ट्रस्ट अंशांकन, मॉडल की अनिश्चितता अभिव्यक्ति और एंकरिंग पूर्वाग्रह और मतिभ्रम के लिए क्षमता पर ध्यान देने के साथ। भविष्य के काम को ए-असिस्टेड निदान की वास्तविक दुनिया की प्रयोज्यता, निष्पक्षता और दीर्घकालिक प्रभावों का सख्ती से मूल्यांकन करना चाहिए।
चेक आउट कागज़। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।

आईआईटी मद्रास में मार्कटेकपोस्ट में एक परामर्श इंटर्न और दोहरे डिग्री के छात्र सना हसन, वास्तविक दुनिया की चुनौतियों का समाधान करने के लिए प्रौद्योगिकी और एआई को लागू करने के बारे में भावुक हैं। व्यावहारिक समस्याओं को हल करने में गहरी रुचि के साथ, वह एआई और वास्तविक जीवन के समाधानों के चौराहे के लिए एक नया दृष्टिकोण लाता है।
