एक अद्वितीय और होनहार अनुसंधान परिकल्पना को क्राफ्ट करना किसी भी वैज्ञानिक के लिए एक मौलिक कौशल है। यह समय लेने वाला भी हो सकता है: नए पीएचडी उम्मीदवार अपने कार्यक्रम के पहले वर्ष को यह तय करने की कोशिश कर सकते हैं कि उनके प्रयोगों में क्या पता लगाना है। क्या होगा अगर कृत्रिम बुद्धिमत्ता मदद कर सकती है?
एमआईटी शोधकर्ताओं ने मानव-एआई सहयोग के माध्यम से, क्षेत्रों में होनहार अनुसंधान परिकल्पनाओं को स्वायत्त रूप से उत्पन्न करने और मूल्यांकन करने का एक तरीका बनाया है। एक नए पेपर में, वे वर्णन करते हैं कि कैसे उन्होंने इस ढांचे का उपयोग साक्ष्य-संचालित परिकल्पनाओं को बनाने के लिए किया है जो जैविक रूप से प्रेरित सामग्री के क्षेत्र में UNMET अनुसंधान आवश्यकताओं के साथ संरेखित करते हैं।
बुधवार को प्रकाशित उन्नत सामग्रीअध्ययन को अलिर्ज़ा गफ़रोल्लाही द्वारा सह-लेखक किया गया था, जो प्रयोगशाला में परमाणु और आणविक यांत्रिकी (LAMM) के बाद एक पोस्टडॉक, और मार्कस ब्यूहलर, MIT के सिविल और पर्यावरण इंजीनियरिंग के विभागों में इंजीनियरिंग में जेरी मैकएफी प्रोफेसर और मैकेनिकल इंजीनियरिंग और मैकेनिकल इंजीनियरिंग और लाम के निदेशक।
फ्रेमवर्क, जिसे शोधकर्ताओं ने स्कैगेंट्स कहते हैं, में कई एआई एजेंट होते हैं, प्रत्येक विशिष्ट क्षमताओं और डेटा तक पहुंच के साथ, जो “ग्राफ तर्क” विधियों का लाभ उठाते हैं, जहां एआई मॉडल एक ज्ञान ग्राफ का उपयोग करते हैं जो विविध वैज्ञानिक अवधारणाओं के बीच संबंधों को व्यवस्थित और परिभाषित करता है। मल्टी-एजेंट दृष्टिकोण उस तरह से नकल करता है जिस तरह से जैविक प्रणालियां खुद को प्राथमिक भवन ब्लॉकों के समूह के रूप में व्यवस्थित करती हैं। ब्यूहलर ने नोट किया कि यह “विभाजित और विजय” सिद्धांत कई स्तरों पर जीव विज्ञान में एक प्रमुख प्रतिमान है, सामग्री से लेकर कीटों के झुंडों तक सभ्यताओं तक – सभी उदाहरण जहां कुल बुद्धि व्यक्तियों की क्षमताओं के योग से बहुत अधिक है।
“कई एआई एजेंटों का उपयोग करके, हम उस प्रक्रिया को अनुकरण करने की कोशिश कर रहे हैं जिसके द्वारा वैज्ञानिकों के समुदाय खोज करते हैं,” ब्यूहलर कहते हैं। “एमआईटी में, हम ऐसा करते हैं कि अलग -अलग पृष्ठभूमि वाले लोगों का एक समूह एक साथ काम करने और कॉफी की दुकानों पर या एमआईटी के अनंत गलियारे में एक -दूसरे से टकराकर। लेकिन यह बहुत संयोग और धीमा है। हमारी खोज यह है कि क्या एआई सिस्टम रचनात्मक हो सकता है और खोज करने की खोज की प्रक्रिया को अनुकरण करना है।”
अच्छे विचारों को स्वचालित करना
जैसा कि हाल के घटनाक्रमों ने प्रदर्शित किया है, बड़े भाषा मॉडल (एलएलएम) ने सवालों के जवाब देने, जानकारी को संक्षेप में और सरल कार्यों को निष्पादित करने की एक प्रभावशाली क्षमता दिखाई है। लेकिन वे काफी सीमित हैं जब यह खरोंच से नए विचारों को उत्पन्न करने की बात आती है। MIT शोधकर्ता एक ऐसी प्रणाली को डिजाइन करना चाहते थे जो AI मॉडल को अधिक परिष्कृत, मल्टीस्टेप प्रक्रिया करने में सक्षम बनाता था जो प्रशिक्षण के दौरान सीखी गई जानकारी को याद करने, नए ज्ञान बनाने और नए ज्ञान बनाने से परे जाता है।
उनके दृष्टिकोण की नींव एक ऑन्कोलॉजिकल ज्ञान ग्राफ है, जो विविध वैज्ञानिक अवधारणाओं के बीच संबंध का आयोजन और बनाता है। रेखांकन करने के लिए, शोधकर्ताओं ने वैज्ञानिक कागजात के एक सेट को एक जनरेटिव एआई मॉडल में खिलाया। पिछले काम में, ब्यूहलर ने एआई मॉडल को रेखांकन के रूप में वैज्ञानिक अवधारणाओं के सार विकसित करने में मदद करने के लिए श्रेणी सिद्धांत के रूप में जाना जाने वाला गणित के एक क्षेत्र का उपयोग किया, जो घटकों के बीच संबंधों को परिभाषित करने में निहित है, एक तरह से जो कि अन्य मॉडलों द्वारा ग्राफ तर्क नामक प्रक्रिया के माध्यम से विश्लेषण किया जा सकता है। यह अवधारणाओं को समझने के लिए अधिक राजसी तरीके विकसित करने पर एआई मॉडल को केंद्रित करता है; यह उन्हें डोमेन में बेहतर रूप से सामान्य बनाने की अनुमति देता है।
“यह हमारे लिए विज्ञान-केंद्रित एआई मॉडल बनाने के लिए वास्तव में महत्वपूर्ण है, क्योंकि वैज्ञानिक सिद्धांत आमतौर पर केवल ज्ञान याद करने के बजाय सामान्य सिद्धांतों में निहित होते हैं,” ब्यूहलर कहते हैं। “एआई मॉडल को इस तरह से ‘सोच’ पर ध्यान केंद्रित करके, हम पारंपरिक तरीकों से परे छलांग लगा सकते हैं और एआई के अधिक रचनात्मक उपयोगों का पता लगा सकते हैं।”
सबसे हाल के पेपर के लिए, शोधकर्ताओं ने जैविक सामग्रियों पर लगभग 1,000 वैज्ञानिक अध्ययनों का उपयोग किया, लेकिन ब्यूहलर का कहना है कि किसी भी क्षेत्र से अधिक या कम शोध पत्रों का उपयोग करके ज्ञान ग्राफ़ उत्पन्न किया जा सकता है।
ग्राफ की स्थापना के साथ, शोधकर्ताओं ने वैज्ञानिक खोज के लिए एक एआई प्रणाली विकसित की, जिसमें कई मॉडल सिस्टम में विशिष्ट भूमिका निभाने के लिए विशेष हैं। अधिकांश घटकों को Openai की CHATGPT-4 श्रृंखला मॉडल से बनाया गया था और इन-संदर्भ लर्निंग के रूप में जानी जाने वाली तकनीक का उपयोग किया गया था, जिसमें संकेत सिस्टम में मॉडल की भूमिका के बारे में प्रासंगिक जानकारी प्रदान करते हैं, जबकि इसे प्रदान किए गए डेटा से सीखने की अनुमति देते हैं।
फ्रेमवर्क में व्यक्तिगत एजेंट एक -दूसरे के साथ एक जटिल समस्या को हल करने के लिए एक -दूसरे के साथ बातचीत करते हैं जो उनमें से कोई भी अकेले नहीं कर पाएगा। पहला कार्य जो उन्हें दिया गया है, वह अनुसंधान परिकल्पना उत्पन्न करना है। एलएलएम इंटरैक्शन शुरू होने के बाद एक सबग्राफ को ज्ञान ग्राफ से परिभाषित किया गया है, जो यादृच्छिक रूप से या मैन्युअल रूप से कागजात में चर्चा की गई कीवर्ड की एक जोड़ी में प्रवेश कर सकता है।
फ्रेमवर्क में, एक भाषा मॉडल जिसे “ऑन्कोलॉजिस्ट” नाम दिया गया है, को कागजात में वैज्ञानिक शब्दों को परिभाषित करने और उनके बीच संबंधों की जांच करने, ज्ञान ग्राफ को बाहर निकालने का काम सौंपा जाता है। “साइंटिस्ट 1” नामक एक मॉडल तब अप्रत्याशित गुणों और नवीनता को उजागर करने की क्षमता जैसे कारकों के आधार पर एक शोध प्रस्ताव शिल्प करता है। प्रस्ताव में संभावित निष्कर्षों की चर्चा, अनुसंधान के प्रभाव और कार्रवाई के अंतर्निहित तंत्र पर एक अनुमान शामिल है। एक “वैज्ञानिक 2” मॉडल विचार पर विस्तार करता है, विशिष्ट प्रयोगात्मक और सिमुलेशन दृष्टिकोण का सुझाव देता है और अन्य सुधार करता है। अंत में, एक “आलोचक” मॉडल अपनी ताकत और कमजोरियों को उजागर करता है और आगे सुधार का सुझाव देता है।
“यह विशेषज्ञों की एक टीम के निर्माण के बारे में है जो सभी एक ही तरह से नहीं सोच रहे हैं,” ब्यूहलर कहते हैं। “उन्हें अलग तरह से सोचना होगा और अलग -अलग क्षमताएं हैं। आलोचक एजेंट को जानबूझकर दूसरों की आलोचना करने के लिए प्रोग्राम किया गया है, इसलिए आपके पास हर कोई सहमत नहीं है और यह कहना एक महान विचार है। आपके पास एक एजेंट है जो कह रहा है, ‘यहां एक कमजोरी है, क्या आप इसे बेहतर समझा सकते हैं?’ यह आउटपुट को एकल मॉडल से बहुत अलग बनाता है। ”
सिस्टम के अन्य एजेंट मौजूदा साहित्य को खोजने में सक्षम हैं, जो सिस्टम को न केवल व्यवहार्यता का आकलन करने के लिए एक तरीका प्रदान करता है, बल्कि प्रत्येक विचार की नवीनता का निर्माण और आकलन भी करता है।
सिस्टम को मजबूत बनाना
अपने दृष्टिकोण को मान्य करने के लिए, ब्यूहलर और गफ़रोल्लाही ने “रेशम” और “एनर्जी इंटेंसिव” शब्दों के आधार पर एक ज्ञान ग्राफ का निर्माण किया। फ्रेमवर्क का उपयोग करते हुए, “वैज्ञानिक 1” मॉडल ने बढ़ाया ऑप्टिकल और यांत्रिक गुणों के साथ बायोमैटेरियल्स बनाने के लिए डंडेलियन-आधारित पिगमेंट के साथ रेशम को एकीकृत करने का प्रस्ताव दिया। मॉडल ने भविष्यवाणी की कि सामग्री पारंपरिक रेशम सामग्री की तुलना में काफी मजबूत होगी और प्रक्रिया के लिए कम ऊर्जा की आवश्यकता होगी।
वैज्ञानिक 2 ने तब सुझाव दिए, जैसे कि प्रस्तावित सामग्री कैसे बातचीत करेगी, यह पता लगाने के लिए विशिष्ट आणविक गतिशील सिमुलेशन टूल का उपयोग करना, यह जोड़कर कि सामग्री के लिए एक अच्छा अनुप्रयोग एक बायोइन्सपायर्ड चिपकने वाला होगा। आलोचक मॉडल ने तब प्रस्तावित सामग्री और क्षेत्रों में सुधार के लिए कई शक्तियों पर प्रकाश डाला, जैसे कि इसकी स्केलेबिलिटी, दीर्घकालिक स्थिरता और विलायक उपयोग के पर्यावरणीय प्रभाव। उन चिंताओं को दूर करने के लिए, आलोचक ने प्रक्रिया सत्यापन के लिए पायलट अध्ययन करने और सामग्री स्थायित्व के कठोर विश्लेषण करने के लिए पायलट अध्ययन करने का सुझाव दिया।
शोधकर्ताओं ने यादृच्छिक रूप से चुने गए कीवर्ड के साथ अन्य प्रयोग भी किए, जो अधिक कुशल बायोमिमेटिक माइक्रोफ्लुइडिक चिप्स के बारे में विभिन्न मूल परिकल्पनाओं का उत्पादन करते हैं, जिससे कोलेजन-आधारित मचानों के यांत्रिक गुणों को बढ़ाते हैं, और ग्राफीन और एमाइलॉयड फाइब्रिल के बीच इंटरैक्शन को बायोइलेक्ट्रोनिक उपकरण बनाने के लिए।
“सिस्टम ज्ञान ग्राफ से पथ के आधार पर इन नए, कठोर विचारों के साथ आने में सक्षम था,” गफ़रोल्लाही कहते हैं। “नवीनता और प्रयोज्यता के संदर्भ में, सामग्री मजबूत और उपन्यास लग रही थी। भविष्य के काम में, हम नए शोध विचारों के हजारों, या दसियों हजारों को उत्पन्न करने जा रहे हैं, और फिर हम उन्हें वर्गीकृत कर सकते हैं, बेहतर समझने की कोशिश करें कि ये सामग्री कैसे उत्पन्न होती है और उन्हें और कैसे सुधार किया जा सकता है।”
आगे बढ़ते हुए, शोधकर्ताओं को जानकारी प्राप्त करने और सिमुलेशन को अपने ढांचे में चलाने के लिए नए उपकरणों को शामिल करने की उम्मीद है। वे आसानी से अधिक उन्नत मॉडल के लिए अपने ढांचे में नींव मॉडल को स्वैप कर सकते हैं, जिससे सिस्टम एआई में नवीनतम नवाचारों के साथ अनुकूलित कर सकता है।
“जिस तरह से ये एजेंट बातचीत करते हैं, एक मॉडल में एक सुधार, भले ही यह मामूली हो, सिस्टम के समग्र व्यवहार और आउटपुट पर बहुत प्रभाव पड़ता है,” ब्यूहलर कहते हैं।
अपने दृष्टिकोण के ओपन-सोर्स विवरण के साथ एक प्रीप्रिंट जारी करने के बाद से, शोधकर्ताओं को विविध वैज्ञानिक क्षेत्रों और यहां तक कि वित्त और साइबर सुरक्षा जैसे क्षेत्रों में फ्रेमवर्क का उपयोग करने में रुचि रखने वाले सैकड़ों लोगों द्वारा संपर्क किया गया है।
“बहुत सारा सामान है जो आप प्रयोगशाला में जाने के बिना कर सकते हैं,” ब्यूहलर कहते हैं। “आप मूल रूप से प्रक्रिया के बहुत अंत में लैब में जाना चाहते हैं। प्रयोगशाला महंगी है और एक लंबा समय लेता है, इसलिए आप एक ऐसी प्रणाली चाहते हैं जो सबसे अच्छे विचारों में बहुत गहरी ड्रिल कर सके, सबसे अच्छी परिकल्पनाओं को तैयार कर सके और उभरती हुई व्यवहारों की सटीक भविष्यवाणी कर सके। हमारी दृष्टि का उपयोग करना आसान है।
।