जैसे -जैसे जनरेटिव एआई मॉडल की क्षमता बढ़ी है, आपने शायद देखा है कि वे सरल पाठ संकेतों को हाइपररेलिस्टिक छवियों और यहां तक कि विस्तारित वीडियो क्लिप में कैसे बदल सकते हैं।
हाल ही में, जेनेरिक एआई ने रसायनज्ञों और जीवविज्ञानी को प्रोटीन और डीएनए जैसे स्थैतिक अणुओं का पता लगाने में मदद करने की क्षमता दिखाई है। Alphafold जैसे मॉडल दवा की खोज में तेजी लाने के लिए आणविक संरचनाओं की भविष्यवाणी कर सकते हैं, और उदाहरण के लिए, MIT- सहायता प्राप्त “RFDiffusion”, नए प्रोटीन को डिजाइन करने में मदद कर सकता है। एक चुनौती, हालांकि, यह है कि अणु लगातार आगे बढ़ रहे हैं और झकझोर रहे हैं, जो नए प्रोटीन और दवाओं का निर्माण करते समय मॉडल के लिए महत्वपूर्ण है। भौतिकी का उपयोग करके एक कंप्यूटर पर इन गतियों का अनुकरण करना – एक तकनीक जिसे आणविक गतिशीलता के रूप में जाना जाता है – बहुत महंगा हो सकता है, सुपर कंप्यूटर पर अरबों समय कदमों की आवश्यकता होती है।
इन व्यवहारों को अधिक कुशलता से अनुकरण करने की दिशा में एक कदम के रूप में, MIT कंप्यूटर विज्ञान और कृत्रिम बुद्धिमत्ता प्रयोगशाला (CSAIL) और गणित विभाग के शोधकर्ताओं ने एक सामान्य मॉडल विकसित किया है जो पूर्व डेटा से सीखता है। एमडीजेन नामक टीम की प्रणाली, एक 3 डी अणु का एक फ्रेम ले सकती है और अनुकरण कर सकती है कि आगे क्या होगा एक वीडियो की तरह क्या होगा, अलग -अलग चित्रों को कनेक्ट करें, और यहां तक कि लापता फ्रेम में भी भरें। अणुओं पर “प्ले बटन” को मारकर, उपकरण संभावित रूप से रसायनज्ञों को नए अणुओं को डिजाइन करने में मदद कर सकता है और बारीकी से अध्ययन कर सकता है कि कैंसर और अन्य बीमारियों के लिए उनकी दवा प्रोटोटाइप कितनी अच्छी तरह से आणविक संरचना के साथ बातचीत करेंगे जो इसे प्रभावित करने का इरादा रखता है।
सह-लीड लेखक बोवेन जिंग एसएम ’22 का कहना है कि एमडीजेन अवधारणा का एक प्रारंभिक प्रमाण है, लेकिन यह एक रोमांचक नए शोध दिशा की शुरुआत का सुझाव देता है। CSAIL के एक पीएचडी छात्र जिंग कहते हैं, “जल्दी, जेनेरेटिव एआई मॉडल ने कुछ सरल वीडियो का उत्पादन किया, जैसे कि एक व्यक्ति पलक झपकते या एक कुत्ता अपनी पूंछ को छेड़ता है।” “कुछ वर्षों में तेजी से आगे बढ़ें, और अब हमारे पास सोरा या वीओ जैसे अद्भुत मॉडल हैं जो सभी प्रकार के दिलचस्प तरीकों से उपयोगी हो सकते हैं। हम आणविक दुनिया के लिए एक समान दृष्टि स्थापित करने की उम्मीद करते हैं, जहां डायनामिक्स प्रक्षेपवक्र वीडियो हैं। उदाहरण के लिए, आप मॉडल को पहले और 10 वें फ्रेम दे सकते हैं, और यह एक आक्रामक वीडियो और अनुमानित कर सकता है।”
शोधकर्ताओं का कहना है कि MDGEN पिछले तुलनीय कार्यों से जनरेटिव AI के साथ एक प्रतिमान बदलाव का प्रतिनिधित्व करता है जो इस तरह से अधिक व्यापक उपयोग के मामलों को सक्षम करता है। पिछले दृष्टिकोण “ऑटोरेग्रेसिव” थे, जिसका अर्थ है कि वे एक वीडियो अनुक्रम बनाने के लिए पहले फ्रेम से शुरू होने वाले अगले अभी भी फ्रेम पर भरोसा करते थे। इसके विपरीत, MDGEN प्रसार के साथ समानांतर में फ़्रेम उत्पन्न करता है। इसका मतलब यह है कि MDGEN का उपयोग किया जा सकता है, उदाहरण के लिए, एंडपॉइंट पर फ़्रेम कनेक्ट करें, या प्रारंभिक फ्रेम पर खेलने को दबाने के अलावा एक कम फ्रेम-दर प्रक्षेपवक्र को “अपप्लेम” करें।
इस काम को पिछले दिसंबर में पिछले दिसंबर में न्यूरल इंफॉर्मेशन प्रोसेसिंग सिस्टम्स (NEURIPS) पर सम्मेलन में दिखाए गए एक पेपर में प्रस्तुत किया गया था। पिछली गर्मियों में, इसे मशीन लर्निंग के ML4LMS कार्यशाला पर अंतर्राष्ट्रीय सम्मेलन में इसके संभावित व्यावसायिक प्रभाव के लिए सम्मानित किया गया था।
आणविक गतिशीलता के लिए कुछ छोटे कदम आगे
प्रयोगों में, जिंग और उनके सहयोगियों ने पाया कि एमडीजेन के सिमुलेशन सीधे भौतिक सिमुलेशन को चलाने के समान थे, जबकि 10 से 100 गुना तेजी से प्रक्षेपवक्र का उत्पादन करते थे।
टीम ने पहले एक अणु के 3 डी फ्रेम में लेने और अगले 100 नैनोसेकंड उत्पन्न करने के लिए अपने मॉडल की क्षमता का परीक्षण किया। इन पीढ़ियों के लिए उनके सिस्टम ने उस अवधि तक पहुंचने के लिए इन पीढ़ियों के लिए 10-नैनोसेकंड ब्लॉक को एक साथ रखा। टीम ने पाया कि MDGEN एक बेसलाइन मॉडल की सटीकता के साथ प्रतिस्पर्धा करने में सक्षम था, जबकि वीडियो जनरेशन प्रक्रिया को लगभग एक मिनट में पूरा करता है – तीन घंटे का एक मात्र अंश जो कि उसी गतिशील को अनुकरण करने के लिए बेसलाइन मॉडल को ले गया।
जब वन-नैनोसेकंड अनुक्रम का पहला और अंतिम फ्रेम दिया जाता है, तो MDGEN ने भी बीच में कदम उठाए। शोधकर्ताओं की प्रणाली ने 100,000 से अधिक विभिन्न भविष्यवाणियों में यथार्थवाद की एक डिग्री का प्रदर्शन किया: इसने 100 नैनोसेकंड से कम क्लिप पर अपने बेसलाइन की तुलना में अधिक संभावना आणविक प्रक्षेपवक्रों का अनुकरण किया। इन परीक्षणों में, MDGEN ने पेप्टाइड्स पर सामान्यीकरण करने की क्षमता का भी संकेत दिया था जिसे उसने पहले नहीं देखा था।
MDGEN की क्षमताओं में फ्रेम के भीतर फ्रेम का अनुकरण भी शामिल है, “अपसम्पलिंग” प्रत्येक नैनोसेकंड के बीच के कदम तेजी से आणविक घटनाओं को अधिक पर्याप्त रूप से पकड़ने के लिए। यहां तक कि यह अणुओं की “inpaint” संरचनाएं भी कर सकती है, उनके बारे में जानकारी बहाल कर सकती है जो हटा दी गई थी। इन सुविधाओं का उपयोग अंततः शोधकर्ताओं द्वारा प्रोटीन को डिजाइन करने के लिए किया जा सकता है कि अणु के विभिन्न हिस्सों को कैसे स्थानांतरित करना चाहिए, इसके आधार पर प्रोटीन को डिजाइन करना।
प्रोटीन की गतिशीलता के साथ चारों ओर
जिंग और सह-लीड लेखक हेंस स्ट्रेक का कहना है कि MDGEN आणविक गतिशीलता को अधिक कुशलता से उत्पन्न करने की दिशा में प्रगति का एक प्रारंभिक संकेत है। फिर भी, इन मॉडलों को दवाओं या अणुओं को डिजाइन करने में तुरंत प्रभावशाली बनाने के लिए डेटा की कमी है जो आंदोलनों को प्रेरित करते हैं रसायनज्ञ एक लक्ष्य संरचना में देखना चाहेंगे।
शोधकर्ताओं ने मॉडलिंग अणुओं से एमडीजेन को स्केल करने का लक्ष्य रखा है कि यह भविष्यवाणी करने के लिए कि समय के साथ प्रोटीन कैसे बदलेंगे। “वर्तमान में, हम टॉय सिस्टम का उपयोग कर रहे हैं,” Stärk कहते हैं, CSAIL में एक PHD छात्र भी। “प्रोटीन को मॉडल करने के लिए MDGEN की पूर्वानुमान क्षमताओं को बढ़ाने के लिए, हमें वर्तमान आर्किटेक्चर और उपलब्ध डेटा पर निर्माण करने की आवश्यकता होगी। हमारे पास अभी तक उन प्रकार के सिमुलेशन के लिए YouTube- स्केल रिपॉजिटरी नहीं है, इसलिए हम एक अलग मशीन-लर्निंग विधि विकसित करने की उम्मीद कर रहे हैं जो हमारे मॉडल के लिए डेटा संग्रह प्रक्रिया को गति दे सकती है।”
अभी के लिए, MDGEN नग्न आंखों के लिए अदृश्य मॉडलिंग आणविक परिवर्तनों को मॉडलिंग में एक उत्साहजनक मार्ग प्रस्तुत करता है। केमिस्ट कैंसर या तपेदिक जैसी बीमारियों के लिए दवा प्रोटोटाइप के व्यवहार में गहराई से डील करने के लिए इन सिमुलेशन का उपयोग कर सकते हैं।
“मशीन लर्निंग के तरीके जो भौतिक सिमुलेशन से सीखते हैं, विज्ञान के लिए एआई में एक नए फ्रंटियर का प्रतिनिधित्व करते हैं,” बोनी बर्जर, गणित के एमआईटी सिमोंस प्रोफेसर, सीएसएएल प्रिंसिपल इन्वेस्टिगेटर, और कागज पर वरिष्ठ लेखक कहते हैं। “MDGEN एक बहुमुखी, बहुउद्देशीय मॉडलिंग ढांचा है जो इन दो डोमेन को जोड़ता है, और हम इस दिशा में अपने शुरुआती मॉडलों को साझा करने के लिए बहुत उत्साहित हैं।”
“आणविक राज्यों के बीच यथार्थवादी संक्रमण पथ एक बड़ी चुनौती है,” साथी वरिष्ठ लेखक टॉमी जक्कोला कहते हैं, जो इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर विज्ञान के एमआईटी थॉमस सीबेल प्रोफेसर और डेटा, सिस्टम और सोसाइटी इंस्टीट्यूट, और एक सीएसएएल प्रिंसिपल अन्वेषक हैं। “यह शुरुआती काम दिखाता है कि कैसे हम पूरी तरह से सिमुलेशन रन में जेनेरिक मॉडलिंग को स्थानांतरित करके इस तरह की चुनौतियों का समाधान करना शुरू कर सकते हैं।”
जैव सूचना विज्ञान के क्षेत्र में शोधकर्ताओं ने आणविक परिवर्तनों का अनुकरण करने की क्षमता के लिए इस प्रणाली को हेराल्ड किया है। चाल्मर्स यूनिवर्सिटी ऑफ टेक्नोलॉजी एसोसिएट प्रोफेसर साइमन ओल्सन कहते हैं, “एमडीजेन मॉडल आणविक गतिशीलता सिमुलेशन संरचनात्मक एम्बेडिंग के संयुक्त वितरण के रूप में, असतत समय चरणों के बीच आणविक आंदोलनों को कैप्चर करते हैं।” “एक नकाबपोश सीखने के उद्देश्य का लाभ उठाते हुए, MDGEN अभिनव उपयोग के मामलों को सक्षम बनाता है जैसे कि संक्रमण पथ नमूनाकरण, मेटास्टेबल चरणों को जोड़ने वाले प्रक्षेपवक्रों को लागू करने के लिए एनालॉग्स को चित्रित करना।”
MDGEN पर शोधकर्ताओं के काम का समर्थन किया गया था, नेशनल इंस्टीट्यूट ऑफ जनरल मेडिकल साइंसेज, यूएस डिपार्टमेंट ऑफ एनर्जी, नेशनल साइंस फाउंडेशन, मशीन लर्निंग फॉर फार्मास्युटिकल डिस्कवरी एंड सिंथेसिस कंसोर्टियम, अब्दुल लतीफ जमील क्लिनिक फॉर मशीन लर्निंग फॉर हेल्थ, द डिफेंस थ्रेट रिडक्शन एजेंसी और डिफेंस एडवांस्ड रिसर्च प्रोजेक्ट्स एजेंसी द्वारा।
। जिंग (टी) हनीस स्ट्रेक (टी) बोनी बर्जर (टी) टॉमी जक्कोला