जब रसायनज्ञ नई रासायनिक प्रतिक्रियाओं को डिजाइन करते हैं, तो सूचना के एक उपयोगी टुकड़े में प्रतिक्रिया की संक्रमण स्थिति शामिल होती है – कोई रिटर्न नहीं है जिसमें से एक प्रतिक्रिया आगे बढ़नी चाहिए।
यह जानकारी रसायनज्ञों को सही परिस्थितियों का उत्पादन करने की कोशिश करने की अनुमति देती है जो वांछित प्रतिक्रिया को होने की अनुमति देगा। हालांकि, संक्रमण की स्थिति और एक रासायनिक प्रतिक्रिया लेने वाले मार्ग की भविष्यवाणी करने के लिए वर्तमान तरीके जटिल हैं और कम्प्यूटेशनल शक्ति की एक बड़ी मात्रा की आवश्यकता होती है।
एमआईटी शोधकर्ताओं ने अब एक मशीन-लर्निंग मॉडल विकसित किया है जो इन भविष्यवाणियों को एक सेकंड से भी कम समय में उच्च सटीकता के साथ बना सकता है। उनका मॉडल रसायनज्ञों के लिए रासायनिक प्रतिक्रियाओं को डिजाइन करना आसान बना सकता है जो विभिन्न प्रकार के उपयोगी यौगिकों को उत्पन्न कर सकते हैं, जैसे कि फार्मास्यूटिकल्स या ईंधन।
“हम अंततः प्रचुर मात्रा में प्राकृतिक संसाधनों को लेने और उन्हें अणुओं में बदलने के लिए प्रक्रियाओं को डिजाइन करने में सक्षम होना चाहते हैं, जिनकी हमें आवश्यकता है, जैसे कि सामग्री और चिकित्सीय दवाएं। कम्प्यूटेशनल रसायन विज्ञान वास्तव में यह पता लगाने के लिए महत्वपूर्ण है कि कैसे हमें रिएक्टीज से उत्पादों तक पहुंचाने के लिए अधिक स्थायी प्रक्रियाओं को डिजाइन किया जाए,” केमिकल इंजीनियरिंग के एक प्रोफेसर, एक प्रोफेसर, एक प्रोफेसर, एक प्रोफेसर, एक प्रोफेसर, एक प्रोफेसर, एक प्रोफेसर।
पूर्व एमआईटी स्नातक छात्र चेनरू डुआन पीएचडी ’22, जो अब गहरे सिद्धांत पर है; पूर्व जॉर्जिया टेक स्नातक छात्र गुआन-हॉर्नग लियू, जो अब मेटा में है; और कॉर्नेल विश्वविद्यालय के स्नातक छात्र युआनकी डू पेपर के प्रमुख लेखक हैं, जो आज में दिखाई देते हैं प्रकृति मशीन बुद्धि।
बेहतर अनुमान
किसी भी रासायनिक प्रतिक्रिया के लिए, यह एक संक्रमण अवस्था से गुजरना चाहिए, जो तब होता है जब यह आगे बढ़ने के लिए प्रतिक्रिया के लिए आवश्यक ऊर्जा सीमा तक पहुंचता है। ये संक्रमण राज्य इतने क्षणभंगुर हैं कि उन्हें प्रयोगात्मक रूप से निरीक्षण करना लगभग असंभव है।
एक विकल्प के रूप में, शोधकर्ता क्वांटम रसायन विज्ञान पर आधारित तकनीकों का उपयोग करके संक्रमण राज्यों की संरचनाओं की गणना कर सकते हैं। हालांकि, उस प्रक्रिया को कंप्यूटिंग शक्ति का एक बड़ा सौदा करने की आवश्यकता होती है और एकल संक्रमण राज्य की गणना करने में घंटों या दिन लग सकते हैं।
“आदर्श रूप से, हम अधिक टिकाऊ प्रक्रियाओं को डिजाइन करने के लिए कम्प्यूटेशनल रसायन विज्ञान का उपयोग करने में सक्षम होना चाहते हैं, लेकिन यह गणना अपने आप में इन संक्रमण राज्यों को खोजने में ऊर्जा और संसाधनों का एक बड़ा उपयोग है,” कुलिक कहते हैं।
2023 में, कुलिक, डुआन, और अन्य लोगों ने एक मशीन-लर्निंग रणनीति पर सूचना दी कि उन्होंने प्रतिक्रियाओं के संक्रमण राज्यों की भविष्यवाणी करने के लिए विकसित किया। यह रणनीति क्वांटम रसायन विज्ञान तकनीकों का उपयोग करने की तुलना में तेज है, लेकिन अभी भी आदर्श की तुलना में धीमी है क्योंकि यह मॉडल को लगभग 40 संरचनाओं को उत्पन्न करने की आवश्यकता है, फिर उन भविष्यवाणियों को “आत्मविश्वास मॉडल” के माध्यम से चलाने के लिए यह अनुमान लगाने के लिए कि कौन से राज्यों में सबसे अधिक संभावना थी।
एक कारण है कि उस मॉडल को कई बार चलाने की आवश्यकता है कि यह संक्रमण राज्य संरचना के शुरुआती बिंदु के लिए बेतरतीब ढंग से उत्पन्न अनुमानों का उपयोग करता है, फिर दर्जनों गणनाओं को तब तक करता है जब तक कि यह अपने अंतिम, सबसे अच्छे अनुमान तक नहीं पहुंचता। ये बेतरतीब ढंग से उत्पन्न शुरुआती बिंदु वास्तविक संक्रमण स्थिति से बहुत दूर हो सकते हैं, यही वजह है कि इतने सारे चरणों की आवश्यकता होती है।
शोधकर्ताओं का नया मॉडल, रिएक्ट-ओटी, में वर्णित है प्रकृति मशीन बुद्धि कागज, एक अलग रणनीति का उपयोग करता है। इस काम में, शोधकर्ताओं ने अपने मॉडल को रैखिक प्रक्षेप द्वारा उत्पन्न संक्रमण राज्य के एक अनुमान से शुरू करने के लिए प्रशिक्षित किया-एक तकनीक जो प्रत्येक परमाणु की स्थिति का अनुमान लगाती है कि यह प्रतिक्रियाकर्ताओं और उत्पादों में, तीन-आयामी स्थान में अपनी स्थिति के बीच आधे रास्ते में ले जाकर।
“एक रैखिक अनुमान अनुमान लगाने के लिए एक अच्छा शुरुआती बिंदु है, जहां संक्रमण की स्थिति समाप्त हो जाएगी,” कुलिक कहते हैं। “मॉडल का क्या कर रहा है, पूरी तरह से यादृच्छिक अनुमान की तुलना में बहुत बेहतर प्रारंभिक अनुमान से शुरू हो रहा है, जैसा कि पूर्व काम में है।”
इस वजह से, यह मॉडल को एक भविष्यवाणी उत्पन्न करने के लिए कम कदम और कम समय लेता है। नए अध्ययन में, शोधकर्ताओं ने दिखाया कि उनका मॉडल केवल पांच चरणों के साथ भविष्यवाणियां कर सकता है, लगभग 0.4 सेकंड ले रहा है। इन भविष्यवाणियों को एक विश्वास मॉडल के माध्यम से खिलाया जाना चाहिए, और वे पिछले मॉडल द्वारा उत्पन्न भविष्यवाणियों की तुलना में लगभग 25 प्रतिशत अधिक सटीक हैं।
“यह वास्तव में रिएक्ट-ओटी एक व्यावहारिक मॉडल बनाता है जिसे हम सीधे इष्टतम संक्रमण राज्य संरचनाओं को उत्पन्न करने के लिए उच्च-थ्रूपुट स्क्रीनिंग में मौजूदा कम्प्यूटेशनल वर्कफ़्लो में एकीकृत कर सकते हैं,” डुआन कहते हैं।
“रसायन विज्ञान की एक विस्तृत सरणी”
रिएक्ट-ओटी बनाने के लिए, शोधकर्ताओं ने इसे उसी डेटासेट पर प्रशिक्षित किया जो वे अपने पुराने मॉडल को प्रशिक्षित करते थे। इन आंकड़ों में अभिकारकों, उत्पादों और संक्रमण राज्यों की संरचनाएं होती हैं, जिनकी गणना क्वांटम रसायन विज्ञान विधियों का उपयोग करके 9,000 विभिन्न रासायनिक प्रतिक्रियाओं के लिए होती है, जिनमें ज्यादातर छोटे कार्बनिक या अकार्बनिक अणुओं को शामिल किया जाता है।
एक बार प्रशिक्षित होने के बाद, मॉडल ने इस सेट से अन्य प्रतिक्रियाओं पर अच्छा प्रदर्शन किया, जिसे प्रशिक्षण डेटा से बाहर रखा गया था। इसने अन्य प्रकार की प्रतिक्रियाओं पर भी अच्छा प्रदर्शन किया, जिसे यह प्रशिक्षित नहीं किया गया था, और बड़े अभिकारकों के साथ प्रतिक्रियाओं को शामिल करने वाली सटीक भविष्यवाणियां कर सकते हैं, जिनमें अक्सर साइड चेन होती हैं जो सीधे प्रतिक्रिया में शामिल नहीं होती हैं।
“यह महत्वपूर्ण है क्योंकि बहुत सारी पोलीमराइजेशन प्रतिक्रियाएं हैं जहां आपके पास एक बड़ा मैक्रोमोलेक्यूल है, लेकिन प्रतिक्रिया सिर्फ एक हिस्से में हो रही है। एक मॉडल होने से अलग -अलग सिस्टम आकारों में सामान्यीकरण का मतलब है कि यह रसायन विज्ञान की एक विस्तृत सरणी से निपट सकता है,” कुलिक कहते हैं।
शोधकर्ता अब मॉडल को प्रशिक्षित करने पर काम कर रहे हैं ताकि यह अणुओं के बीच प्रतिक्रियाओं के लिए संक्रमण राज्यों की भविष्यवाणी कर सके, जिनमें अतिरिक्त तत्व शामिल हैं, जिनमें सल्फर, फास्फोरस, क्लोरीन, सिलिकॉन और लिथियम शामिल हैं।
“संक्रमण राज्य संरचनाओं को जल्दी से भविष्यवाणी करने के लिए सभी रासायनिक समझ के लिए महत्वपूर्ण है,” एथ ज्यूरिख में सैद्धांतिक रसायन विज्ञान के एक प्रोफेसर मार्कस रीहर कहते हैं, जो अध्ययन में शामिल नहीं थे। “पेपर में प्रस्तुत नया दृष्टिकोण हमारी खोज और अनुकूलन प्रक्रियाओं में बहुत तेजी ला सकता है, जिससे हमें हमारे अंतिम परिणाम में तेजी से लाया जा सकता है। परिणामस्वरूप, इन उच्च-प्रदर्शन कम्प्यूटिंग अभियानों में भी कम ऊर्जा का सेवन किया जाएगा। इस अनुकूलन को तेज करने वाली कोई भी प्रगति सभी प्रकार के कम्प्यूटेशनल रासायनिक अनुसंधानों को लाभ देती है।”
MIT टीम को उम्मीद है कि अन्य वैज्ञानिक अपनी प्रतिक्रियाओं को डिजाइन करने में अपने दृष्टिकोण का उपयोग करेंगे, और उस उद्देश्य के लिए एक ऐप बनाया है।
“जब भी आपके पास एक अभिकारक और उत्पाद होता है, तो आप उन्हें मॉडल में डाल सकते हैं और यह संक्रमण स्थिति उत्पन्न करेगा, जिसमें से आप अपनी इच्छित प्रतिक्रिया की ऊर्जा बाधा का अनुमान लगा सकते हैं, और देख सकते हैं कि यह कितना होने की संभावना है,” डुआन कहते हैं।
अनुसंधान को अमेरिकी सेना अनुसंधान कार्यालय, अमेरिकी रक्षा विभाग के बुनियादी अनुसंधान कार्यालय, यूएस एयर फोर्स ऑफिस ऑफ साइंटिफिक रिसर्च, नेशनल साइंस फाउंडेशन और नेवल रिसर्च के यूएस ऑफिस द्वारा वित्त पोषित किया गया था।
(टैगस्टोट्रांसलेट) रसायन विज्ञान के लिए मशीन लर्निंग (टी) रसायन विज्ञान एआई (टी) रासायनिक प्रतिक्रियाएं (टी) संक्रमण राज्य (टी) हीदर कुलिक (टी) चेनरू डुआन