जीपीयू को उच्च-प्रदर्शन कंप्यूटिंग वर्कलोड को संभालने में उनकी दक्षता के लिए व्यापक रूप से मान्यता प्राप्त है, जैसे कि कृत्रिम बुद्धिमत्ता और वैज्ञानिक सिमुलेशन में पाए जाने वाले। इन प्रोसेसर को हजारों थ्रेड्स को एक साथ निष्पादित करने के लिए डिज़ाइन किया गया है, जिसमें रजिस्टर फ़ाइल एक्सेस ऑप्टिमाइज़ेशन, मेमोरी कोलेसिंग और ताना-आधारित शेड्यूलिंग जैसी सुविधाओं के लिए हार्डवेयर समर्थन के साथ। उनकी संरचना उन्हें व्यापक डेटा समानता का समर्थन करने और विविध वैज्ञानिक और इंजीनियरिंग डोमेन में तेजी से प्रचलित जटिल कम्प्यूटेशनल कार्यों पर उच्च थ्रूपुट प्राप्त करने की अनुमति देती है।
GPU माइक्रोआर्किटेक्चर से जुड़े शैक्षणिक अनुसंधान में एक बड़ी चुनौती पुरानी वास्तुकला मॉडल पर निर्भरता है। कई अध्ययन अभी भी टेस्ला-आधारित पाइपलाइन का उपयोग अपने आधार रेखा के रूप में करते हैं, जो पंद्रह साल से अधिक समय पहले जारी किया गया था। तब से, जीपीयू आर्किटेक्चर काफी विकसित हुए हैं, जिसमें उप-कोर घटकों को पेश करना, कंपाइलर-हार्डवेयर समन्वय के लिए नए नियंत्रण बिट्स, और कैश मैकेनिज्म को बढ़ाना शामिल है। अप्रचलित आर्किटेक्चर पर आधुनिक कार्यभार का अनुकरण करना जारी रखना प्रदर्शन मूल्यांकन को गुमराह करता है और वास्तुकला-जागरूक सॉफ्टवेयर डिजाइन में नवाचार में बाधा डालता है।
कुछ सिमुलेटर ने इन वास्तुशिल्प परिवर्तनों के साथ तालमेल रखने की कोशिश की है। GPGPU-SIM और ACCEL-SIM जैसे उपकरण आमतौर पर शिक्षाविदों में उपयोग किए जाते हैं। फिर भी, उनके अद्यतन संस्करणों में आधुनिक आर्किटेक्चर जैसे कि एम्पीयर या ट्यूरिंग के प्रमुख पहलुओं की मॉडलिंग में निष्ठा की कमी है। ये उपकरण अक्सर निर्देश प्राप्त करने वाले तंत्रों का सटीक रूप से प्रतिनिधित्व करने में विफल होते हैं, फ़ाइल कैश व्यवहार को पंजीकृत करते हैं, और कंपाइलर कंट्रोल बिट्स और हार्डवेयर घटकों के बीच समन्वय करते हैं। एक सिम्युलेटर जो इस तरह की विशेषताओं का प्रतिनिधित्व करने में विफल रहता है, परिणामस्वरूप अनुमानित चक्र गणना और निष्पादन अड़चन में सकल त्रुटियां हो सकती हैं।
यूनिवर्सिटैट पोलिटेक्निका डी कैटालुन्या की एक टीम द्वारा शुरू की गई शोध ने आधुनिक एनवीडिया जीपीयू के माइक्रोआर्किटेक्चर को रिवर्स इंजीनियरिंग द्वारा इस अंतर को बंद करना चाहा। उनका काम आर्किटेक्चरल फीचर्स को विस्तार से बताता है, जिसमें मुद्दे के डिजाइन और चरणों को शामिल करना, रजिस्टर फ़ाइल और उसके कैश का व्यवहार, और तत्परता और निर्भरता के आधार पर युद्ध कैसे निर्धारित किया जाता है, इसकी एक परिष्कृत समझ शामिल है। उन्होंने हार्डवेयर कंट्रोल बिट्स के प्रभाव का भी अध्ययन किया, जिससे पता चलता है कि ये कंपाइलर संकेत हार्डवेयर व्यवहार और निर्देश शेड्यूलिंग को कैसे प्रभावित करते हैं।
अपने सिमुलेशन मॉडल का निर्माण करने के लिए, शोधकर्ताओं ने सावधानीपूर्वक चयनित एसएएस निर्देशों से बना माइक्रोबेंचमार्क बनाया। विलंबता निर्धारित करने के लिए घड़ी काउंटरों को रिकॉर्ड करते समय इन्हें वास्तविक एम्पीयर जीपीयू पर निष्पादित किया गया था। प्रयोगों ने विशिष्ट व्यवहारों का परीक्षण करने के लिए स्ट्रीम बफ़र्स का उपयोग किया जैसे कि पढ़ने के बाद लिखे खतरों, रजिस्टर बैंक संघर्ष, और निर्देश पूर्व-व्यवहार व्यवहार। उन्होंने निर्भरता प्रबंधन तंत्र के संचालन का भी मूल्यांकन किया, जो इन-फ्लाइट उपभोक्ताओं को ट्रैक करने और राइट-आफ्टर-रीड खतरों को रोकने के लिए एक स्कोरबोर्ड का उपयोग करता है। इस दानेदार माप ने उन्हें एक मॉडल का प्रस्ताव करने में सक्षम बनाया जो आंतरिक निष्पादन विवरण को मौजूदा सिमुलेटर की तुलना में अधिक सटीक रूप से दर्शाता है।
सटीकता के संदर्भ में, शोधकर्ताओं द्वारा विकसित मॉडल ने मौजूदा उपकरणों को महत्वपूर्ण रूप से बेहतर बनाया। NVIDIA RTX A6000 का उपयोग करते हुए वास्तविक हार्डवेयर की तुलना में, मॉडल ने 13.98% का औसत निरपेक्ष प्रतिशत त्रुटि (MAPE) प्राप्त किया, जो कि एक्सेल-सिम से 18.24% बेहतर है। प्रस्तावित मॉडल में सबसे खराब स्थिति 62% से अधिक नहीं हुई, जबकि एसेम-सिम कुछ अनुप्रयोगों में 543% तक की त्रुटियों तक पहुंच गई। इसके अलावा, उनके सिमुलेशन ने 31.47% की 90 वीं प्रतिशत त्रुटि दिखाई, जबकि एक्सेल-सिम के लिए 82.64% की तुलना में। ये परिणाम GPU प्रदर्शन विशेषताओं की भविष्यवाणी करने में प्रस्तावित सिमुलेशन ढांचे की बढ़ी हुई सटीकता को रेखांकित करते हैं। शोधकर्ताओं ने सत्यापित किया कि मॉडल ट्यूरिंग जैसे अन्य एनवीडिया आर्किटेक्चर के साथ प्रभावी ढंग से काम करता है, जो इसकी पोर्टेबिलिटी और अनुकूलनशीलता को साबित करता है।
पेपर अकादमिक उपकरण और आधुनिक GPU हार्डवेयर के बीच एक स्पष्ट बेमेल पर प्रकाश डालता है और उस अंतर को पाटने के लिए एक व्यावहारिक समाधान प्रस्तुत करता है। प्रस्तावित सिमुलेशन मॉडल प्रदर्शन की भविष्यवाणी सटीकता में सुधार करता है और आधुनिक जीपीयू के विस्तृत डिजाइन को समझने में मदद करता है। यह योगदान GPU वास्तुकला और सॉफ्टवेयर अनुकूलन दोनों में भविष्य के नवाचारों का समर्थन कर सकता है।
चेक आउट कागज़। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।
🔥 ।

निखिल मार्कटेकपोस्ट में एक प्रशिक्षु सलाहकार है। वह भारतीय प्रौद्योगिकी संस्थान, खड़गपुर में सामग्रियों में एक एकीकृत दोहरी डिग्री का पीछा कर रहा है। निखिल एक एआई/एमएल उत्साही है जो हमेशा बायोमैटेरियल्स और बायोमेडिकल साइंस जैसे क्षेत्रों में अनुप्रयोगों पर शोध कर रहा है। भौतिक विज्ञान में एक मजबूत पृष्ठभूमि के साथ, वह नई प्रगति की खोज कर रहा है और योगदान करने के अवसर पैदा कर रहा है।
