अमेज़ॅन ने अमेज़ॅन नोवा एक्ट नामक एक नई आर्टिफिशियल इंटेलिजेंस (एआई) मॉडल का खुलासा किया है। यह AI एजेंट एक वेब ब्राउज़र के भीतर कार्रवाई करने और कार्रवाई करने के लिए डिज़ाइन किया गया है, फॉर्म भरने, इंटरफेस को नेविगेट करने और पॉपअप को संभालने जैसे कार्यों को स्वचालित करना। इसे वेबसाइटों पर सीधे काम करने वाले सहायक के रूप में सोचें। अमेज़ॅन ने नोवा एक्ट एसडीके भी जारी किया है, जो डेवलपर्स को प्रौद्योगिकी के साथ प्रयोग करने देता है। डेवलपर्स सरल ऑनलाइन कार्यों को संभालने के लिए एजेंट बना सकते हैं।
एआई एजेंटों की वर्तमान स्थिति
एआई एजेंट ज्यादातर बात करते हैं या जानकारी पाते हैं, प्राकृतिक भाषा में जवाब देते हैं या ज्ञान के ठिकानों की खोज करते हैं। अमेज़ॅन के अनुसार, वे एआई एजेंटों को उपयोगकर्ताओं के लिए डिजिटल वातावरण में कार्यों को पूरा करने में सक्षम होने की कल्पना करते हैं।
हालांकि, एजेंट एआई तकनीक अभी भी विकसित हो रही है, जिसका अर्थ है कि अधिकांश एआई एजेंट मौजूदा एप्लिकेशन प्रोग्रामिंग इंटरफेस (एपीआई) पर बहुत अधिक भरोसा करते हैं। अधिकांश वास्तविक दुनिया के कार्यों में व्यापक एपीआई की कमी होती है, जो वर्तमान एजेंटों को मज़बूती से प्राप्त कर सकते हैं।
अमेज़ॅन को उम्मीद है कि एजेंट अंततः जटिल, बहु-चरण नौकरियों का प्रबंधन करेंगे, जैसे कि बड़ी घटनाओं की योजना बनाना या आईटी समर्थन कार्यों को संभालना। वर्तमान में, एआई एजेंटों को अभी भी निरंतर मानव मार्गदर्शन और जाँच की आवश्यकता है, जो उन्हें वास्तव में स्वतंत्र काम के लिए कम व्यावहारिक बनाते हैं।
अमेज़ॅन नोवा एक्ट क्या है? मुख्य विशेषताएं और कार्य
अमेज़ॅन नोवा एक्ट एक एआई एजेंट है जो एक वेब ब्राउज़र के भीतर कार्यों को नियंत्रित और प्रदर्शन कर सकता है। इस नए एआई मॉडल को सरल कमांड का उपयोग करके एक वेब ब्राउज़र में कार्यों को पूरा करने के लिए प्रशिक्षित किया जाता है। यह नोवा एक्ट एसडीके के माध्यम से एक शोध पूर्वावलोकन के रूप में उपलब्ध है। उपकरण एजेंटों को शेड्यूलिंग और ईमेल प्रबंधन जैसे कार्यों को संभालने की अनुमति देता है। यह हर कदम पर मानव हस्तक्षेप के बिना वास्तविक दुनिया के कार्यों को पूरा करने के लिए डिज़ाइन किया गया है।
यहाँ कुछ विशेषताएं और कार्य हैं:
- वेब एक्शन फोकस: अमेज़ॅन नोवा अधिनियम को विशेष रूप से वेब ब्राउज़र तत्वों के साथ संचालित करने और बातचीत करने के लिए प्रशिक्षित किया जाता है।
- डेवलपर SDK: एक शोध पूर्वावलोकन एसडीके डेवलपर्स को एआई एजेंट प्रोटोटाइप बनाने और परीक्षण करने की अनुमति देता है।
- कार्य स्वचालन: लक्ष्य सरल ब्राउज़र कार्यों को स्वचालित करना है। इसमें फॉर्म भरना या कैलेंडर प्रविष्टियों को प्रबंधित करना शामिल है। यह ऑनलाइन ऑर्डर करने वाले कार्यों को भी संभाल सकता है।
- परमाणु आदेश: एसडीके जटिल प्रक्रियाओं को तोड़ने में मदद करता है। यह ‘खोज’ या ‘चेकआउट’ जैसे विश्वसनीय बुनियादी आदेशों का उपयोग करता है।
- विस्तृत निर्देश: डेवलपर्स कमांड में विशिष्ट मार्गदर्शन जोड़ सकते हैं। उदाहरण के लिए, एजेंट को वैकल्पिक ऐड-ऑन को अस्वीकार करने का निर्देश देना।
- एपीआई और कोड एकीकरण: सिस्टम बाहरी एपीआई को कॉल करने की अनुमति देता है, जिसका अर्थ है कि डेवलपर्स चेक या कस्टम लॉजिक के लिए पायथन कोड भी डाल सकते हैं।
- विश्वसनीयता जोर: अमेज़ॅन ने मुश्किल वेब तत्वों के लिए उच्च सटीकता पर ध्यान केंद्रित किया। इनमें डेट पिकर, ड्रॉपडाउन मेनू और पॉप-अप विंडो शामिल हैं। आंतरिक परीक्षण यहां मजबूत प्रदर्शन दिखाते हैं।
- पृष्ठभूमि संचालन: अमेज़ॅन नोवा एक्ट का उपयोग करके एक बार सेट किए जाने के बाद एआई एजेंट प्रत्यक्ष अवलोकन के बिना चल सकते हैं। वे सिर या शेड्यूल पर काम कर सकते हैं।
- क्रॉस-पर्यावरण क्षमता: शुरुआती परीक्षणों से पता चलता है कि नोवा अधिनियम नए क्षेत्रों में अपनी इंटरफ़ेस समझ को लागू कर सकता है। आश्चर्यजनक रूप से, इसमें वेब-आधारित गेम जैसे वातावरण शामिल हैं।
अमेज़ॅन ने जोर देकर कहा कि नोवा अधिनियम मूलभूत कार्यों के लिए विश्वसनीयता को प्राथमिकता देता है। अमेज़ॅन विशिष्ट वेब इंटरैक्शन के लिए आंतरिक परीक्षणों पर 90% से अधिक सफलता को लक्षित करने पर केंद्रित है। इस फोकस का मतलब है कि निर्मित एजेंटों को एक बार कॉन्फ़िगर किए जाने के बाद लगातार काम करना चाहिए।
अमेज़ॅन नोवा एक्ट एआई एजेंट ने प्रत्यक्ष वेब नियंत्रण क्षमता को मापने वाले बेंचमार्क पर मजबूत परिणामों का दावा किया है। ब्राउज़र-आधारित एआई एजेंट विशिष्ट इंटरैक्शन परीक्षणों में प्रतियोगियों के खिलाफ अच्छा प्रदर्शन करता है। हालाँकि, इसकी तुलना अभी तक सभी सामान्य AI एजेंट मूल्यांकन का उपयोग नहीं की गई है।
स्वायत्त एआई एजेंट वर्कफ़्लो के लिए चुनौतियां
सभी एआई एजेंटों के लिए मुख्य चुनौती स्थिरता है। प्रारंभिक एआई सिस्टम अक्सर धीमी या त्रुटि-प्रवण साबित होते हैं, और वे उन कार्यों के साथ संघर्ष करते हैं जो मनुष्यों को सरल लगता है। अमेज़ॅन को उम्मीद है कि विश्वसनीय बिल्डिंग ब्लॉकों पर इसका ध्यान एक लाभ प्रदान करेगा। सच्चा परीक्षण यह होगा कि नोवा एक्ट वास्तविक दुनिया के डेवलपर अनुप्रयोगों में कैसा प्रदर्शन करता है।
निष्कर्ष
अमेज़ॅन नोवा एक्ट स्पष्ट रूप से अमेज़ॅन के कदम को दर्शाता है और एआई एजेंट डोमेन में स्थानांतरित होता है। विश्वसनीय कार्य घटकों पर इसका जोर वर्तमान एजेंट तकनीक में एक महत्वपूर्ण कमजोरी को संबोधित करता है। अमेज़ॅन ब्राउज़र कार्यों को स्वचालित करने के लिए एआई एजेंट बनाने के लिए उपकरणों के साथ डेवलपर्स प्रदान करके व्यावहारिक अनुप्रयोगों को प्रोत्साहित करने की उम्मीद करता है। अमेज़ॅन से इस रिलीज ने एजेंटिक एआई वर्कफ़्लो ऑटोमेशन में प्रतिस्पर्धा और उत्पादकता पर इसके संभावित प्रभाव को तेज कर दिया। वास्तव में एक स्वायत्त एआई एजेंट को लगातार प्रदर्शन को बनाए रखने की आवश्यकता है; तभी सच वर्कफ़्लो स्वचालन प्राप्त किया जाएगा।
चेक आउट तकनीकी विवरण और इसे यहां आज़माएं। इस शोध के लिए सभी श्रेय इस परियोजना के शोधकर्ताओं को जाते हैं। इसके अलावा, हमें फॉलो करने के लिए स्वतंत्र महसूस करें ट्विटर और हमारे साथ जुड़ने के लिए मत भूलना 85K+ एमएल सबरेडिट।
🔥 ।

मार्कटेकपोस्ट में उत्पाद विकास प्रबंधक निशांत, आर्टिफिशियल इंटेलिजेंस (एआई), यह क्या कर सकते हैं, और इसके विकास के बारे में जानने में रुचि रखते हैं। कुछ नया करने और इसे एक रचनात्मक मोड़ देने के लिए उनका जुनून उन्हें टेक के साथ विपणन को प्रतिच्छेद करने में मदद करता है। वह विकास और बाजार मान्यता की ओर अग्रसर कंपनी की सहायता कर रहा है।
