Cursor एजेंट्स अब अपने कंप्यूटर खुद नियंत्रित कर सकते हैं
एजेंट की क्षमता उस परिवेश पर निर्भर करती है जिसमें वे चलते हैं। अपने बनाए जा रहे सॉफ़्टवेयर का उपयोग करने की क्षमता के बिना, एजेंट्स एक सीमा पर आकर रुक जाते हैं।
पिछले कुछ महीनों में, हमने आंतरिक रूप से इसका समाधान एजेंट्स को पूर्ण विकास परिवेश वाली उनकी अपनी वर्चुअल मशीनें देकर किया। साथ ही, उन्हें अपने परिवर्तनों का परीक्षण करने और आर्टिफैक्ट्स (वीडियो, स्क्रीनशॉट, और लॉग्स) तैयार करने की क्षमता दी, ताकि आप उनके काम को जल्दी से सत्यापित कर सकें।
आज हम Cursor क्लाउड एजेंट का एक नया संस्करण वहाँ-वहाँ उपलब्ध करा रहे हैं जहाँ भी आप काम करते हैं, जिसमें वेब, मोबाइल, डेस्कटॉप ऐप, Slack, और GitHub शामिल हैं। क्लाउड एजेंट आपके कोडबेस से खुद को परिचित करते हैं और अपने परिवर्तनों का डेमो देने वाले आर्टिफैक्ट्स के साथ मर्ज-तैयार PRs बनाते हैं। आप एजेंट के रिमोट डेस्कटॉप को नियंत्रित भी कर सकते हैं, ताकि संशोधित सॉफ़्टवेयर का उपयोग कर सकें और ब्रांच को लोकली चेक आउट किए बिना खुद संपादन कर सकें।
Tab autocomplete से आगे बढ़कर एजेंट्स के साथ सीधे काम करने के बाद, सॉफ़्टवेयर बनाने के हमारे तरीके में यह सबसे बड़ा बदलाव रहा है। Cursor में जिन PRs को हम मर्ज करते हैं, उनमें से अब 30% से अधिक क्लाउड सैंडबॉक्स में स्वायत्त रूप से काम करने वाले एजेंट्स द्वारा बनाए जाते हैं।


स्वायत्तता का अगला स्तर
लोकल एजेंट्स के साथ कोड जनरेट करना शुरू करना आसान है, लेकिन वे जल्दी ही टकराव पैदा करने लगते हैं और आपके कंप्यूटर के संसाधनों के लिए एक-दूसरे से (और आपसे) प्रतिस्पर्धा करते हैं। क्लाउड एजेंट इस सीमा को दूर करते हैं, क्योंकि वे हर एजेंट को एक पृथक VM देते हैं, ताकि आप कई एजेंट्स को समानांतर में चला सकें।
क्लाउड एजेंट अपने सैंडबॉक्स में सीधे सॉफ़्टवेयर बिल्ड भी कर सकते हैं और उसके साथ इंटरैक्ट भी कर सकते हैं। इससे वे पहला प्रयास सौंप देने के बजाय अपना आउटपुट सत्यापित होने तक बार-बार सुधार कर सकते हैं। नीचे दिया गया वीडियो उन्नत कंप्यूटर उपयोग पर हमारे पहले के अनुसंधान का एक प्रूफ़-ऑफ़-कॉन्सेप्ट दिखाता है।
आप एजेंट को ब्राउज़र में वेब पेजों पर नेविगेट करते, स्प्रेडशीट जैसे उपकरणों का उपयोग करते, डेटा को समझकर निर्णय लेते, और जटिल UI परिवेशों में समस्याएँ सुलझाते देख सकते हैं।
Cursor में क्लाउड एजेंट का इस्तेमाल
पिछले एक महीने से हम आंतरिक रूप से क्लाउड एजेंट का इस्तेमाल कर रहे हैं, और इसने सॉफ़्टवेयर बनाने के हमारे तरीके को बदल दिया है। कार्यों को छोटे-छोटे हिस्सों में बाँटने और एजेंट्स को बारीकी से मैनेज करने के बजाय, अब हम उन्हें ज़्यादा महत्वाकांक्षी कार्य सौंपते हैं और अपने आप काम करने देते हैं।
ये कुछ तरीके हैं जिनसे हम क्लाउड एजेंट का इस्तेमाल कर रहे हैं:
नई सुविधाएँ बनाना
हमने प्लगइन्स बनाने में मदद के लिए क्लाउड एजेंट का इस्तेमाल किया, जिन्हें हमने हाल ही में Cursor Marketplace पर लॉन्च किया है। यहाँ हमारे प्रॉम्प्ट्स में से एक है:
किसी दिए गए plugin के पेज पर दिखने वाले हर component के लिए, हम source code का एक लिंक शामिल करना चाहते हैं। skills, commands, rules, और subagents के लिए — वह
.mdफ़ाइल है। hooks के लिए, वहhooks.jsonहै। mcps के लिए, वह.mcp.jsonया वह manifest है जहाँ इसे परिभाषित किया गया है। जब हम किसी plugin के सभी components को index करें, तो source file का ट्रैक रखें और underlying github url के ज़रिए उस फ़ाइल के लिंक बनाएँ। इसे frontend तक पहुँचाएँ और हमारे frontend से इस icon का इस्तेमाल करके github पर लिंक करवाएँ।https://github.com/prisma/cursor-pluginको लोकली टेस्ट करें
एजेंट ने यह सुविधा लागू की, फिर इंपोर्ट किए गए Prisma plugin तक नेविगेट करते हुए और हर component पर क्लिक करते हुए खुद को रिकॉर्ड किया, ताकि GitHub लिंक्स सत्यापित किए जा सकें।
लोकल टेस्टिंग के लिए, एजेंट ने अस्थायी रूप से उस feature flag को बायपास किया जो marketplace पेज को नियंत्रित कर रहा था, फिर push करने से पहले उसे वापस कर दिया। उसने main पर rebase किया, merge conflicts को resolve किया, और सब कुछ एक single commit में squash किया।
कमज़ोरियों को पुन: उत्पन्न करना
हमने Slack से एक क्लाउड एजेंट शुरू किया, इस प्रॉम्प्ट के साथ: "कृपया इस vulnerability का triage करें और मुझे इसे बहुत विस्तार से समझाएँ," इसके बाद clipboard exfiltration vulnerability का विवरण दिया गया। जब एजेंट का रन पूरा हुआ, तो उसने Slack thread में यह सारांश भेजा कि उसने क्या किया।
एजेंट ने एक HTML पेज बनाया जो exposed API के ज़रिए vulnerability का फायदा उठाता है। उसने डेमो पेज को लोकली होस्ट करने के लिए एक backend server शुरू किया और पेज को Cursor के in-app browser में लोड किया।
वीडियो आर्टिफैक्ट्स पूरा attack flow दिखाता है: एजेंट ने system clipboard में एक test UUID कॉपी किया, Cursor के browser में डेमो पेज लोड किया, और UUID को exfiltrate करके दिखाने के लिए एक बटन पर क्लिक किया। उसने सफल clipboard theft दिखाने वाला एक स्क्रीनशॉट भी लिया और डेमो HTML फ़ाइल को repo में commit किया।
त्वरित सुधारों को संभालना
हमने एक क्लाउड एजेंट से स्थिर "Read lints" label को lint results से चलने वाले dynamic label से बदलने के लिए कहा। उसने zero diagnostics के लिए "No linter errors" और N diagnostics के लिए "Found N errors" लागू किया, साथ ही मौजूदा CSS से मेल खाने वाली styling भी जोड़ी।
एजेंट ने Cursor desktop app में दो मामलों का परीक्षण किया: कई type errors वाली एक फ़ाइल और बिना errors वाली एक साफ़ फ़ाइल। वीडियो आर्टिफैक्ट्स दिखाता है कि एजेंट यह सत्यापित कर रहा है कि साफ़ फ़ाइल में एक expanded group है जो “No linter errors” दिखाता है।
UI की टेस्टिंग
हमने cursor.com/docs पर सब कुछ सही तरह से काम कर रहा है या नहीं, यह जाँचने के लिए एक क्लाउड एजेंट चलाया। उसने हमारी दस्तावेज़ site का पूरा walkthrough करने में 45 मिनट लगाए। एजेंट ने जिन सभी सुविधाओं की टेस्टिंग की, उनका एक सारांश दिया, जिसमें sidebar, शीर्ष navigation, search, copy page button, share feedback dialog, table of contents, और theme switching शामिल हैं।
अब जबकि एजेंट्स ज़्यादातर implementation संभाल सकते हैं, हमने पाया है कि डेवलपर की भूमिका अब ज़्यादा इस बात पर केंद्रित है कि दिशा क्या हो और क्या ship किया जाए।
आगे क्या है
हम स्व-चालित कोडबेस के ऐसे भविष्य की ओर बढ़ रहे हैं, जहाँ एजेंट PRs मर्ज करते हैं, रोलआउट प्रबंधित करते हैं और उत्पादन की निगरानी करते हैं। हम उस दुनिया से आगे बढ़ेंगे जहाँ डेवलपर्स डिफ बनाने के लिए एजेंट का उपयोग करते हैं, और ऐसी दुनिया में पहुँचेंगे जहाँ एजेंट परीक्षण की गई सुविधाओं को एंड-टू-एंड शिप करते हैं।
उस बदलाव को पूरी तरह साकार करने के लिए टूलिंग, मॉडल और इंटरैक्शन पैटर्न में सुधार करना होगा। निकट भविष्य में हमारा फ़ोकस कई एजेंट्स के बीच काम का समन्वय करने और ऐसे मॉडल बनाने पर है जो पिछले रन से सीखें और अनुभव बढ़ने के साथ अधिक प्रभावी बनें।
cursor.com/onboard पर शुरू करें और देखें कि एजेंट खुद को कैसे कॉन्फ़िगर करता है और एक डेमो रिकॉर्ड करता है। या दस्तावेज़ में और जानें।