Technology

AI प्रशिक्षण के लिए आपके डेटा का उपयोग: कैसे करें ऑप्ट आउट और सुरक्षित रहें

डेटा की भूख: AI मॉडल ट्रेनिंग के लिए कंपनियां बदल रहीं प्राइवेसी पॉलिसी

जनरेटिव AI के इस दौर में टेक कंपनियों की डेटा की भूख बढ़ती जा रही है। पिछले कुछ महीनों में कई बड़ी कंपनियों ने चुपचाप अपनी प्राइवेसी पॉलिसी और टर्म्स ऑफ सर्विस में बदलाव किए हैं, ताकि वे यूजर्स के डेटा का इस्तेमाल अपने AI मॉडल्स को ट्रेन करने में कर सकें या फिर दूसरी कंपनियों को लाइसेंस दे सकें।

पिछले हफ्ते WeTransfer ने जब अपनी सेवा की शर्तों में बदलाव किया और कहा कि यूजर्स द्वारा अपलोड की गई फाइल्स का इस्तेमाल “मशीन लर्निंग मॉडल्स को बेहतर बनाने” के लिए किया जा सकता है, तो यूजर्स का गुस्सा फूट पड़ा। हालांकि कंपनी ने बाद में AI और मशीन लर्निंग से जुड़े हिस्से को हटा दिया, लेकिन यह घटना दिखाती है कि AI के जमाने में डेटा की गोपनीयता और मालिकाना हक को लेकर चिंताएं बढ़ रही हैं।

इंटरनेट का सफाया: कहां से लिया जा रहा है डेटा?

टेक कंपनियां इंटरनेट के हर कोने से सार्वजनिक रूप से उपलब्ध डेटा इकट्ठा कर रही हैं – चाहे वह कॉपीराइट के दायरे में हो या न हो। यह डेटा आपकी कोई मजाकिया ट्वीट हो सकती है, ब्लॉग पोस्ट, रेस्तरां की समीक्षा या फिर इंस्टाग्राम पर डाली गई सेल्फी।

कलाकारों, कंटेंट क्रिएटर्स और अन्य अधिकार धारकों ने इस मामले को कोर्ट तक पहुंचाया है। लेकिन सामान्य यूजर्स भी कुछ कदम उठाकर अपने डेटा को AI ट्रेनिंग में इस्तेमाल होने से रोक सकते हैं।

कैसे पता करें कि आपका डेटा इस्तेमाल हुआ है?

अगर आप एक कलाकार या कंटेंट क्रिएटर हैं और जानना चाहते हैं कि कहीं आपके काम का इस्तेमाल AI को ट्रेन करने में तो नहीं किया गया, तो ‘Have I Been Trained?’ वेबसाइट पर जा सकते हैं। यह सर्विस टेक स्टार्टअप Spawning द्वारा चलाई जा रही है।

ध्यान रखें कि अगर आपका डेटा पहले ही AI ट्रेनिंग में इस्तेमाल हो चुका है, तो ऑप्ट आउट करने से वह डेटासेट्स से हटने वाला नहीं है। बस भविष्य में इस्तेमाल होने से रुक सकता है।

कैसे ऑप्ट आउट करें? प्लेटफॉर्मवार गाइड

Adobe: बिजनेस या स्कूल अकाउंट वाले यूजर्स ऑटोमैटिकली ऑप्ट आउट होते हैं। पर्सनल अकाउंट वालों को ये स्टेप्स फॉलो करने होंगे:

  • Adobe की प्राइवेसी पेज पर जाएं
  • ‘Content analysis for product improvement’ सेक्शन तक स्क्रॉल करें
  • टॉगल को ऑफ कर दें

Google Gemini:

  • ब्राउजर में Gemini खोलें
  • ‘Activity’ पर जाएं
  • ‘Turn Off’ ड्रॉपडाउन मेनू चुनें
  • ‘Gemini Apps Activity’ बंद कर दें

Grok (X/Twitter):

  • सेटिंग्स में जाएं
  • प्राइवेसी सेक्शन में ‘Privacy and safety’ चुनें
  • Grok टैब खोलें
  • डेटा शेयरिंग का ऑप्शन अनचेक कर दें

क्या हैं सीमाएं?

ये सभी ऑप्शन्स भविष्य के लिए तो काम कर सकते हैं, लेकिन ज्यादातर AI कंपनियां पहले ही इंटरनेट का डेटा स्क्रैप कर चुकी हैं। कॉपीराइट उल्लंघन के डर से ये कंपनियां अपने ट्रेनिंग डेटासेट्स के बारे में ज्यादा खुलकर बात नहीं करतीं।

टेक इंडस्ट्री का एक बड़ा हिस्सा मानता है कि इंटरनेट पर सार्वजनिक रूप से उपलब्ध किसी भी कंटेंट को AI ट्रेनिंग में इस्तेमाल किया जा सकता है। मिसाल के तौर पर, Meta (पहले Facebook) 18 साल से ऊपर के यूजर्स का सार्वजनिक कंटेंट AI ट्रेनिंग के लिए इस्तेमाल करता है – सिवाय यूरोपीय संघ (EU) के देशों के यूजर्स के।

तो कुल मिलाकर स्थिति यह है कि अगर आपने कुछ भी ऑनलाइन पोस्ट किया है, तो संभावना है कि वह किसी न किसी AI मॉडल की ट्रेनिंग में इस्तेमाल हो चुका होगा। शायद अब समय आ गया है कि हम ऑनलाइन शेयर करने से पहले दो बार सोचें।

अमित वर्मा

फ़ोन: +91 9988776655 🎓 शिक्षा: बी.ए. इन मास कम्युनिकेशन – IP University, दिल्ली 💼 अनुभव: डिजिटल मीडिया में 4 वर्षों का अनुभव टेक्नोलॉजी और बिजनेस न्यूज़ के विशेषज्ञ पहले The Quint और Hindustan Times के लिए काम किया ✍ योगदान: HindiNewsPortal पर टेक और बिज़नेस न्यूज़ कवरेज करते हैं।