How The ChatGPT Watermark Works And Why It Could Be Defeated
OpenAI के ChatGPT ने स्वचालित रूप से सामग्री बनाने का एक तरीका पेश किया, लेकिन वाटरमार्किंग सुविधा शुरू करने की योजना है ताकि इसका पता लगाना आसान हो सके, जिससे कुछ लोग घबरा रहे हैं। चैटजीपीटी वॉटरमार्किंग इस तरह काम करती है और इसे हराने का कोई तरीका क्यों हो सकता है।
ChatGPT एक अविश्वसनीय उपकरण है जो ऑनलाइन प्रकाशक, सहयोगी और SEO एक साथ पसंद करते हैं और डरते हैं।
कुछ विपणक इसे पसंद करते हैं क्योंकि वे सामग्री सारांश, रूपरेखा और जटिल लेख उत्पन्न करने के लिए इसका उपयोग करने के नए तरीके खोज रहे हैं।
ऑनलाइन प्रकाशक खोज परिणामों में एआई सामग्री की बाढ़ की संभावना से डरते हैं, जो मानव द्वारा लिखे गए विशेषज्ञ लेखों की जगह लेते हैं।
नतीजतन, एक वॉटरमार्किंग सुविधा की खबर जो चैटजीपीटी-लेखक सामग्री का पता लगाने को अनलॉक करती है, इसी तरह चिंता और आशा के साथ प्रत्याशित है।
क्रिप्टोग्राफिक वॉटरमार्क
वॉटरमार्क एक अर्ध-पारदर्शी चिह्न (एक लोगो या पाठ) होता है जो एक छवि पर एम्बेड किया जाता है। वॉटरमार्क संकेत देता है कि काम का मूल लेखक कौन है।
यह काफी हद तक तस्वीरों में और तेजी से वीडियो में देखा जाता है।
ChatGPT में वॉटरमार्किंग टेक्स्ट में गुप्त कोड के रूप में शब्दों, अक्षरों और विराम चिह्नों के पैटर्न को एम्बेड करने के रूप में क्रिप्टोग्राफी शामिल है।
स्कॉट आरोनसन और चैटजीपीटी वॉटरमार्किंग
स्कॉट आरोनसन नाम के एक प्रभावशाली कंप्यूटर वैज्ञानिक को जून 2022 में AI सुरक्षा और संरेखण पर काम करने के लिए OpenAI द्वारा नियुक्त किया गया था।
एआई सेफ्टी एक शोध क्षेत्र है जो उन तरीकों का अध्ययन करने से संबंधित है जो एआई मनुष्यों को नुकसान पहुंचा सकते हैं और उस तरह के नकारात्मक व्यवधान को रोकने के तरीके बना सकते हैं।
द डिस्टिल साइंटिफिक जर्नल, जिसमें OpenAI से संबद्ध लेखक हैं, एआई सुरक्षा को परिभाषित करता है इस तरह:
“दीर्घकालिक कृत्रिम बुद्धिमत्ता (एआई) सुरक्षा का लक्ष्य यह सुनिश्चित करना है कि उन्नत एआई सिस्टम विश्वसनीय रूप से मानवीय मूल्यों के साथ संरेखित हों – कि वे मज़बूती से वे काम करें जो लोग उनसे करवाना चाहते हैं।”
AI संरेखण कृत्रिम बुद्धिमत्ता क्षेत्र है जो यह सुनिश्चित करने से संबंधित है कि AI अभीष्ट लक्ष्यों के साथ संरेखित है।
चैटजीपीटी जैसे बड़े भाषा मॉडल (एलएलएम) का उपयोग इस तरह से किया जा सकता है जो लक्ष्यों के विपरीत हो सकता है एआई संरेखण OpenAI द्वारा परिभाषित के रूप मेंजो मानवता को लाभ पहुंचाने वाले एआई को बनाना है।
तदनुसार, वॉटरमार्किंग का कारण मानवता को नुकसान पहुंचाने वाले एआई के दुरुपयोग को रोकना है।
एरोनसन ने वॉटरमार्किंग चैटजीपीटी आउटपुट का कारण समझाया:
“यह अकादमिक साहित्यिक चोरी को रोकने के लिए सहायक हो सकता है, जाहिर है, लेकिन उदाहरण के लिए, बड़े पैमाने पर प्रचार प्रसार …”
चैटजीपीटी वॉटरमार्किंग कैसे काम करता है?
चैटजीपीटी वॉटरमार्किंग एक ऐसी प्रणाली है जो शब्दों के चयन और यहां तक कि विराम चिह्नों में एक सांख्यिकीय पैटर्न, एक कोड एम्बेड करती है।
आर्टिफिशियल इंटेलिजेंस द्वारा बनाई गई सामग्री शब्द पसंद के काफी अनुमानित पैटर्न के साथ उत्पन्न होती है।
मानव और एआई द्वारा लिखे गए शब्द एक सांख्यिकीय पैटर्न का पालन करते हैं।
जेनरेट की गई सामग्री में उपयोग किए गए शब्दों के पैटर्न को बदलना टेक्स्ट को “वॉटरमार्क” करने का एक तरीका है, जिससे सिस्टम के लिए यह पता लगाना आसान हो जाता है कि क्या यह एआई टेक्स्ट जनरेटर का उत्पाद है।
एआई सामग्री वॉटरमार्किंग को पहचानने योग्य बनाने वाली चाल यह है कि शब्दों के वितरण में अभी भी सामान्य एआई उत्पन्न टेक्स्ट के समान एक यादृच्छिक उपस्थिति है।
इसे शब्दों के छद्म आयामी वितरण के रूप में जाना जाता है।
छद्म यादृच्छिकता शब्दों या संख्याओं की सांख्यिकीय रूप से यादृच्छिक श्रृंखला है जो वास्तव में यादृच्छिक नहीं हैं।
चैटजीपीटी वॉटरमार्किंग वर्तमान में उपयोग में नहीं है। हालाँकि OpenAI में स्कॉट आरोनसन यह कहते हुए रिकॉर्ड में हैं कि यह योजना बनाई गई है।
अभी चैटजीपीटी पूर्वावलोकन में है, जो ओपनएआई को वास्तविक दुनिया के उपयोग के माध्यम से “गलत संरेखण” खोजने की अनुमति देता है।
संभवतः वॉटरमार्किंग को ChatGPT के अंतिम संस्करण में या उससे पहले पेश किया जा सकता है।
स्कॉट आरोनसन लिखा वॉटरमार्किंग कैसे काम करता है इसके बारे में:
“मेरा अब तक का मुख्य प्रोजेक्ट GPT जैसे टेक्स्ट मॉडल के आउटपुट को सांख्यिकीय रूप से वॉटरमार्क करने का एक टूल रहा है।
मूल रूप से, जब भी GPT कुछ लंबा पाठ उत्पन्न करता है, हम चाहते हैं कि इसके शब्दों के विकल्पों में एक अन्यथा ध्यान देने योग्य गुप्त संकेत हो, जिसका उपयोग आप बाद में यह साबित करने के लिए कर सकते हैं कि हाँ, यह GPT से आया है।
एरोनसन ने आगे बताया कि चैटजीपीटी वॉटरमार्किंग कैसे काम करती है। लेकिन पहले, टोकननाइजेशन की अवधारणा को समझना महत्वपूर्ण है।
टोकनाइजेशन एक ऐसा कदम है जो प्राकृतिक भाषा प्रसंस्करण में होता है जहां मशीन शब्दों को एक दस्तावेज़ में लेती है और उन्हें शब्दार्थ इकाइयों जैसे शब्दों और वाक्यों में तोड़ देती है।
टोकनाइजेशन पाठ को एक संरचित रूप में बदलता है जिसका उपयोग मशीन सीखने में किया जा सकता है।
टेक्स्ट जनरेशन की प्रक्रिया पिछले टोकन के आधार पर यह अनुमान लगाने वाली मशीन है कि कौन सा टोकन अगला आता है।
यह एक गणितीय फ़ंक्शन के साथ किया जाता है जो अगले टोकन की संभावना को निर्धारित करता है, जिसे प्रायिकता वितरण कहा जाता है।
अगला कौन सा शब्द है इसकी भविष्यवाणी की गई है लेकिन यह यादृच्छिक है।
वॉटरमार्किंग ही वह है जिसे हारून छद्म यादृच्छिक के रूप में वर्णित करता है, जिसमें किसी विशेष शब्द या विराम चिह्न के होने का गणितीय कारण होता है लेकिन यह अभी भी सांख्यिकीय रूप से यादृच्छिक है।
यहाँ GPT वॉटरमार्किंग की तकनीकी व्याख्या दी गई है:
“जीपीटी के लिए, प्रत्येक इनपुट और आउटपुट टोकन की एक स्ट्रिंग है, जो शब्द हो सकते हैं लेकिन विराम चिह्न, शब्दों के हिस्से या अधिक – कुल मिलाकर लगभग 100,000 टोकन हैं।
इसके मूल में, GPT पिछले टोकन की स्ट्रिंग पर सशर्त, उत्पन्न करने के लिए अगले टोकन पर लगातार एक संभाव्यता वितरण उत्पन्न कर रहा है।
न्यूरल नेट वितरण उत्पन्न करने के बाद, OpenAI सर्वर वास्तव में उस वितरण के अनुसार एक टोकन का नमूना लेता है – या वितरण के कुछ संशोधित संस्करण, ‘तापमान’ नामक पैरामीटर के आधार पर।
जब तक तापमान शून्य नहीं है, हालांकि, आमतौर पर अगले टोकन की पसंद में कुछ यादृच्छिकता होगी: आप एक ही संकेत के साथ बार-बार दौड़ सकते हैं, और एक अलग पूर्णता प्राप्त कर सकते हैं (यानी, आउटपुट टोकन की स्ट्रिंग) हर बार .
तो फिर वॉटरमार्क के लिए, अगले टोकन को बेतरतीब ढंग से चुनने के बजाय, एक क्रिप्टोग्राफ़िक छद्म यादृच्छिक फ़ंक्शन का उपयोग करके इसे छद्म यादृच्छिक रूप से चुनने का विचार होगा, जिसकी कुंजी केवल OpenAI के लिए जानी जाती है।
पाठ पढ़ने वालों के लिए वॉटरमार्क पूरी तरह से स्वाभाविक लगता है क्योंकि शब्दों का चुनाव अन्य सभी शब्दों की यादृच्छिकता की नकल कर रहा है।
लेकिन उस यादृच्छिकता में पूर्वाग्रह होता है जिसे केवल किसी व्यक्ति द्वारा इसे डीकोड करने की कुंजी के साथ पता लगाया जा सकता है।
यह तकनीकी व्याख्या है:
“उदाहरण के लिए, विशेष मामले में जीपीटी के पास संभावित टोकन का एक गुच्छा था जो समान रूप से संभावित था, आप बस जो भी टोकन अधिकतम जी चुन सकते थे। पसंद किसी ऐसे व्यक्ति के लिए समान रूप से यादृच्छिक दिखाई देगी जो कुंजी नहीं जानता था, लेकिन कोई व्यक्ति जो कुंजी जानता था, बाद में सभी एन-ग्राम पर जी जोड़ सकता था और देख सकता था कि यह असामान्य रूप से बड़ा था।
वॉटरमार्किंग एक गोपनीयता-प्रथम समाधान है
मैंने सोशल मीडिया पर चर्चाएँ देखी हैं जहाँ कुछ लोगों ने सुझाव दिया कि OpenAI अपने द्वारा उत्पन्न प्रत्येक आउटपुट का रिकॉर्ड रख सकता है और उसका पता लगाने के लिए उपयोग कर सकता है।
स्कॉट आरोनसन ने पुष्टि की कि ओपनएआई ऐसा कर सकता है लेकिन ऐसा करने से गोपनीयता का मुद्दा बनता है। संभावित अपवाद कानून प्रवर्तन स्थिति के लिए है, जिसके बारे में उन्होंने विस्तार से नहीं बताया।
चैटजीपीटी या जीपीटी वॉटरमार्किंग का पता कैसे लगाएं
कुछ दिलचस्प जो अभी तक अच्छी तरह से ज्ञात नहीं है, वह यह है कि स्कॉट आरोनसन ने नोट किया कि वॉटरमार्किंग को हराने का एक तरीका है।
उसने यह नहीं कहा संभव वॉटरमार्किंग को हराने के लिए, उन्होंने कहा कि यह कर सकते हैं पिछड़ते रहें।
“अब, यह सब पर्याप्त प्रयास से पराजित किया जा सकता है।
उदाहरण के लिए, यदि आपने GPT के आउटपुट की व्याख्या करने के लिए किसी अन्य AI का उपयोग किया है – तो ठीक है, हम उसका पता लगाने में सक्षम नहीं होंगे।
ऐसा लगता है कि वॉटरमार्किंग को पराजित किया जा सकता है, कम से कम नवंबर से जब उपरोक्त बयान दिए गए थे।
इस बात का कोई संकेत नहीं है कि वॉटरमार्किंग वर्तमान में उपयोग में है। लेकिन जब यह प्रयोग में आता है, तो यह अज्ञात हो सकता है कि यह बचाव का रास्ता बंद हो गया था।
उद्धरण
स्कॉट आरोनसन को पढ़ें ब्लॉग पोस्ट यहाँ.
शटरस्टॉक/रियलपीपुलस्टूडियो द्वारा प्रदर्शित छवि
var s_trigger_pixel_load = false; function s_trigger_pixel(){ if( !s_trigger_pixel_load ){ striggerEvent( 'load2' ); console.log('s_trigger_pix'); } s_trigger_pixel_load = true; } window.addEventListener( 'cmpready', s_trigger_pixel, false);
window.addEventListener( 'load2', function() {
if( sopp != 'yes' && !ss_u ){
!function(f,b,e,v,n,t,s) {if(f.fbq)return;n=f.fbq=function(){n.callMethod? n.callMethod.apply(n,arguments):n.queue.push(arguments)}; if(!f._fbq)f._fbq=n;n.push=n;n.loaded=!0;n.version='2.0'; n.queue=[];t=b.createElement(e);t.async=!0; t.src=v;s=b.getElementsByTagName(e)[0]; s.parentNode.insertBefore(t,s)}(window,document,'script', 'https://connect.facebook.net/en_US/fbevents.js');
if( typeof sopp !== "undefined" && sopp === 'yes' ){ fbq('dataProcessingOptions', ['LDU'], 1, 1000); }else{ fbq('dataProcessingOptions', []); }
fbq('init', '1321385257908563');
fbq('track', 'PageView');
fbq('trackSingle', '1321385257908563', 'ViewContent', { content_name: 'chatgpt-watermark', content_category: 'news seo' }); } });