अपनी पिछली प्रथाओं से एक महत्वपूर्ण प्रस्थान में, OpenAI ने घोषणा की है कि वह अब अपने API के माध्यम से भेजे गए ग्राहक डेटा का उपयोग अपने विस्तृत भाषा मॉडल, जैसे GPT-4 को प्रशिक्षित करने के लिए नहीं करेगा।
हाल ही में ओपनएआई के सीईओ सैम ऑल्टमैन ने इस बदलाव की पुष्टि की थी साक्षात्कार सीएनबीसी के साथ।
उपयोगकर्ता डेटा के लिए OpenAI का नया दृष्टिकोण
OpenAI की नीति में बदलाव 1 मार्च, 2023 को लागू किया गया था, जब कंपनी ने उपयोगकर्ता गोपनीयता के प्रति इस नई प्रतिबद्धता को दर्शाने के लिए चुपचाप अपनी सेवा की शर्तों को अपडेट किया था।
ऑल्टमैन ने स्पष्ट किया, “ग्राहक स्पष्ट रूप से चाहते हैं कि हम उनके डेटा पर प्रशिक्षित न हों, इसलिए हमने अपनी योजनाओं को बदल दिया है: हम ऐसा नहीं करेंगे।”
एपीआई, या एप्लिकेशन प्रोग्रामिंग इंटरफेस, तकनीकी ढांचे हैं जो ग्राहकों को ओपनएआई के सॉफ्टवेयर से सीधे जुड़ने की अनुमति देते हैं।
Altman ने कहा कि OpenAI “कुछ समय के लिए” मॉडल प्रशिक्षण के लिए एपीआई डेटा का उपयोग नहीं कर रहा है, यह सुझाव देते हुए कि यह आधिकारिक घोषणा एक मौजूदा अभ्यास को औपचारिक रूप देती है।
व्यावसायिक ग्राहकों के लिए निहितार्थ
OpenAI के कदम के दूरगामी प्रभाव हैं, विशेष रूप से इसके व्यापारिक ग्राहकों के लिए, जिनमें Microsoft, Salesforce और Snapchat जैसे दिग्गज शामिल हैं।
इन कंपनियों द्वारा अपने संचालन के लिए OpenAI की API क्षमताओं का उपयोग करने की अधिक संभावना है, इसलिए गोपनीयता और डेटा सुरक्षा बदलाव उनके लिए विशेष रूप से प्रासंगिक है।
हालाँकि, नए डेटा सुरक्षा उपाय पूरी तरह से कंपनी की एपीआई सेवाओं का उपयोग करने वाले ग्राहकों पर लागू होते हैं। OpenAI की सेवा की अद्यतन शर्तें नोट, “हम अपने API के अलावा अन्य सेवाओं की सामग्री का उपयोग कर सकते हैं।”
जैसे, डेटा इनपुट के अन्य रूप, जैसे कि लोकप्रिय चैटबॉट चैटजीपीटी में दर्ज टेक्स्ट, अभी भी ओपनएआई द्वारा उपयोग किया जा सकता है जब तक कि डेटा एपीआई के माध्यम से साझा नहीं किया जाता है।
व्यापक उद्योग प्रभाव
OpenAI की नीतिगत बदलाव तब आता है जब उद्योग बड़े भाषा मॉडल के संभावित प्रभावों से जूझते हैं, जैसे कि OpenAI का ChatGPT, पारंपरिक रूप से मानव द्वारा बनाई गई सामग्री की जगह लेता है।
उदाहरण के लिए, राइटर्स गिल्ड ऑफ अमेरिका ने हाल ही में गिल्ड और फिल्म स्टूडियो के बीच बातचीत के बाद हड़ताल शुरू कर दी। गिल्ड स्क्रिप्ट निर्माण या पुनर्लेखन के लिए ओपनएआई के चैटजीपीटी का उपयोग करने पर प्रतिबंध लगाने की वकालत कर रहा था।
OpenAI का प्रशिक्षण के लिए ग्राहक डेटा का उपयोग नहीं करने का निर्णय डेटा गोपनीयता और AI के बारे में चल रही बातचीत में एक महत्वपूर्ण क्षण है। जैसा कि कंपनियां एआई तकनीक की सीमाओं का पता लगाना और आगे बढ़ाना जारी रखती हैं, उपयोगकर्ता की गोपनीयता सुनिश्चित करना और विश्वास बनाए रखना इन चर्चाओं के केंद्र में रहने की संभावना है।
चैटजीपीटी का विकास: जीपीटी-3 से जीपीटी-4
यह ध्यान रखना महत्वपूर्ण है कि प्रशिक्षण के लिए ग्राहक डेटा का उपयोग नहीं करने की OpenAI की प्रतिबद्धता इसके नवीनतम भाषा मॉडल, GPT-4 पर लागू होती है, जिसे 14 मार्च, 2023 को जारी किया गया था।
GPT-4 ने अपने पूर्ववर्ती, GPT-3 की तुलना में कई सुधार पेश किए, जिनमें शब्द सीमा के आकार में महत्वपूर्ण वृद्धि (ChatGPT की 3,000-शब्द सीमा की तुलना में 25,000), अधिक संदर्भ विंडो आकार, और बेहतर तर्क और समझने की क्षमता शामिल है।
GPT-4 की एक और उल्लेखनीय विशेषता इसकी बहु-रूपता है, या पाठ के अलावा छवियों से जानकारी को समझने और अनुमान लगाने की क्षमता है। यह नवीनतम मॉडल अधिक वैयक्तिकृत अनुभव के लिए इमोजी जैसी सुविधाओं का उपयोग करके अधिक मानवीय-जैसे पाठ उत्पन्न करता है।
हालांकि, GPT-4 के सटीक आकार और संरचना का खुलासा नहीं किया गया है, जिससे मॉडल के विवरण के बारे में अटकलें लगाई जा रही हैं।
इन अफवाहों के बावजूद, OpenAI के CEO ने मॉडल के आकार के बारे में विशिष्ट दावों का खंडन किया है।
प्रदर्शन के संबंध में, GPT-4 में है ताकत का प्रदर्शन किया टेक्स्ट जनरेशन में लेकिन कुछ सीमाएँ भी। उदाहरण के लिए, इसने ग्रेजुएट रिकॉर्ड एग्जामिनेशन (जीआरई) राइटिंग में 54वें परसेंटाइल में स्कोर किया और एपी कैलकुलस बीसी परीक्षा में 43वें – 59वें पर्सेंटाइल में प्रदर्शन किया।
इसके अतिरिक्त, इसने आसान लीटकोड कोडिंग कार्यों पर अच्छा प्रदर्शन किया, लेकिन इसके प्रदर्शन में वृद्धि हुई कार्य कठिनाई के साथ गिरावट आई।
जबकि GPT-4 की प्रशिक्षण प्रक्रिया की बारीकियों को आधिकारिक रूप से प्रलेखित नहीं किया गया है, यह ज्ञात है कि GPT मॉडल में आम तौर पर इंटरनेट पाठ की एक विविध श्रेणी के साथ बड़े पैमाने पर मशीन लर्निंग शामिल होती है।
आशा करना
OpenAI की डेटा उपयोग नीति में परिवर्तन के परिणामस्वरूप, इसके भाषा मॉडल के प्रशिक्षण के लिए उपयोग किए जाने वाले डेटा में API के माध्यम से साझा की गई जानकारी शामिल नहीं होती है, जब तक कि उपयोगकर्ता इस उद्देश्य के लिए इसे योगदान देने के लिए स्पष्ट रूप से सहमत न हों।
जबकि यह तकनीक हमारे जीवन में सुधार करती है और अधिक महत्वपूर्ण भूमिका निभाती है, यह दिलचस्प है कि कैसे कंपनियां डेटा को निजी रखने और लोगों का विश्वास अर्जित करने के बारे में चिंताओं का जवाब देती हैं।
मिडजर्नी का उपयोग करके लेखक द्वारा बनाई गई विशेष रुप से प्रदर्शित छवि।