OpenAI GPT-4 Arriving Mid-March 2023 And It’s Huge

Microsoft जर्मनी CTO, एंड्रियास ब्रौन ने पुष्टि की कि GPT-4 9 मार्च, 2023 के एक सप्ताह के भीतर आ रहा है और यह मल्टीमॉडल होगा। मल्टीमॉडल एआई का मतलब है कि यह वीडियो, इमेज और साउंड जैसे कई तरह के इनपुट में काम करने में सक्षम होगा।

मल्टीमॉडल लार्ज लैंग्वेज मॉडल

घोषणा से बड़ी बात यह है कि GPT-4 मल्टीमॉडल है (SEJ की भविष्यवाणी की गई है GPT-4 मल्टीमॉडल है जनवरी 2023 में)।

मोडैलिटी इनपुट प्रकार का एक संदर्भ है जो (इस मामले में) एक बड़ा भाषा मॉडल डील करता है।

मल्टीमॉडल टेक्स्ट, स्पीच, इमेज और वीडियो को शामिल कर सकता है।

GPT-3 और GPT-3.5 केवल एक मोडैलिटी, टेक्स्ट में संचालित होते हैं।

जर्मन समाचार रिपोर्ट के अनुसार, GPT-4 कम से कम चार तौर-तरीकों, छवियों, ध्वनि (श्रवण), पाठ और वीडियो में काम करने में सक्षम हो सकता है।

डॉ. एंड्रियास ब्रौन, सीटीओ माइक्रोसॉफ्ट जर्मनी उद्धृत है:

“हम अगले सप्ताह GPT-4 पेश करेंगे, वहां हमारे पास मल्टीमॉडल मॉडल होंगे जो पूरी तरह से अलग संभावनाएं पेश करेंगे – उदाहरण के लिए वीडियो …”

रिपोर्टिंग में GPT-4 के लिए विशिष्टताओं का अभाव था, इसलिए यह स्पष्ट नहीं है कि मल्टीमॉडलिटी के बारे में जो साझा किया गया था वह GPT-4 के लिए विशिष्ट था या केवल सामान्य रूप से।

Microsoft निदेशक व्यवसाय रणनीति होल्गर केन मल्टीमॉडलिटीज की व्याख्या की लेकिन रिपोर्टिंग अस्पष्ट थी अगर वह जीपीटी-4 मल्टीमॉडलिटी या मल्टीमॉडलिटी जेनेरा को संदर्भित कर रहा था।

मेरा मानना ​​है कि मल्टीमॉडलिटी के उनके संदर्भ GPT-4 के लिए विशिष्ट थे।

साझा की गई समाचार रिपोर्ट:

“केन ने समझाया कि मल्टीमॉडल एआई क्या है, जो टेक्स्ट को न केवल छवियों में, बल्कि संगीत और वीडियो में भी अनुवाद कर सकता है।”

एक और दिलचस्प तथ्य यह है कि माइक्रोसॉफ्ट काम कर रहा है “आत्मविश्वास मेट्रिक्स” अपने एआई को तथ्यों के आधार पर और अधिक विश्वसनीय बनाने के लिए।

माइक्रोसॉफ्ट कॉसमॉस -1

कुछ ऐसा जो स्पष्ट रूप से संयुक्त राज्य अमेरिका में कम आंका गया था, वह यह है कि Microsoft ने मार्च 2023 की शुरुआत में कोस्मोस -1 नामक एक मल्टीमॉडल भाषा मॉडल जारी किया।

जर्मन न्यूज साइट की रिपोर्ट के मुताबिक, हेइस.डीइ:

“…टीम ने पूर्व-प्रशिक्षित मॉडल को विभिन्न परीक्षणों के अधीन किया, छवियों को वर्गीकृत करने, छवि सामग्री के बारे में सवालों के जवाब देने, छवियों की स्वचालित लेबलिंग, ऑप्टिकल पाठ पहचान और भाषण निर्माण कार्यों में अच्छे परिणाम के साथ।

… दृश्य तर्क, यानी एक मध्यवर्ती चरण के रूप में भाषा का उपयोग किए बिना छवियों के बारे में निष्कर्ष निकालना, यहां एक कुंजी प्रतीत होता है…”

कॉसमॉस-1 एक मल्टीमॉडल मोडल है जो टेक्स्ट और इमेज के तौर-तरीकों को एकीकृत करता है।

GPT-4, Kosmos-1 से आगे जाता है क्योंकि यह एक तीसरा साधन, वीडियो जोड़ता है, और ध्वनि के तौर-तरीकों को भी शामिल करता प्रतीत होता है।

कई भाषाओं में काम करता है

ऐसा प्रतीत होता है कि GPT-4 सभी भाषाओं में काम करता है। इसे जर्मन में प्रश्न प्राप्त करने और इतालवी में उत्तर देने में सक्षम होने के रूप में वर्णित किया गया है।

यह एक तरह का अजीब उदाहरण है, क्योंकि कौन जर्मन में प्रश्न पूछेगा और इतालवी में उत्तर प्राप्त करना चाहेगा?

यही पुष्टि की गई:

“… तकनीक इतनी आगे बढ़ गई है कि यह मूल रूप से” सभी भाषाओं में काम करती है “: आप जर्मन में एक प्रश्न पूछ सकते हैं और इतालवी में उत्तर प्राप्त कर सकते हैं।

मल्टीमॉडलिटी के साथ, माइक्रोसॉफ्ट (-ओपनएआई) ‘मॉडलों को व्यापक बनाएगा’।’

मेरा मानना ​​है कि सफलता की बात यह है कि मॉडल विभिन्न भाषाओं में ज्ञान खींचने की अपनी क्षमता के साथ भाषा को पार करता है। इसलिए यदि उत्तर इतालवी में है तो उसे पता चल जाएगा और वह उस भाषा में उत्तर देने में सक्षम होगा जिसमें प्रश्न पूछा गया था।

यह इसे Google के मल्टीमॉडल AI नामक MUM के लक्ष्य के समान बना देगा। कहा जाता है कि मम अंग्रेजी में उत्तर देने में सक्षम हैं, जिसके लिए डेटा केवल जापानी जैसी दूसरी भाषा में मौजूद है।

GPT-4 अनुप्रयोग

GPT-4 कहाँ दिखाई देगा इसकी कोई वर्तमान घोषणा नहीं है। लेकिन Azure-OpenAI का विशेष रूप से उल्लेख किया गया था।

Google अपने स्वयं के खोज इंजन में एक प्रतिस्पर्धी तकनीक को एकीकृत करके Microsoft को पकड़ने के लिए संघर्ष कर रहा है। यह विकास इस धारणा को और बढ़ा देता है कि Google पिछड़ रहा है और उपभोक्ता-सामना करने वाले AI में नेतृत्व की कमी है।

Google पहले से ही कई उत्पादों जैसे कि Google लेंस, Google मैप्स और अन्य क्षेत्रों में AI को एकीकृत करता है जहां उपभोक्ता Google के साथ बातचीत करते हैं। यह दृष्टिकोण छोटे कार्यों में लोगों की मदद करने के लिए एआई को एक सहायक तकनीक के रूप में उपयोग करना है।

जिस तरह से Microsoft इसे लागू कर रहा है वह अधिक दिखाई दे रहा है और फलस्वरूप यह सभी का ध्यान आकर्षित कर रहा है और Google की तस्वीर को मजबूत कर रहा है और पकड़ने के लिए संघर्ष कर रहा है।

मूल जर्मन रिपोर्टिंग यहाँ पढ़ें:

GPT-4 अगले सप्ताह आ रहा है – और यह मल्टीमॉडल होगा, Microsoft जर्मनी का कहना है

शटरस्टॉक/मास्टर1305 द्वारा फीचर्ड छवि

Leave a Comment