2022 को कवर करने वाली Google की वार्षिक वेबस्पैम रिपोर्ट में उन सभी तरीकों पर प्रकाश डाला गया है जिनके स्पैमब्रेन एंटी-स्पैम सिस्टम स्पैम के कई रूपों को पकड़ने में अधिक कुशल हो गए हैं। जबकि रिपोर्ट मुख्य रूप से रिपोर्ट करने के बारे में है कि उन्होंने साल पहले की तुलना में कितना अधिक स्पैम पकड़ा, स्पैमब्रेन कैसे काम करता है इसके बारे में बिट्स उतना ही महत्वपूर्ण लग रहा था।
Google स्पैमब्रेन प्लेटफ़ॉर्म
स्पैमब्रेन वह नाम है जो Google ने अपने मशीन लर्निंग सिस्टम को दिया था जिसे Google एक ऐसा प्लेटफ़ॉर्म कहता है जिससे एल्गोरिदम लॉन्च किया जाता है जो अवांछित सामग्री के कई रूपों का पता लगाता है।
मशीन लर्निंग आर्टिफिशियल इंटेलिजेंस का एक रूप है जो डेटा का उपयोग उस कार्य को पूरा करने के लिए तेजी से कुशल बनने के लिए सीखने के लिए करता है जिसे इसे पूरा करने के लिए डिज़ाइन किया गया है।
मशीन लर्निंग प्लेटफॉर्म के अलावा स्पैमब्रेन के बारे में ज्यादा जानकारी नहीं है और यह स्पैम को रैंकिंग से दूर रखने के लिए Google की पहल के लिए “केंद्रीय” है।
Google की वेबस्पैम रिपोर्ट स्पैमब्रेन के बारे में यह नोट करती है:
“हमने स्पैमब्रेन को एक मजबूत और बहुमुखी मंच के रूप में भी सुधार किया है, विभिन्न प्रकार के दुरुपयोग के हमारे कवरेज को बेहतर बनाने के लिए कई समाधान लॉन्च किए हैं।”
स्पैमब्रेन में सुधार
वेबस्पैम रिपोर्ट में कहा गया है कि सिस्टम में सुधार के परिणामस्वरूप पिछले वर्ष की तुलना में 500% अधिक स्पैम साइटें पकड़ी गईं।
हैक की गई वेबसाइटों की पहचान करने की स्पैमब्रेन की क्षमता में अतिरिक्त प्रशिक्षण के परिणामस्वरूप दस गुना वृद्धि हुई है।
लिंक स्पैम डिटेक्शन
रिपोर्ट में कहा गया है कि विशेष लिंक स्पैम प्रशिक्षण के परिणामस्वरूप पिछले वर्ष की तुलना में लिंक स्पैम बनाने वाली पचास गुना अधिक साइटों को पकड़ा गया, जो स्पैमब्रेन की सफलता की कुंजी के रूप में सीखने की क्षमता का हवाला देते हैं।
“स्पैमब्रेन की सीखने की क्षमता के लिए धन्यवाद, हमने पिछले लिंक स्पैम अपडेट की तुलना में 50 गुना अधिक लिंक स्पैम साइटों का पता लगाया।”
इंडेक्सिंग गेटकीपर
स्पैमब्रेन के बारे में एक दिलचस्प तथ्य यह है कि क्रॉलिंग के समय यह स्पैम की पहचान कैसे करता है।
यदि किसी क्रॉल किए गए पृष्ठ को स्पैम के रूप में पाया जाता है, तो इसे तुरंत ब्लॉक कर दिया जाता है, इसे Google की खोज अनुक्रमणिका में प्रवेश करने से रोका जाता है और संसाधनों को अवांछित वेबपृष्ठों को क्रॉल करने से बचाया जाता है।
क्रॉल के समय स्पैम को ब्लॉक करना एक है क्षमता जो 2021 में घोषित की गई थीजिसने नोट किया कि अनुक्रमण न केवल स्पैम क्रॉल होने पर अवरुद्ध होता है बल्कि खोज कंसोल और साइटमैप के माध्यम से घुसपैठ करने का प्रयास करने पर भी अवरुद्ध होता है।
उन्होंने 2021 में लिखा:
“…हमारे पास ऐसे सिस्टम हैं जो स्पैम का पता लगा सकते हैं जब हम पृष्ठों या अन्य सामग्री को क्रॉल करते हैं। क्रॉलिंग तब होता है जब हमारे स्वचालित सिस्टम सामग्री पर जाते हैं और उस अनुक्रमणिका में शामिल करने के लिए विचार करते हैं जिसका उपयोग हम खोज परिणाम प्रदान करने के लिए करते हैं। स्पैम के रूप में पाई गई कुछ सामग्री को अनुक्रमणिका में नहीं जोड़ा जाता है.
ये सिस्टम साइटमैप और सर्च कंसोल के माध्यम से हमारे द्वारा खोजी गई सामग्री के लिए भी काम करते हैं।
उदाहरण के लिए, सर्च कंसोल में एक रिक्वेस्ट इंडेक्सिंग फीचर है जिससे क्रिएटर्स हमें उन नए पेजों के बारे में बता सकते हैं जिन्हें जल्दी से जोड़ा जाना चाहिए। हमने स्पैमर्स को कमजोर साइटों में हैकिंग करते देखा, इन साइटों के मालिक होने का नाटक किया, सर्च कंसोल में खुद को सत्यापित किया और Google को उनके द्वारा बनाए गए कई स्पैम पेजों को क्रॉल और इंडेक्स करने के लिए कहने के लिए टूल का उपयोग किया।
एआई का उपयोग करते हुए, हम संदिग्ध सत्यापनों को इंगित करने में सक्षम थे और स्पैम यूआरएल को इस तरह से हमारे सूचकांक में आने से रोका।
इसलिए यह कहना उचित है कि स्पैमब्रेन के कई कार्यों में से एक गेटकीपर की तरह कार्य करना है, इससे पहले कि स्पैम को Google की अनुक्रमणिका में शामिल करने का मौका मिले, उसे अवरुद्ध कर दिया जाए।
स्कैम प्रोटेक्शन अब बहुभाषी है
स्पैमब्रेन के लिए कुछ नया यह है कि स्कैम आइडेंटिफिकेशन सिस्टम अब बहुभाषी है, जो स्कैम साइटों पर क्लिक्स को पिछले वर्ष की तुलना में 50% तक कम करता है।
स्पैमी सामग्री के बारे में क्या?
इस वर्ष की रिपोर्ट लिंक स्पैम को पकड़ने, हैक की गई साइटों की पहचान करने और क्रॉल समय पर स्पैम का पता लगाने में सुधार पर केंद्रित है।
इसमें जो उल्लेख नहीं किया गया वह स्पैमयुक्त सामग्री की पहचान करने से संबंधित था।
क्या ऐसा इसलिए है क्योंकि सामग्री पक्ष को सहायक सामग्री एल्गोरिथम द्वारा नियंत्रित किया जाता है न कि स्पैमब्रेन द्वारा?
Google की वेबस्पैम रिपोर्ट पढ़ें:
हमने 2022 में Google सर्च पर स्पैम से कैसे लड़ा
शटरस्टॉक/एसीयर रोमेरो द्वारा प्रदर्शित छवि