Google’s Webspam Report Explains Role Of SpamBrain

2022 को कवर करने वाली Google की वार्षिक वेबस्पैम रिपोर्ट में उन सभी तरीकों पर प्रकाश डाला गया है जिनके स्पैमब्रेन एंटी-स्पैम सिस्टम स्पैम के कई रूपों को पकड़ने में अधिक कुशल हो गए हैं। जबकि रिपोर्ट मुख्य रूप से रिपोर्ट करने के बारे में है कि उन्होंने साल पहले की तुलना में कितना अधिक स्पैम पकड़ा, स्पैमब्रेन कैसे काम करता है इसके बारे में बिट्स उतना ही महत्वपूर्ण लग रहा था।

Google स्पैमब्रेन प्लेटफ़ॉर्म

स्पैमब्रेन वह नाम है जो Google ने अपने मशीन लर्निंग सिस्टम को दिया था जिसे Google एक ऐसा प्लेटफ़ॉर्म कहता है जिससे एल्गोरिदम लॉन्च किया जाता है जो अवांछित सामग्री के कई रूपों का पता लगाता है।

मशीन लर्निंग आर्टिफिशियल इंटेलिजेंस का एक रूप है जो डेटा का उपयोग उस कार्य को पूरा करने के लिए तेजी से कुशल बनने के लिए सीखने के लिए करता है जिसे इसे पूरा करने के लिए डिज़ाइन किया गया है।

मशीन लर्निंग प्लेटफॉर्म के अलावा स्पैमब्रेन के बारे में ज्यादा जानकारी नहीं है और यह स्पैम को रैंकिंग से दूर रखने के लिए Google की पहल के लिए “केंद्रीय” है।

Google की वेबस्पैम रिपोर्ट स्पैमब्रेन के बारे में यह नोट करती है:

“हमने स्पैमब्रेन को एक मजबूत और बहुमुखी मंच के रूप में भी सुधार किया है, विभिन्न प्रकार के दुरुपयोग के हमारे कवरेज को बेहतर बनाने के लिए कई समाधान लॉन्च किए हैं।”

स्पैमब्रेन में सुधार

वेबस्पैम रिपोर्ट में कहा गया है कि सिस्टम में सुधार के परिणामस्वरूप पिछले वर्ष की तुलना में 500% अधिक स्पैम साइटें पकड़ी गईं।

हैक की गई वेबसाइटों की पहचान करने की स्पैमब्रेन की क्षमता में अतिरिक्त प्रशिक्षण के परिणामस्वरूप दस गुना वृद्धि हुई है।

लिंक स्पैम डिटेक्शन

रिपोर्ट में कहा गया है कि विशेष लिंक स्पैम प्रशिक्षण के परिणामस्वरूप पिछले वर्ष की तुलना में लिंक स्पैम बनाने वाली पचास गुना अधिक साइटों को पकड़ा गया, जो स्पैमब्रेन की सफलता की कुंजी के रूप में सीखने की क्षमता का हवाला देते हैं।

“स्पैमब्रेन की सीखने की क्षमता के लिए धन्यवाद, हमने पिछले लिंक स्पैम अपडेट की तुलना में 50 गुना अधिक लिंक स्पैम साइटों का पता लगाया।”

इंडेक्सिंग गेटकीपर

स्पैमब्रेन के बारे में एक दिलचस्प तथ्य यह है कि क्रॉलिंग के समय यह स्पैम की पहचान कैसे करता है।

यदि किसी क्रॉल किए गए पृष्ठ को स्पैम के रूप में पाया जाता है, तो इसे तुरंत ब्लॉक कर दिया जाता है, इसे Google की खोज अनुक्रमणिका में प्रवेश करने से रोका जाता है और संसाधनों को अवांछित वेबपृष्ठों को क्रॉल करने से बचाया जाता है।

क्रॉल के समय स्पैम को ब्लॉक करना एक है क्षमता जो 2021 में घोषित की गई थीजिसने नोट किया कि अनुक्रमण न केवल स्पैम क्रॉल होने पर अवरुद्ध होता है बल्कि खोज कंसोल और साइटमैप के माध्यम से घुसपैठ करने का प्रयास करने पर भी अवरुद्ध होता है।

उन्होंने 2021 में लिखा:

“…हमारे पास ऐसे सिस्टम हैं जो स्पैम का पता लगा सकते हैं जब हम पृष्ठों या अन्य सामग्री को क्रॉल करते हैं। क्रॉलिंग तब होता है जब हमारे स्वचालित सिस्टम सामग्री पर जाते हैं और उस अनुक्रमणिका में शामिल करने के लिए विचार करते हैं जिसका उपयोग हम खोज परिणाम प्रदान करने के लिए करते हैं। स्पैम के रूप में पाई गई कुछ सामग्री को अनुक्रमणिका में नहीं जोड़ा जाता है.

ये सिस्टम साइटमैप और सर्च कंसोल के माध्यम से हमारे द्वारा खोजी गई सामग्री के लिए भी काम करते हैं।

उदाहरण के लिए, सर्च कंसोल में एक रिक्वेस्ट इंडेक्सिंग फीचर है जिससे क्रिएटर्स हमें उन नए पेजों के बारे में बता सकते हैं जिन्हें जल्दी से जोड़ा जाना चाहिए। हमने स्पैमर्स को कमजोर साइटों में हैकिंग करते देखा, इन साइटों के मालिक होने का नाटक किया, सर्च कंसोल में खुद को सत्यापित किया और Google को उनके द्वारा बनाए गए कई स्पैम पेजों को क्रॉल और इंडेक्स करने के लिए कहने के लिए टूल का उपयोग किया।

एआई का उपयोग करते हुए, हम संदिग्ध सत्यापनों को इंगित करने में सक्षम थे और स्पैम यूआरएल को इस तरह से हमारे सूचकांक में आने से रोका।

इसलिए यह कहना उचित है कि स्पैमब्रेन के कई कार्यों में से एक गेटकीपर की तरह कार्य करना है, इससे पहले कि स्पैम को Google की अनुक्रमणिका में शामिल करने का मौका मिले, उसे अवरुद्ध कर दिया जाए।

स्कैम प्रोटेक्शन अब बहुभाषी है

स्पैमब्रेन के लिए कुछ नया यह है कि स्कैम आइडेंटिफिकेशन सिस्टम अब बहुभाषी है, जो स्कैम साइटों पर क्लिक्स को पिछले वर्ष की तुलना में 50% तक कम करता है।

स्पैमी सामग्री के बारे में क्या?

इस वर्ष की रिपोर्ट लिंक स्पैम को पकड़ने, हैक की गई साइटों की पहचान करने और क्रॉल समय पर स्पैम का पता लगाने में सुधार पर केंद्रित है।

इसमें जो उल्लेख नहीं किया गया वह स्पैमयुक्त सामग्री की पहचान करने से संबंधित था।

क्या ऐसा इसलिए है क्योंकि सामग्री पक्ष को सहायक सामग्री एल्गोरिथम द्वारा नियंत्रित किया जाता है न कि स्पैमब्रेन द्वारा?

Google की वेबस्पैम रिपोर्ट पढ़ें:

हमने 2022 में Google सर्च पर स्पैम से कैसे लड़ा

शटरस्टॉक/एसीयर रोमेरो द्वारा प्रदर्शित छवि

Leave a Comment