L’informe de correu brossa web de Google explica el paper de SpamBrain


L’Informe anual de correu brossa de Google que cobreix el 2022 va destacar totes les maneres en què el seu sistema antispam SpamBrain es va fer més habilitat per capturar múltiples formes de correu brossa. Tot i que l’informe tracta principalment d’informar de quant més correu brossa van capturar en comparació amb l’any anterior, els fragments sobre com funciona SpamBrain semblaven igual d’importants.

Plataforma Google SpamBrain

SpamBrain és el nom que Google va donar al seu sistema d’aprenentatge automàtic que Google anomena una plataforma des de la qual llançar algorismes que detecten múltiples formes de contingut no desitjat.

L’aprenentatge automàtic és una forma d’intel·ligència artificial que utilitza dades per aprendre a ser cada cop més competents en la tasca per a la qual està dissenyada.

No se sap molt sobre SpamBrain, a part que és una plataforma d’aprenentatge automàtic i és “central” per a les iniciatives de Google per evitar que el correu brossa es classifiqui.

L’informe Webspam de Google assenyala això sobre SpamBrain:

“També hem millorat SpamBrain com a plataforma robusta i versàtil, llançant múltiples solucions per millorar la nostra cobertura de diferents tipus d’abús”.

Millores a SpamBrain

L’informe Webspam va assenyalar que les millores al sistema van donar com a resultat la captura d’un 500% més de llocs de correu brossa que l’any anterior.

La formació addicional va donar lloc a un augment de deu vegades en la capacitat de SpamBrain per identificar llocs web piratejats.

Enllaç detecció de correu brossa

L’informe va assenyalar que la formació especial sobre correu brossa d’enllaços va donar lloc a la captura de cinquanta vegades més llocs que creaven correu brossa d’enllaços en comparació amb l’any anterior, citant la capacitat d’aprenentatge de SpamBrain com a clau del seu èxit.

“Gràcies a la capacitat d’aprenentatge de SpamBrain, vam detectar 50 vegades més llocs de correu brossa d’enllaços en comparació amb l’actualització anterior de correu brossa d’enllaços”.

Gatekeeper d’indexació

Un fet interessant sobre SpamBrain és com identifica el correu brossa en el moment del rastreig.

Si es detecta que una pàgina rastrejada és correu brossa, es bloqueja immediatament, evitant que entri a l’índex de cerca de Google i estalviant recursos que es malgasten rastrejant pàgines web no desitjades.

Bloquejar el correu brossa en el moment del rastreig és a capacitat que es va anunciar el 2021que va assenyalar que la indexació no només es bloqueja quan es rastreja el correu brossa, sinó també quan intenta colar-se a través de la consola de cerca i els mapes del lloc.

Van escriure el 2021:

“… tenim sistemes que poden detectar correu brossa quan rastregem pàgines o altres continguts. El rastreig és quan els nostres sistemes automàtics visiten contingut i el consideren per incloure’l a l’índex que fem servir per proporcionar resultats de cerca. Alguns continguts detectats com a correu brossa no s’afegeixen a l’índex.

Aquests sistemes també funcionen per al contingut que descobrim mitjançant mapes del lloc i Search Console.

Per exemple, Search Console té una funció d’indexació de sol·licituds perquè els creadors ens puguin informar sobre pàgines noves que s’han d’afegir ràpidament. Hem observat que els spammers piratejaven llocs vulnerables, pretenien ser els propietaris d’aquests llocs, es verificaven a si mateixos a la Search Console i utilitzaven l’eina per demanar a Google que rastregés i indexés les moltes pàgines de correu brossa que van crear.

Mitjançant l’IA, vam poder identificar verificacions sospitoses i vam evitar que els URL de correu brossa entrissin al nostre índex d’aquesta manera”.

Per tant, és just dir que una de les moltes funcions de SpamBrain és actuar com un porter, bloquejant el correu brossa abans que tingui l’oportunitat de passar a l’índex de Google.

La protecció contra estafa ara és multilingüe

Una cosa nova per a SpamBrain és que el sistema d’identificació d’estafes ara és multilingüe, reduint els clics als llocs d’estafa en un 50% en comparació amb l’any anterior.

Què passa amb el contingut brossa?

L’informe d’enguany es va centrar en la captura de correu brossa d’enllaços, la identificació de llocs piratejats i les millores en la detecció de correu brossa en el moment del rastreig.

El que no esmentava tenia res a veure amb la identificació de contingut brossa.

Això és perquè el contingut el gestiona l’algoritme de contingut útil i no SpamBrain?

Llegiu l’informe de correu brossa web de Google:

Com vam lluitar contra el correu brossa a la Cerca de Google el 2022

Imatge destacada de Shutterstock/Asier Romero





Source link

L’informe de correu brossa web de Google explica el paper de SpamBrain