Un editor del popular lloc de notícies The Verge va tuitejar que un nou article va ser substituït a la primera pàgina dels resultats de la cerca de Google per altres llocs que l’havien copiat. Danny Sullivan respon per què passa això.
Contingut copiat que classifica els editors frustrats
El contingut copiat que supera l’original és una cosa que els editors han expressat frustració durant molts anys.
Algunes de les queixes es deuen a un malentès.
Per exemple, quan una persona cerca una frase sense sentit com ara paraules seleccionades aleatòriament d’un article, Google no sap què fer amb aquesta no és una consulta de cerca real i no hi ha resposta per a una frase sense sentit.
Per tant, el que fa Google és predeterminar una cerca de text, el que significa que Google està retornant resultats de la cerca basats en les paraules d’una consulta de cerca que coincideixen amb les paraules d’una pàgina web.
La veritable prova de si el contingut copiat supera el contingut original és quan el contingut copiat supera el contingut original per a les paraules clau competitives que realment fan els usuaris.
Una pàgina hauria de classificar-se dues vegades si es troba en un resultat de les històries principals?
Però aquesta situació que va sorgir introdueix un escenari diferent. El que va passar és que Google no classificarà un títol d’article a la part superior dels resultats de cerca normals si aquesta pàgina web ja està classificada als resultats destacats de les històries principals, a la part superior de la pàgina web.
Top Stories és un resultat destacat on Google mostra articles de notícies relacionats amb una consulta de cerca.
Per tant, si algú cerca un títol, Google normalment mostrarà l’article a la part superior dels resultats de la cerca en una secció Notícies destacades.
Però en aquest cas no mostra l’article original a la part superior dels resultats de cerca normals a causa del que Google anomena deduplicació, un algorisme que impedeix que la mateixa pàgina es classifiqui dues vegades.
Per tant, la pregunta és si Google hauria de classificar la mateixa pàgina dues vegades, una vegada a les històries principals i una altra a la part superior dels resultats de cerca normals?
Tota la primera pàgina consta de contingut robat
Algú de The Verge va tuitejar que, a part de la secció de notícies destacades de Google a la part superior dels resultats de la cerca, la cerca d’un titular d’un article nou va fer que Google mostrés un top ten complet que consisteix en res més que contingut robat.
La persona va tuitejar:
“Ok Google, acabo de buscar un titular que es va publicar al meu lloc web i TOTA LA PRIMERA PÀGINA després de la caixa de notícies era de llocs web que ens robaven el contingut. The Verge no va aparèixer fins a la pàgina 2.
Aquest problema empitjora”.
Hola Google, acabo de buscar un titular que es va publicar al meu lloc web i TOTA LA PRIMERA PÀGINA després de la caixa de notícies era de llocs web que ens robaven el contingut. The Verge no va aparèixer fins a la pàgina 2.
Aquest problema empitjora. pic.twitter.com/Ox2AMYOt2Q
— Dieter Bohn (@backlon) 18 de gener de 2022
Danny Sullivan de Google va reconèixer que els escriptors que cerquen amb un títol esperen que els seus articles es classifiquen a la part superior dels resultats de la cerca, no a la pàgina dos.
Però també va assenyalar que la cerca per títol no és necessàriament com cercarien els cercadors habituals.
La resposta de Danny és discutible. Es podria argumentar raonablement que moltes persones cerquen el títol d’un article quan volen trobar-lo per compartir-lo amb un amic o a les xarxes socials. Per tant, hi ha una raó real per la qual persones diferents de l’autor d’un article poden cercar el títol d’un article.
Danny Sullivan de Google va tuitejar:
“Donarem un cop d’ull. Sé que la cerca per títol és habitual per als escriptors i sí, m’esperaria que això es mostrés primer per això. Però no reflecteix com la majoria de la gent podria cercar aquest contingut (i com podria cercar, el trobo). Però de nou, mirarem de millorar”.
Danny va continuar amb una explicació de per què un article original es classifica a la pàgina dos per al seu propi titular:
Aquí teniu un seguiment del que està passant i del que estem mirant. Ho esmenteu, però a la captura de pantalla no queda clar que el vostre article sigui el primer a la pàgina (com es mostra). Com que es mostra a Top Stories, s’està desduplicant de la resta de la pàgina… pic.twitter.com/YWCtcPAthZ
— Danny Sullivan (@dannysullivan) 18 de gener de 2022
La deduplicació sovint pot ser útil. Si feu aquesta cerca de la manera que ho faria l’usuari, utilitzant termes de cerca de solucions en lloc de termes inusuals al titular, us trobeu a la part superior de les històries més destacades i la desduplicació significa que hi ha més varietat d’altres publicacions… pic.twitter.com/638IAZLWIV
— Danny Sullivan (@dannysullivan) 18 de gener de 2022
En cerques com aquesta, els nostres sistemes també buscaran mostrar la informació més útil i fiable possible. És per això que no veieu molts duplicats del vostre article que es mostren. Sens dubte, existeixen duplicats, però no és tan útil mostrar-los…
— Danny Sullivan (@dannysullivan) 18 de gener de 2022
Consultes de cerca que desencadenen resultats de cerca alternatius
El següent tuit de Danny Sullivan explica com una consulta de cerca amb molts termes, com un terme de titular, fa que l’algoritme de Google abandoni i comenci a tornar resultats de cerca que s’assemblen més a cerques de paraules clau d’estil antic, on els resultats de la cerca no es basen en intenció de cerca o enllaços, però només en funció de les paraules clau.
Això és el que va tuitejar Danny:
Això condueix a cerques orientades als títols. Com he dit abans, això és molt comú entre els autors. Ho feia tot el temps, jo mateix. Però les cerques de títols solen incloure molts termes, de manera que els nostres sistemes canvien per mostrar pàgines que tenen aquests termes…
— Danny Sullivan (@dannysullivan) 18 de gener de 2022
Com he esmentat anteriorment, hi ha una intenció de cerca darrere de la recerca de titulars. Pot ser que Google no hagi reconegut les “cerques orientades a títols” com una intenció de cerca que l’algoritme hauria de tenir en compte.
Danny va continuar la seva resposta:
Això significa que és més probable que els autors trobin duplicats, tot i que per a les cerques típiques que farien els lectors, és poc probable que apareguin. Però la nostra funció de deduplicació encara pot funcionar fins i tot per a aquests, com passava en aquest cas…
— Danny Sullivan (@dannysullivan) 18 de gener de 2022
Com he dit, la desduplicació pot ser útil. Però també entenem la preocupació que això pot generar. Hem estat fent això amb Top Stories des del maig passat, però ho tornarem a revisar per veure si hem de continuar o potser fer altres canvis.
— Danny Sullivan (@dannysullivan) 18 de gener de 2022
A més, encara estic comprovant, però crec que aquesta desduplicació és especialment única, ja que només passa amb les històries principals si es mostra una única història o potser només per a la primera història que es mostra.
— Danny Sullivan (@dannysullivan) 18 de gener de 2022
Només per acabar amb l’aclariment addicional que vaig prometre, desdupliquem un enllaç dels resultats web si apareix un enllaç com a primer enllaç a Històries principals i si el quadre Històries principals apareix abans dels resultats web. Si ve després, nosaltres no. I de nou, és una cosa que estem revisant.
— Danny Sullivan (@dannysullivan) 19 de gener de 2022
Notícies i deduplicació
La deduplicació és quan Google intenta evitar que un article es classifiqui dues vegades als resultats de la cerca. Danny Sullivan va afirmar que la raó per la qual un article podria no aparèixer als resultats de la cerca habituals és si ja es classifica a les històries principals i si aquestes històries principals es classifiquen a la part superior de la pàgina.
Per tant, la pregunta és: és una situació en què una pàgina web hauria de classificar-se dues vegades, perquè un usuari podria voler veure l’article original a la part superior dels resultats de la cerca, encara que ja sigui a la secció Notícies principals?
Un cop desaparegui la secció Notícies principals, l’article de notícies hauria de situar-se a la part superior dels resultats de la cerca.
El contingut és el millor classificat després que les històries principals hagin desaparegut
I això, com es pot veure a la captura de pantalla anterior, és el que està passant ara mateix.
Aquesta és una pregunta interessant on Google ha de decidir què és just per a l’editor i què és útil per al cercador.