Googlebot rastreja i indexa el primer contingut HTML de 15 MB


En una actualització del document d’ajuda de Googlebot, Google va anunciar en silenci que rastrejarà els primers 15 MB d’una pàgina web. Qualsevol cosa després d’aquest tall no s’inclourà en els càlculs de la classificació.

Google especifica al document d’ajuda:

“Qualsevol recurs a què es fa referència a l’HTML, com ara imatges, vídeos, CSS i JavaScript, s’obtenen per separat. Després dels primers 15 MB del fitxer, Googlebot deixa de rastrejar i només considera els primers 15 MB del fitxer per a la indexació. El límit de mida del fitxer s’aplica a les dades no comprimides.”

Això va deixar alguns de la comunitat de SEO es pregunten si això volgués dir que Googlebot ignoraria completament el text que caigués per sota de les imatges al tall dels fitxers HTML.

“És específic del fitxer HTML en si, tal com està escrit”, va aclarir John Mueller, Advocate de la cerca de Google, a través de Twitter. “Els recursos/contingut incrustats amb etiquetes IMG no formen part del fitxer HTML”.

Què significa això per al SEO

Per assegurar-se que Googlebot el pondera, ara s’ha d’incloure contingut important a la part superior de les pàgines web. Això significa que el codi s’ha d’estructurar de manera que posi la informació rellevant per al SEO amb els primers 15 MB en un fitxer HTML o basat en text compatible.

També significa que les imatges i els vídeos s’han de comprimir i no s’han de codificar directament a l’HTML, sempre que sigui possible.

Les millors pràctiques de SEO actualment recomanen mantenir les pàgines HTML fins a 100 KB o menys, molts llocs no es veuran afectats per aquest canvi. La mida de la pàgina es pot comprovar amb diverses eines, com ara Google Page Speed ​​Insights.

En teoria, pot semblar preocupant que puguis tenir contingut en una pàgina que no s’acostuma a indexar. A la pràctica, però, 15 MB és una quantitat considerablement gran d’HTML.

Tal com afirma Google, els recursos com ara imatges i vídeos s’obtenen per separat. Segons la redacció de Google, sembla que aquest tall de 15 MB només s’aplica a HTML.

Seria difícil superar aquest límit amb HTML tret que publiqueu el text de llibres sencers en una sola pàgina.

Si teniu pàgines que superen els 15 MB d’HTML, és probable que tingueu problemes subjacents que s’hagin de solucionar de totes maneres.


Font: Central de cerca de Google
Imatge destacada: SNEHIT PHOTO/Shutterstock





Source link

Googlebot rastreja i indexa el primer contingut HTML de 15 MB