Quant de temps abans que Google indexi la meva pàgina nova (i per què depèn)


No pots esperar que el teu nou contingut s’indexi?

Descobriu per què és tan difícil d’estimar quant de temps pot trigar la indexació i què pots fer per accelerar les coses.

La indexació és el procés de descarregar informació del vostre lloc web, classificar-la i emmagatzemar-la en una base de dades. Aquesta base de dades, l’índex de Google, és la font de tota la informació que podeu trobar mitjançant la Cerca de Google.

Les pàgines que no s’inclouen a l’índex no poden aparèixer als resultats de la cerca, per molt que coincideixin amb una consulta determinada.

Suposem que recentment heu afegit una pàgina nova al vostre bloc. A la vostra nova publicació, parleu d’un tema tendència, amb l’esperança que us proporcioni molt trànsit nou.

Però abans de veure com va la pàgina a la Cerca de Google, cal esperar que s’indexi.

Aleshores, quant de temps dura exactament aquest procés? I quan hauríeu de començar a preocupar-vos que la manca d’indexació pugui indicar problemes tècnics al vostre lloc?

Investiguem!

Quant de temps triga la indexació? Les millors suposicions dels experts

L’índex de Google conté centenars de milers de milions de pàgines web i ocupa més de 100 milions de gigabytes de memòria.

A més, Google no limita quantes pàgines d’un lloc web es poden indexar. Tot i que algunes pàgines poden tenir prioritat a la cua d’indexació, les pàgines generalment no han de competir per a la indexació.

Encara hi hauria d’haver lloc per a una petita pàgina més en aquesta base de dades colossal, oi? No us heu de preocupar per l’entrada del vostre bloc? Malauradament, potser haureu de fer-ho.

Google ho admet no totes les pàgines processades pels seus rastrejadors s’indexaran.

El gener de 2021, l’advocat de la cerca de Google, John Mueller, va elaborar el tema i va revelar que és bastant normal que Google no indexi totes les pàgines d’un lloc web gran.

Va explicar que el repte de Google és intentar equilibrar voler indexar el màxim de contingut possible amb estimar si serà útil per als usuaris dels cercadors.

Per tant, en molts casos, no indexar un determinat contingut és l’opció estratègica de Google.

Google no vol que el seu índex inclogui pàgines de contingut duplicat i de baixa qualitat, o pàgines que és poc probable que els usuaris cerquin. La millor manera de mantenir el correu brossa fora dels resultats de la cerca és no indexar-lo.

Però mentre mantingueu les publicacions del vostre bloc valuoses i útils, encara s’estan indexant, oi?

La resposta és complicada.

Tomek Rudzki, expert en indexació de Onely, una empresa per a la qual treballo, va calcular que, de mitjana, 16% de pàgines valuoses i indexables en llocs web populars mai no s’indexen.

Hi ha una garantia que la vostra pàgina s’indexarà?

Com potser ja heu endevinat pel títol d’aquest article, no hi ha una resposta definitiva a aquesta pregunta d’indexació.

No us podreu establir un recordatori de calendari el dia que s’ha d’indexar la publicació del vostre bloc.

Però moltes persones s’han fet la mateixa pregunta abans, demanant als Googlers i als professionals de SEO experimentats que proporcionin alguns consells.

diu John Mueller pot trigar des de diverses hores fins a diverses setmanes per indexar una pàgina. Sospita que la majoria del contingut bo es recull i s’indexa en una setmana aproximadament.

La investigació realitzada per Rudzki va demostrar que, de mitjana, 83% de pàgines s’indexen durant la primera setmana de publicació.

Algunes pàgines han d’esperar fins a vuit setmanes per indexar-se. Per descomptat, això només s’aplica a les pàgines que eventualment s’indexen.

Rastrejar la demanda i rastrejar el pressupost

Perquè una pàgina nova del vostre bloc es descobreixi i indexi, Googlebot ha de tornar a rastrejar el bloc.

La freqüència amb què Googlebot torna a rastrejar el vostre lloc web sens dubte afecta la rapidesa amb què s’indexarà la vostra pàgina nova, i això depèn de la naturalesa del contingut i de la freqüència amb què s’actualitza.

Els llocs web de notícies que publiquen contingut nou sovint s’han de tornar a rastrejar amb freqüència. Podem dir que són llocs amb una gran demanda de rastreig.

Un exemple d’un lloc de baixa demanda de rastreig seria un lloc sobre la història de la ferreria, ja que és poc probable que el seu contingut s’actualitzi amb molta freqüència.

Google determina automàticament si el lloc té una demanda de rastreig baixa o alta. Durant el rastreig inicial, comprova de què tracta el lloc web i quan es va actualitzar per última vegada.

La decisió de rastrejar el lloc més o menys sovint no té res a veure amb la qualitat del contingut: el factor decisiu és la freqüència estimada de les actualitzacions.

El segon factor important és el velocitat de rastreig. És el nombre de sol·licituds que Googlebot pot fer sense aclaparar el vostre servidor.

Si allotgeu el vostre bloc en un servidor de poca amplada de banda i Googlebot nota que el servidor s’està alentint, ajustarà i reduirà la velocitat de rastreig.

D’altra banda, si el lloc respon ràpidament, el límit augmenta i Googlebot pot rastrejar més URL.

Què ha de passar abans que la vostra pàgina sigui indexada?

Com que la indexació requereix temps, també es pot preguntar: com es dedica exactament aquest temps?

Com es classifica i inclou la informació del vostre lloc web a l’índex de Google?

Parlem dels esdeveniments que han de passar abans de la indexació.

Descobriment de continguts

Tornem a l’exemple en què vau publicar una nova entrada al bloc. Googlebot ha de descobrir l’URL d’aquesta pàgina en el primer pas del canal d’indexació.

Pot passar per:

  • Seguint enllaços interns has proporcionat a altres pàgines del teu bloc.
  • Seguint enllaços externs creat per persones que han trobat útil el teu nou contingut.
  • Passant per un mapa del lloc XML que heu penjat a Google Search Console.

El fet que s’hagi descobert la pàgina significa que Google coneix la seva existència i URL.

Arrossegant

El rastreig és el procés de visitar l’URL i obtenir el contingut de la pàgina.

Durant el rastreig, Googlebot recopila informació sobre el tema principal d’una pàgina determinada, quins fitxers conté aquesta pàgina, quines paraules clau hi apareixen, etc.

Després de trobar enllaços a una pàgina, el rastrejador els segueix fins a la pàgina següent i el cicle continua.

És important recordar que Googlebot segueix les regles establertes per robots.txt perquè no rastregi pàgines bloquejades per les directives que proporcioneu en aquest fitxer.

Renderització

representació en GSCCaptura de pantalla de Google Search Console, setembre de 2022

La representació s’ha de fer perquè Googlebot entengui tant el contingut de JavaScript com els fitxers d’imatges, àudio i vídeo.

Aquest tipus de fitxers sempre van ser una lluita més gran per a Google que HTML.

El defensor dels desenvolupadors de Google, Martin Splitt, comparar el renderitzat amb la cuina d’un plat.

En aquesta metàfora, el fitxer HTML inicial d’un lloc web amb enllaços a altres continguts és una recepta. Pots prémer F12 al teu teclat per veure’l al teu navegador.

Tots els recursos del lloc web, com ara CSS, fitxers JavaScript, imatges i vídeos, són els ingredients necessaris per donar al lloc web el seu aspecte final.

Quan el lloc web assoleix aquest estat, esteu tractant amb l’HTML renderitzat, més sovint anomenat Document Object Model.

Martin també va dir que l’execució de JavaScript és la primera etapa de representació perquè JavaScript funciona com una recepta dins d’una recepta.

En un passat no gaire llunyà, Googlebot solia indexar la versió HTML inicial d’una pàgina i deixar la representació de JavaScript per tard a causa del cost i la naturalesa del procés que consumia molt de temps.

La indústria del SEO es va referir a aquest fenomen com “les dues onades d’indexació”.

Tanmateix, ara sembla que les dues onades ja no són necessàries.

Mueller i Splitt van admetre que, avui en dia, gairebé tots els llocs web nous passen per l’etapa de renderització de manera predeterminada.

Un dels objectius de Google és apropar-se al rastreig, la representació i la indexació.

Podeu indexar la vostra pàgina més ràpidament?

No podeu forçar Google a indexar la vostra pàgina nova.

La rapidesa amb què passa això també està fora del teu control. Tanmateix, podeu optimitzar les vostres pàgines perquè la descoberta i el rastreig funcionin de la manera més fluida possible.

Aquí teniu el que heu de fer:

Assegureu-vos que la vostra pàgina sigui indexable

Hi ha dues regles importants a seguir per mantenir les pàgines indexables:

  • Hauríeu d’evitar bloquejar-los mitjançant robots.txt o la directiva noindex.
  • Heu de marcar la versió canònica d’una peça de contingut determinada amb una etiqueta canònica.

Robots.txt és un fitxer que conté instruccions per als robots que visiten el vostre lloc.

Podeu utilitzar-lo per especificar quins rastrejadors no poden visitar determinades pàgines o carpetes. Tot el que heu de fer és utilitzar la directiva disallow.

Per exemple, si no voleu que els robots visitin pàgines i fitxers a la carpeta anomenada “exemple”, el vostre fitxer robots.txt hauria de contenir les directives següents:

User-agent: *

Disallow: /example/

De vegades, és possible impedir que Googlebot indexi pàgines valuoses per error.

Si us preocupa que la vostra pàgina no estigui indexada per problemes tècnics, hauríeu de fer una ullada al vostre robots.txt.

Googlebot és educat i no passarà cap pàgina a la canalització d’indexació. Una manera d’expressar aquesta ordre és posar una directiva noindex a:

Assegureu-vos que aquesta directiva no aparegui a les pàgines que s’han d’indexar.

Com hem comentat, Google vol evitar la indexació de contingut duplicat. Si troba dues pàgines que semblen còpies l’una de l’altra, probablement només n’indexarà una.

L’etiqueta canònica es va crear per evitar malentesos i dirigir immediatament Googlebot a l’URL que el propietari del lloc web considera la versió original de la pàgina.

Recordeu que el codi font d’una pàgina que voleu que estigui present a l’índex de Google no hauria d’apuntar a una altra pàgina com a canònica.

Envieu un mapa del lloc

Un mapa del lloc enumera tots els URL del vostre lloc web que voleu indexar (fins a 50.000).

Podeu enviar-lo a Google Search Console per ajudar Google a descobrir el mapa del lloc més ràpidament.

Amb un mapa del lloc, faciliteu que Googlebot descobreixi les vostres pàgines i augmenteu les possibilitats que rastregi aquelles que no ha trobat mentre seguiu els enllaços interns.

És una bona pràctica fer referència al mapa del lloc al fitxer robots.txt.

Demaneu a Google que torni a rastrejar les vostres pàgines

Inspeccioneu l'eina GSCCaptura de pantalla de Google Search Console, setembre de 2022

Podeu sol·licitar un rastreig d’URL individuals mitjançant el Eina d’inspecció d’URL disponible a Google Search Console.

Encara no garantirà la indexació i necessitareu una mica de paciència, però és una altra manera d’assegurar-vos que Google sàpiga que existeix la vostra pàgina.

Si és pertinent, utilitzeu l’API d’indexació de Google

L’API d’indexació és una eina que us permet notificar a Google sobre les pàgines recentment afegides.

Gràcies a aquesta eina, Google pot programar la indexació de contingut sensible al temps de manera més eficient.

Malauradament, no la podeu utilitzar per a les publicacions del vostre bloc perquè, actualment, aquesta eina només està pensada per a pàgines amb ofertes de feina i vídeos en directe.

Tot i que alguns professionals del SEO utilitzen l’API d’indexació per a altres tipus de pàgines, i pot funcionar a curt termini, és dubtós que segueixi sent una solució viable a llarg termini.

Eviteu la sobrecàrrega del servidor al vostre lloc

Finalment, recordeu que heu de garantir una bona amplada de banda del vostre servidor perquè Googlebot no redueixi la taxa de rastreig del vostre lloc web.

Eviteu utilitzar proveïdors d’allotjament compartit i recordeu fer proves d’estrès regularment al vostre servidor per assegurar-vos que pot gestionar la feina.

Resum

És impossible predir amb precisió quant de temps trigarà a indexar la vostra pàgina (o si passarà mai) perquè Google no indexa tot el contingut que processa.

Normalment, la indexació es produeix hores o setmanes després de la publicació.

El coll d’ampolla més gran per indexar-se s’està rastrejant ràpidament.

Si el vostre contingut compleix els llindars de qualitat i no n’hi ha obstacles tècnics Per a la indexació, primer hauríeu de mirar com Googlebot rastreja el vostre lloc per obtenir contingut nou indexat ràpidament.

Abans de redirigir una pàgina a la canalització d’indexació, Googlebot la rastreja i, en molts casos, representa imatges incrustades, vídeos i elements JavaScript.

Els llocs web que canvien més sovint i, per tant, tenen una demanda de rastreig més alta es tornen a rastrejar amb més freqüència.

Quan Googlebot visiti el vostre lloc web, coincidirà amb la taxa de rastreig en funció del nombre de consultes que pot enviar al vostre servidor sense sobrecarregar-lo.

Per tant, val la pena tenir cura d’un bon ample de banda del servidor.

No bloquegeu Googlebot a robots.txt perquè no rastrejarà les vostres pàgines.

Recordeu que Google també respecta la metaetiqueta noindex robots i, en general, només indexa la versió canònica de l’URL.

Més recursos:


Imatge destacada: Kristo-Gothard Hunor/Shutterstock





Source link

Quant de temps abans que Google indexi la meva pàgina nova (i per què depèn)