Correcció de l’informe de cobertura “Pàgines excloses” de Google Search Console


Google Search Console us permet mirar el vostre lloc web amb els ulls de Google.

Obteniu informació sobre el rendiment del vostre lloc web i detalls sobre l’experiència de la pàgina, els problemes de seguretat, el rastreig o la indexació.

La part Exclosa de l’informe de cobertura de l’índex de Google Search Console proporciona informació sobre l’estat d’indexació de les pàgines del vostre lloc web.

Descobriu per què algunes de les pàgines del vostre lloc web arriben a l’informe Exclosos de Google Search Console i com solucionar-ho.

Què és l’informe de cobertura de l’índex?

El Informe de cobertura de Google Search Console mostra informació detallada sobre l’estat de l’índex de les pàgines web del vostre lloc web.

Les vostres pàgines web poden entrar en un dels quatre compartiments següents:

  • Error: les pàgines que Google no pot indexar. Heu de revisar aquest informe perquè Google creu que potser voldreu indexar aquestes pàgines.
  • Vàlid amb advertències: les pàgines que Google indexa, però hi ha alguns problemes que hauríeu de resoldre.
  • Vàlid: Les pàgines que Google indexa.
  • Exclòs: les pàgines que estan excloses de l’índex.

Informe de cobertura de Google Search Console

Què són les pàgines excloses?

Google no indexa les pàgines als contenidors d’errors i exclosos.

La principal diferència entre els dos és:

  • Google creu que les pàgines d’Error s’han d’indexar, però no pot a causa d’un error que hauríeu de revisar. Per exemple, les pàgines no indexables enviades mitjançant un mapa del lloc XML es troben sota Error.
  • Google creu que les pàgines del cub Exclòs s’han d’excloure, i aquesta és la vostra intenció. Per exemple, les pàgines no indexables no enviades a Google apareixeran a l’informe Exclosos.
    Pàgines excloses a GSCCaptura de pantalla de Google Search Console, maig de 2022

Tanmateix, Google no sempre ho fa bé i les pàgines que s’han d’indexar de vegades van a Exclòs.

Afortunadament, Google Search Console proporciona el motiu per col·locar pàgines en un cub específic.

Per això, és una bona pràctica revisar acuradament les pàgines dels quatre contenidors.

Anem a submergir-nos ara a la galleda Exclosa.

Possibles raons per a les pàgines excloses

Hi ha 15 possibles motius pels quals les vostres pàgines web estan al grup Exclosos. Fem una ullada més de prop a cadascun.

Exclòs per l’etiqueta “noindex”.

Aquests són els URL que tenen una etiqueta “noindex”.

Google creu que realment voleu excloure aquestes pàgines de la indexació perquè no les enumereu a la llista Mapa del lloc XML.

Aquestes poden ser, per exemple, pàgines d’inici de sessió, pàgines d’usuari o pàgines de resultats de cerca.

Google Search Console Exclòs per una etiqueta noindex

Accions suggerides:

  • Reviseu aquests URL per estar segur que tu voleu excloure’ls de l’índex de Google.
  • Comproveu si l’etiqueta “noindex” encara està present/actualment en aquests URL.

Rastrejat: actualment no s’ha indexat

Google ha rastrejat aquestes pàgines i encara no les ha indexat.

Com diu Google al seu documentació, l’URL d’aquest compartiment “pot ser indexat o no en el futur; no cal tornar a enviar aquest URL per rastrejar.”

Molts professionals del SEO es van adonar que un lloc podria tenir problemes greus de qualitat si moltes pàgines normals i indexables passen a rastrejades, actualment no indexades.

Això podria significar que Google ha rastrejat aquestes pàgines i no creu que proporcionen prou valor per indexar-les.

Google Search Console s'ha rastrejat actualment no s'ha indexatCaptura de pantalla de Google Search Console, maig de 2022

Accions suggerides:

  • Reviseu el vostre lloc web en termes de qualitat i MENJAR.

Descobert: actualment no indexat

Com diu la documentació de Google, la pàgina sota Discovered, que actualment no està indexada, “la va trobar Google, però encara no l’ha rastrejat”.

Google no va rastrejar la pàgina per no sobrecarregar el servidor. Un gran nombre de pàgines sota aquest grup pot significar que el vostre lloc en té pressupost de rastreig qüestions.

Google Search Console s'ha descobert actualment no s'ha indexatCaptura de pantalla de Google Search Console, maig de 2022

Accions suggerides:

  • Comproveu l’estat del vostre servidor.

No trobat (404)

Aquestes són les pàgines que han retornat el codi d’estat 404 (no trobat) quan Google ho ha sol·licitat.

Aquests no són URL enviats a Google (és a dir, en un Mapa del lloc XML), però en canvi, Google va descobrir aquestes pàgines (és a dir, a través d’un altre lloc web que enllaçava a una pàgina antiga esborrada fa molt de temps.

Pàgines excloses a GSC - 404Captura de pantalla de Google Search Console, maig de 2022

Accions suggerides:

  • Revisa aquestes pàgines i decidir si implementa una redirecció 301 a una pàgina de treball.

suau 404

suau 404en la majoria dels casos, és una pàgina d’error que retorna el codi d’estat OK (200).

Alternativament, també pot ser una pàgina fina que conté poc o cap contingut i utilitza paraules com “ho sentim”, “error”, “no trobat”, etc.

Soft 404 a Google Search ConsoleCaptura de pantalla de Google Search Console, maig de 2022

Accions suggerides:

  • En el cas d’una pàgina d’error, assegureu-vos de tornar el codi d’estat 404.
  • Per a pàgines de contingut prim, afegir contingut únic per ajudar Google a reconèixer aquest URL com a pàgina autònoma.

Pàgina amb redirecció

Totes les pàgines redirigides del vostre lloc web aniran a la secció Exclosa, on podreu veure totes les pàgines redirigits que Google ha detectat al vostre lloc web.

Pàgina amb redirecció a Google Search ConsoleCaptura de pantalla de Google Search Console, maig de 2022

Accions suggerides:

  • Reviseu les pàgines redireccionades per assegurar-se que les redireccions s’han implementat intencionadament.
  • Alguns connectors de WordPress creen automàticament redireccions quan canvieu l’URL, és possible que vulgueu revisar-los de tant en tant.

Duplicar sense Canonical seleccionat per l’usuari

Google creu que aquests URL són duplicats d’altres URL del vostre lloc web i, per tant, no s’han d’indexar.

No heu establert cap etiqueta canònica per a aquests URL i Google ha seleccionat la canònica en funció d’altres senyals.

Accions suggerides:

  • Inspeccioneu aquests URL per comprovar quins URL canònics Google ha seleccionat per a aquestes pàgines.

Duplicat, Google va triar una altra canònica que l’usuari

Pàgina exclosa a GSCCaptura de pantalla de Google Search Console, maig de 2022

En aquest cas, vau declarar a URL canònic per a la pàgina, però tot i així, Google va seleccionar un URL diferent com a canònic. Com a resultat, la canònica seleccionada per Google s’indexa i la seleccionada per l’usuari no.

Possibles accions:

  • Inspeccioneu l’URL per comprovar què és canònic Google seleccionat.
  • Analitzeu els possibles senyals que van fer triar Google un canònic diferent (és a dir, enllaços externs).

URL enviat duplicat no seleccionat com a canònic

La diferència entre l’estat anterior i aquest estat és que, en el cas d’aquest últim, heu enviat un URL a Google per a la indexació sense declarar la seva adreça canònica, i Google creu que un URL diferent seria millor canònic.

Com a resultat, la canònica seleccionada per Google s’indexa en lloc de l’URL enviat.

Accions suggerides:

  • Inspeccioneu l’URL per comprovar què és canònic Google ha seleccionat.

Pàgina alternativa amb l’etiqueta canònica adequada

Aquests són simplement els duplicats de les pàgines que Google reconeix com a URL canònics.

Aquestes pàgines tenen les adreces canòniques que apunten a l’URL canònic correcte.

Accions suggerides:

  • En la majoria dels casos, no es requereix cap acció.

Bloquejat per Robots.txt

Aquestes són les pàgines que robots.txt han bloquejat.

Quan analitzeu aquest grup, tingueu en compte que Google encara pot indexar aquestes pàgines (i mostrar-les de manera “perfecta”) si Google hi troba una referència a, per exemple, altres llocs web.

Accions suggerides:

  • Comproveu si aquestes pàgines estan bloquejades utilitzant el verificador de robots.txt.
  • Afegiu una etiqueta “noindex” i elimineu les pàgines de robots.txt si voleu eliminar-los de l’índex.

Eina d’eliminació de pàgines bloquejada

Aquest informe enumera les pàgines l’eliminació de les quals ha sol·licitat Eina d’eliminació.

Tingueu en compte que aquesta eina elimina les pàgines dels resultats de la cerca només temporalment (90 dies) i no les elimina de l’índex.

Accions suggerides:

  • Comproveu si les pàgines s’han enviat mitjançant l’eina Eliminacions s’hauria d’eliminar temporalment o tenir una etiqueta ‘noindex’.

Bloquejat a causa d’una sol·licitud no autoritzada (401)

En el cas d’aquests URL, Googlebot no ha pogut accedir a les pàgines a causa d’una sol·licitud d’autorització (codi d’estat 401).

A menys que aquestes pàgines estiguin disponibles sense autorització, no cal que feu res.

Google simplement us informa del que s’ha trobat.

Pàgina 401 a GoogleCaptura de pantalla de Google Search Console, maig de 2022

Accions suggerides:

  • Verifiqueu si aquestes pàgines haurien de requerir autorització.

Bloquejat a causa d’accés prohibit (403)

Això codi d’estat sol ser el resultat d’algun error del servidor.

Es retorna 403 quan les credencials proporcionades no són correctes i no s’ha pogut concedir l’accés a la pàgina.

Com Documentació de Google afirma:

“Googlebot mai proporciona credencials, de manera que el vostre servidor està retornant aquest error de manera incorrecta. Aquest error s’hauria de corregir o la pàgina hauria de ser bloquejada per robots.txt o noindex.”

Què pots aprendre de les pàgines excloses?

Els pics sobtats i enormes en un grup específic de pàgines excloses poden indicar problemes greus del lloc.

Aquí teniu tres exemples de pics que poden indicar problemes greus amb el vostre lloc web:

  • Un augment enorme a les pàgines No s’ha trobat (404) pot indicar que no ha tingut èxit migració on s’han canviat els URL, però no s’han implementat redireccions a adreces noves. Això també pot passar després que, per exemple, una persona sense experiència hagi canviat l’aspecte de les publicacions del bloc i, com a resultat, hagi canviat els URL de tots els blocs.
  • Un gran pic al Descobert, actualment no indexat o Arrossegat – actualment no indexat pot indicar que el vostre lloc ha estat piratejat. Assegureu-vos de revisar les pàgines d’exemple per comprovar si aquestes són realment les vostres pàgines o si s’han creat com a resultat d’un pirateig (és a dir, pàgines amb caràcters xinesos).
  • Un augment enorme a l’etiqueta Exclused by ‘noindex’ també pot indicar un llançament i una migració infructuosos. Això passa sovint quan un lloc nou entra en producció juntament amb les etiquetes “noindex” del lloc de prova.

El Recapte

Podeu aprendre molt sobre el vostre lloc web i com interactua Googlebot amb ell, gràcies a la secció Exclosos de l’informe de cobertura de GSC.

Tant si ets un nou SEO o ja tens uns quants anys d’experiència, fes el teu hàbit diari consultar Google Search Console.

Això us pot ajudar a detectar diversos problemes tècnics de SEO abans que es converteixin en desastres reals.

Més recursos:


Imatge destacada: Milan1983/Shutterstock





Source link

Correcció de l’informe de cobertura “Pàgines excloses” de Google Search Console