Com un SEO va solucionar un estrany problema rastrejat actualment no indexat


Un tècnic de SEO va publicar un cas pràctic de com va resoldre un curiós Rastrejat actualment no indexat problema al seu lloc. Tot i que la solució que va trobar pot no ser universal per a altres persones que experimenten aquest problema, el seu mètode per identificar el problema i resoldre’l presenta una guia útil per resoldre problemes tècnics de SEO.

El que va passar amb la indexació del seu lloc va ser realment estrany. Però la seva solució era senzilla i té sentit.

Vaig descobrir una descripció d’aquest problema en un tuit d’Adam Gent (@Adoubleagent)

Anunci

Continueu llegint a continuació

Rastrejat: actualment no s’ha indexat

Hi ha molts informes anecdòtics de Crawled Currently Not Indexed a Facebook, Twitter i fins i tot a les quedades d’oficina de John Mueller.

En un hangout recent d’horari d’oficina, algú va preguntar per què Google Search Console (GSC) mostrava Rastrejat no indexat, però quan feu clic, resulten indexats. va respondre John Mueller que només és un retard entre els informes.

I en un altre hangout en horari d’oficina va assenyalar John Mueller que és del tot normal que un lloc tingui moltes pàgines no indexades.

Va assenyalar:

“…si teniu un lloc més petit i veieu que una part important de les vostres pàgines no s’està indexant, aleshores faria un pas enrere i intentaria reconsiderar la qualitat general del lloc web i no centrar-me tant en problemes tècnics per aquelles pàgines.

L’altra cosa a tenir en compte pel que fa a la indexació, és que és completament normal que no ho indexem tot fora del lloc web.

I amb el pas del temps, quan us agraden 200 pàgines al vostre lloc web i en indexem 180, aquest percentatge es redueix una mica”.

Anunci

Continueu llegint a continuació

Tot i que ambdues són bones raons per explicar per què el problema rastrejat no indexat està passant a algunes persones, aquesta no és la raó per la qual Adam Gent va descobrir.

Adam Gent va descobrir un problema completament diferent que semblava ser un problema d’algorisme a Google. No hi havia res dolent amb el lloc en si, el problema era amb la indexació de Google.

Per què s’ha rastrejat: actualment no s’ha indexat

Adam va revisar l’informe de cobertura de l’índex GSC i va descobrir que Google rastrejava i indexava els seus feeds com si fossin pàgines HTML.

Va agafar paraules a l’atzar d’aquelles pàgines i va fer un lloc: va cercar amb aquestes paraules i va descobrir que el contingut de la pàgina d’alimentació estava indexat.

Per empitjorar les coses, sembla que Google havia canonitzat el contingut del canal RSS sobre la pàgina web real, explicant per què es van rastrejar les pàgines web reals però no indexades.

El canal RSS va ser generat per WordPress

Una cosa estranya d’aquest cas és que quan mireu la pàgina d’alimentació, es mostra com una pàgina web i no com es representa normalment un fitxer XML.

Captura de pantalla de la memòria cau del canal RSS

Captura de pantalla d'una pàgina RSS guardada a la memòria cau

Potser m’equivoco, però això no sembla un canal RSS normal. Sembla una pàgina HTML.

Anunci

Continueu llegint a continuació

Tot i que el codi subjacent realment és XML, no és així com es veuen normalment la majoria de fonts.

Això podria haver jugat un paper en el motiu pel qual Google va optar per canonitzar el canal?

És difícil entendre com podria passar això perquè hi ha tants senyals com els enllaços interns que, en circumstàncies habituals, farien que Google afavoreixi les pàgines HTML com a canòniques.

Com Adam va solucionar el problema

Després d’Adam esbrinar què va passar, va eliminar aquelles pàgines de feed generades per WordPress, va enviar els URL de feed per a un rastreig i després va fer 404 pàgines.

Després d’eliminar aquestes pàgines de l’índex, va enviar els URL correctes a Google i en pocs dies es va solucionar el problema.

Anunci

Continueu llegint a continuació

Què va causar el problema?

Adam va escriure que el problema sembla ser de la part de Google.

Vaig preguntar i algú em va dir que sembla que fa uns anys Google va començar a indexar feeds, però que pensava que aquest problema s’havia solucionat.

No sóc un expert en XML, però sembla estrany que el canal s’assembli a una pàgina HTML en lloc del disseny normal XML que apareix sense estil HTML.

El feed no sembla normal, de manera que sembla que qualsevol cosa que ho faci semblar pot ser una causa subjacent.

Independentment, si teniu problemes de rastreig no indexats actualment, això és una cosa més a comprovar per si també us està passant.

Anunci

Continueu llegint a continuació

Citació

Llegeix la publicació original que explica la resolució del problema:

Un curiós cas de canonicalització





Source link

Com un SEO va solucionar un estrany problema rastrejat actualment no indexat