Quina diferència hi ha i com solucionar tots dos


La consola de cerca de Google adverteix als editors sobre els errors 404: 404 i suau 404.

Tot i que tots dos es diuen 404, són molt diferents.

En conseqüència, és essencial entendre la diferència entre els errors per corregir-los.

Codis d’estat HTTP

Una pàgina web a la qual accedeix un navegador respon amb un codi d’estat que comunica si la sol·licitud ha tingut èxit i, si no, per què no.

Aquestes respostes es comuniquen amb el que es coneix com a codis de resposta HTTP, però oficialment s’anomenen codis d’estat HTTP.

Un servidor proporciona cinc categories de codis de resposta; aquest article tracta específicament d’una resposta, la pàgina 404 no s’ha trobat codi d’estat.

El significat d’un codi de resposta 404

Tots els codis de la sèrie de respostes 4xx signifiquen que la sol·licitud no s’ha pogut satisfer perquè no s’ha trobat la pàgina.

El definició oficial és:

4xx (error de client): la sol·licitud conté una sintaxi incorrecta o no es pot complir

La resposta 404 és ambigua quant a si la pàgina web podria tornar.

Exemples de per què passa la pàgina 404 no trobada

  • Si algú suprimeix una pàgina web per error, el servidor respon amb la resposta de la pàgina 404 no trobada.
  • Si algú enllaça a una pàgina web inexistent, el servidor respon que la pàgina no s’ha trobat (404).

El documentació oficial té clar l’ambigüitat de si una pàgina ha desaparegut temporalment o permanentment:

“El codi d’estat 404 (no trobat) indica que el servidor d’origen no ha trobat una representació actual per al recurs de destinació o no està disposat a revelar que existeix.

Un codi d’estat 404 no indica si aquesta manca de representació és temporal o permanent…”

En resum, el codi de pàgina 404 no trobat significa que hi ha hagut un error a la sol·licitud del navegador perquè no s’ha pogut trobar la pàgina sol·licitada.

Què és un error 404 suau?

Un error 404 suau no és un codi d’estat oficial. El servidor no envia una resposta 404 suau a un navegador perquè no hi ha cap codi d’estat 404 suau.

suau 404 descriu una situació en què el servidor presenta una pàgina web i respon amb un codi d’estat de 200 OK, que indica l’èxit quan la pàgina web o el contingut realment falta.

Quatre raons habituals per a un Soft 404

Falta una pàgina web i un servidor envia l’estat 200 OK.

Aquest tipus de soft 404 passa quan falta una pàgina, però la configuració del servidor redirigeix ​​la pàgina que falta a la pàgina d’inici o a un URL personalitzat.

La pàgina ha desaparegut, però l’editor ha fet alguna cosa per satisfer la sol·licitud de la pàgina que falta.

Falta contingut o és “prim”.

Quan el contingut falta completament o n’hi ha molt poc (també conegut com a contingut prim), el servidor respondrà amb un codi d’estat 200, el que significa que la sol·licitud de la pàgina ha estat correcta.

Però per indexar pàgines web que no són sol·licituds de pàgines web reeixides, els motors de cerca anomenen aquest 404 suaus.

La pàgina que falta redirigeix ​​a la pàgina d’inici.

Alguns creuen erròniament que hi ha alguna cosa malament amb una resposta d’error 404.

Per tant, per aturar les respostes d’error 404, un editor pot redirigir la pàgina que falta a la pàgina d’inici, encara que la pàgina d’inici no sigui la que es va sol·licitar.

Google anomena aquestes sol·licituds de pàgines fallides 404 suaus.

Falta la pàgina redirigida a una pàgina web personalitzada.

De vegades, les pàgines que falten redirigeixen a una pàgina web personalitzada que ofereix un codi d’estat 200, cosa que fa que Google etiqueti aquestes pàgines com a 404 suaus.

Qui va inventar la frase Soft 404?

El concepte d’un soft 404 pot haver-se originat en un document de recerca de 2004 titulat, Cap a una comprensió de la decadència de la xarxa (PDF).

Les pàgines que falten que es substitueixen de manera incorrecta presenten un problema per als motors de cerca que intenten indexar pàgines reals.

Així és com el document de recerca emmarca els 404 suaus:

“Segons el protocol HTTP, quan es fa una sol·licitud a un servidor per a una pàgina que ja no està disponible, se suposa que el servidor retorna un codi d’error…

…de fet, molts servidors, inclosos els més reputats, no retornen un codi 404; en canvi, els servidors retornen una pàgina substitutiva i un codi OK (200).

… El nostre estudi mostra que aquest tipus de substitucions, anomenades “soft-404s”, representen més del 15% dels enllaços morts”.

Soft 404 a causa d’errors de codificació

Hi ha casos en què la pàgina no falta, però problemes específics (com ara errors de codificació) han provocat que Google la classifica com a pàgina que falta.

Els soft 404 són essencials per investigar perquè podrien indicar codi trencat.

Problemes típics de codificació:

  • Falta un fitxer o s’inclou que se suposa que ha d’omplir una pàgina web amb contingut.
  • Error de base de dades.
  • Falta JavaScript.
  • Pàgines de resultats de cerca buides.

Els errors 404 tenen dues causes principals

  • Un error a l’enllaç dirigeix ​​els usuaris a una pàgina que no existeix.
  • Un enllaç a una pàgina que abans existia però que de sobte va desaparèixer.

Error d’enllaç

Si la causa del 404 és un error d’enllaç, heu de corregir els enllaços.

La part complicada d’aquesta tasca és trobar tots els enllaços trencats en un lloc. Pot ser més difícil rastrejar grans llocs complexos amb milers o milions de pàgines.

En casos com aquest, les eines de rastreig són útils.

Teniu tantes opcions de programari de rastreig de llocs per triar: Xenu i Greenflare gratuïts; o programari de pagament com Screaming Frog, DeepCrawl, Botify, Sitebulb i OnCrawl, on molts d’aquests tenen versions de prova gratuïtes o versions de funcions gratuïtes però limitades.

Una pàgina que ja no existeix

Quan una pàgina ja no existeix, teniu dues opcions:

  • Restaura la pàgina si l’eliminació va ser accidental.
  • Redirecció 301 a la pàgina relacionada més propera si l’eliminació va ser intencionada.

En primer lloc, heu de localitzar tots els errors d’enllaç al lloc. De la mateixa manera que trobar tots els errors en l’enllaç d’un lloc web a gran escala, podeu utilitzar eines de rastreig.

Tanmateix, és possible que les eines de rastreig no les trobin pàgines òrfenes: pàgines no enllaçades des de cap lloc dels enllaços de navegació ni des de cap de les pàgines.

Les pàgines òrfenes poden existir si abans formaven part del lloc web, després, després d’un redisseny del lloc web, l’enllaç que va a aquesta pàgina antiga desapareix, però és possible que els enllaços externs d’altres llocs web encara hi estiguin enllaçant.

Per comprovar si aquest tipus de pàgines existeixen al vostre lloc, podeu utilitzar diverses eines.

Com identificar 404 pàgines de resposta

Informes de Google Search Console

L’informe de cobertura enumera els URL d’error 404 en un lloc web.

Informe 404 de Search ConsoleCaptura de pantalla de Google Search Console, agost de 2022

El Search Console informarà de 404 pàgines mentre Google rastreja totes les pàgines que pot trobar. Això pot incloure enllaços d’altres llocs a una pàgina que abans existia al vostre lloc web.

anàlisis de Google

No hi trobareu cap informe de pàgina que falti anàlisis de Google per defecte. Tanmateix, podeu seguir-los de diferents maneres.

D’una banda, podeu crear un informe personalitzat i segmentar les pàgines amb una menció de títol de pàgina Error 404: pàgina no trobada.

Una altra manera de trobar pàgines òrfenes a Google Analytics és crear agrupacions de contingut personalitzades i assignar les 404 pàgines a un grup de contingut.

Lloc: comandament de cerca d’operadors

No es pot utilitzar l’ordre del lloc: cerca per trobar errors 404 perquè Google no indexa pàgines web 404 ni pàgines web 404 suaus.

Lloc de Google: l’operador de cerca és útil per trobar pàgines web en un lloc que continguin una frase de paraula clau específica al contingut de les pàgines web.

La Search Console de Google és la millor font per identificar una llista de 404 suaus i 404 normals.

Els registres d’errors de trànsit del lloc web són una font útil per identificar les respostes d’error 404.

Altres eines de recerca d’enllaços d’entrada

Les eines de recerca d’enllaços d’entrada com Majestic, Ahrefs, Moz Open Site Explorer, Sistrix, Semrush, LinkResearchTools i CognitiveSEO també poden ajudar.

La majoria d’aquestes eines exportaran una llista d’enllaços d’entrada amb enllaços al vostre domini. A partir d’aquí, podeu comprovar totes les pàgines enllaçades i buscar errors 404.

Com corregir errors Soft 404

Les eines de rastreig no detectaran un 404 suau perquè no és un error 404. Però podeu utilitzar eines de rastreig per agafar una altra cosa.

Aquí hi ha algunes coses per trobar:

  • Contingut prim: Algunes eines de rastreig informen de pàgines que tenen contingut prim juntament amb un recompte de paraules ordenable. Comenceu amb pàgines amb la menor quantitat de paraules per avaluar si la pàgina té contingut prim.
  • Contingut duplicat: Algunes eines de rastreig són prou sofisticades per discernir quin percentatge de la pàgina és contingut de plantilla. I també hi ha eines fetes específicament per trobar contingut duplicat intern com SiteLiner. Si el contingut principal és gairebé el mateix que moltes altres pàgines, hauríeu de mirar aquestes pàgines i determinar per què hi ha contingut duplicat al vostre lloc.

A part de les eines de rastreig, també podeu utilitzar Google Search Console i comprovar els errors de rastreig per trobar pàgines enumerades a 404 suaus.

Rastrejar un lloc sencer per trobar problemes que causen 404 suaus us permet localitzar i corregir problemes abans que Google els detecti.

Després de detectar aquests problemes 404 suaus, haureu de corregir-los.

La majoria de les vegades, les solucions semblen ser de sentit comú. Això pot incloure coses senzilles, com ara ampliar pàgines amb contingut prim o substituir el contingut duplicat per de nous i únics.

Al llarg d’aquest procés, aquí teniu algunes coses a tenir en compte:

Consolidar pàgines

De vegades, el contingut prim és causat per ser massa específic amb el tema de la pàgina, cosa que us deixa amb poc a dir.

Combinar diverses pàgines fines en una mateixa pàgina pot ser més apropiat si els temes estan relacionats. Això no només resol problemes de contingut prim, sinó que també pot solucionar problemes de contingut duplicat.

Per exemple, un lloc de comerç electrònic que ven sabates de diferents colors i mides pot tenir un URL diferent per a cada talla i combinació de colors. Això deixa un gran nombre de pàgines amb contingut prim i relativament idèntic.

L’enfocament més eficaç és posar-ho tot en una pàgina i enumerar les opcions disponibles.

Trobeu problemes tècnics que causen contingut duplicat

Utilitzant fins i tot l’eina de rastreig web més senzilla com Xenu (que no mira el contingut sinó només els URL, els codis de resposta i les etiquetes de títol), encara podeu trobar problemes de contingut duplicat mirant els URL.

Això inclou URL www i no www, HTTP i HTTPS, amb index.html i sense, amb paràmetres de seguiment i sense, etc.

Errors 404 i errors 404 suaus

El més important que cal recordar sobre els errors 404 és que si realment falten les pàgines, no hi ha res a solucionar. Està bé mostrar una resposta 404 per a les sol·licituds de pàgines que no existeixen.

Però si les pàgines existeixen però en un URL diferent, s’ha d’arreglar per redirigir un enllaç trencat a l’URL real, restaurar una pàgina que falta o redirigir l’URL antic a una pàgina nova que l’ha substituït.

Un soft 404 sempre és el resultat d’un problema que s’ha de diagnosticar i solucionar.

Entendre la diferència entre els 404 és essencial per mantenir un lloc web funcionant amb el màxim rendiment.


Imatge destacada: Paulo Bobita/Search Engine Journal





Source link

Quina diferència hi ha i com solucionar tots dos