“És impossible rastrejar tota la web”


En resposta a una pregunta sobre per què les eines de SEO no mostren tots els enllaços d’entrada, l’advocat de cerca de Google, John Mueller, diu que és impossible rastrejar tot el web.

Això s’afirma en un comentari a Reddit en un fil iniciat per un professional de SEO frustrat.

Es pregunten per què tots els enllaços que apunten a un lloc no són trobats per una eina de SEO que estan utilitzant.

Quina eina utilitza la persona no és important. Com aprenem de Mueller, no és possible cap eina per descobrir el 100% dels enllaços entrants d’un lloc web.

Heus aquí per què.

No hi ha manera d’arrossegar la web “correctament”

Mueller diu que no hi ha cap manera objectivament correcta de rastrejar el web perquè té un nombre infinit d’URL.

Ningú té els recursos per mantenir una quantitat infinita d’URL en una base de dades, de manera que els rastrejadors web intenten determinar què val la pena rastrejar.

Com explica Mueller, això inevitablement fa que els URL es rastregin amb poca freqüència o gens.

“No hi ha cap manera objectiva de rastrejar la web correctament.

Teòricament és impossible rastrejar-ho tot, ja que el nombre d’URL reals és infinit. Com que ningú es pot permetre el luxe de mantenir un nombre infinit d’URL en una base de dades, tots els rastrejadors web fan suposicions, simplificacions i conjectures sobre què val la pena rastrejar de manera realista.

I fins i tot, a efectes pràctics, no podeu rastrejar tot això tot el temps, Internet no té prou connectivitat i amplada de banda per a això, i costa molts diners si voleu accedir a moltes pàgines amb regularitat. (per al rastrejador i per al propietari del lloc).

Passat això, algunes pàgines canvien ràpidament, d’altres no han canviat durant 10 anys, de manera que els rastrejadors intenten estalviar esforços centrant-se més en les pàgines que esperen canviar, en lloc de les que esperen que no canviïn”.

Com els rastrejadors web determinen què val la pena rastrejar

Mueller continua explicant com els rastrejadors web, inclosos els motors de cerca i les eines de SEO, esbrinen quins URL val la pena rastrejar.

“I després, toquem la part on els rastrejadors intenten esbrinar quines pàgines són realment útils.

La web està plena de brossa que a ningú li importa, pàgines que s’han enviat correu brossa a la inutilitat. Aquestes pàgines encara poden canviar regularment, poden tenir URL raonables, però només estan destinades a l’abocador i qualsevol motor de cerca que es preocupi pels seus usuaris les ignorarà.

De vegades no és només brossa evident. Cada cop més, els llocs són tècnicament correctes, però simplement no arriben a “la barra” des del punt de vista de la qualitat per merèixer ser rastrejats més”.

Els rastrejadors web funcionen amb un conjunt limitat d’URL

Mueller conclou la seva resposta dient que tots els rastrejadors web treballen en un conjunt “simplificat” d’URL.

Com que no hi ha una manera correcta de rastrejar el web, com s’ha esmentat anteriorment, cada eina de SEO té la seva pròpia manera de decidir quins URL val la pena rastrejar.

És per això que una eina pot descobrir enllaços d’entrada que una altra no ha trobat.

“Per tant, tots els rastrejadors (incloses les eines de SEO) treballen en un conjunt molt simplificat d’URL, han de determinar amb quina freqüència rastrejar, quins URL rastrejar amb més freqüència i quines parts del web ignorar. No hi ha regles fixes per a això, de manera que cada eina haurà de prendre les seves pròpies decisions al llarg del camí. És per això que els motors de cerca tenen diferents continguts indexats, per què les eines de SEO enumeren diferents enllaços, per què les mètriques construïdes a sobre d’aquestes són tan diferents”.


Font: Reddit

Imatge destacada: rangizzz/Shutterstock





Source link

“És impossible rastrejar tota la web”