Google PageRank explicat per a principiants en SEO


Celebreu les festes amb alguns dels millors articles de SEJ del 2023.

La nostra sèrie Festive Flashback dura del 21 de desembre al 5 de gener, amb lectures diàries sobre esdeveniments significatius, fonaments, estratègies accionables i opinions de líders de pensament.

El 2023 ha estat força ple d’esdeveniments a la indústria del SEO i els nostres col·laboradors han produït alguns articles destacats per seguir el ritme i reflectir aquests canvis.

Posa’t al dia amb les millors lectures del 2023 per donar-te moltes coses per reflexionar mentre avances cap al 2024.


PageRank va ser una vegada al nucli de la cerca, i va ser el que va crear Google l’imperi que és avui.

Fins i tot si creieu que la cerca ha passat de PageRank, no es pot negar que fa temps que ha estat un concepte generalitzat a la indústria.

Tots els professionals de SEO haurien de tenir una bona comprensió del que era PageRank i del que encara és avui.

En aquest article, tractarem:

  • Què és el PageRank?
  • La història de com va evolucionar el PageRank.
  • Com el PageRank va revolucionar la cerca.
  • Barra d’eines PageRank vs. PageRank.
  • Com funciona el PageRank.
  • Com flueix el PageRank entre les pàgines.
  • Encara s’utilitza el PageRank?

Submergem-nos.

Què és el PageRank?

Creat pels fundadors de Google Larry Page i Sergey Brin, PageRank és un algorisme basat en les forces relatives combinades de tots els hiperenllaços d’Internet.

La majoria de la gent argumenta que el nom es basava en el cognom de Larry Page, mentre que altres suggereixen que “Pàgina” fa referència a una pàgina web. Les dues posicions són probablement certes, i la superposició probablement va ser intencionada.

Quan Page i Brin estaven a la Universitat de Stanford, van escriure un article titulat: El rànquing de cites de PageRank: posar ordre al web.

Publicat el gener de 1999, el document demostra un algorisme relativament senzill per avaluar la força de les pàgines web.

patent de pagerank: pàgines llavorImatge de patents.google.com, abril de 2023

El paper es va convertir en un patent als EUA (però no a Europa, on les fórmules matemàtiques no són patentables).

d'inici a final del procés de pagerankImatge de patents.google.com, abril de 2023

La Universitat de Stanford és propietari de la patent i l’ha assignat a Google. Actualment, la patent expirarà el 2027.

procés pantent de pagerankImatge de patents.google.com, abril de 2023

La història de com va evolucionar el PageRank

Durant la seva estada a Stanford a finals de la dècada de 1990, tant Brin com Page estaven mirant recuperació d’informació mètodes.

En aquella època, utilitzar enllaços per esbrinar la “importància” de cada pàgina en relació amb una altra era una forma revolucionària d’ordenar pàgines. Va ser computacionalment difícil però de cap manera impossible.

La idea es va convertir ràpidament en Google, que en aquells moments era un petit al món de la cerca.

Hi havia tanta creença institucional en l’enfocament de Google per part d’algunes parts que l’empresa va llançar inicialment el seu motor de cerca sense capacitat per obtenir ingressos.

I mentre que Google (conegut en aquell moment com “BackRub”) era el motor de cerca, PageRank era l’algoritme que utilitzava per classificar les pàgines a les pàgines de resultats del motor de cerca (SERP).

El Google Dance

Un dels reptes de PageRank era que les matemàtiques, tot i que senzilles, s’havien de processar iterativament. El càlcul s’executa diverses vegades, a cada pàgina i a cada enllaç d’Internet. Al canvi de mil·lenni, aquestes matemàtiques van trigar diversos dies a processar-se.

El SERP de Google es va moure amunt i avall durant aquest temps. Aquests canvis sovint eren erràtics, ja que es calculaven nous PageRanks per a cada pàgina.

Això es coneixia com el “Google Dance” i notòriament va aturar els professionals del SEO del dia cada vegada que Google iniciava la seva actualització mensual.

(El Google Dance més tard es va convertir en el nom d’una festa anual que Google organitzava per a experts en SEO a la seva seu a Mountain View.)

Llavors de confiança

Una iteració posterior de PageRank va introduir la idea d’un conjunt de “llavor de confiança” per iniciar l’algorisme en lloc de donar a cada pàgina d’Internet el mateix valor inicial.

Surfista raonable

Una altra iteració del model va introduir la idea d’un “surfista raonable”.

Aquest model suggereix que el PageRank d’una pàgina pot no compartir-se de manera uniforme amb les pàgines a les quals enllaça, però podria ponderar el valor relatiu de cada enllaç en funció de la probabilitat que tingui un usuari de fer-hi clic.

La retirada del PageRank

Inicialment es va creure que l’algoritme de Google era “incapaç de fer correu brossa” internament, ja que la importància d’una pàgina estava dictada no només pel seu contingut sinó també per una mena de “sistema de votació” generat per enllaços a la pàgina.

La confiança de Google no va durar, però.

PageRank va començar a ser problemàtic a mesura que creixia la indústria dels enllaços d’entrada. Així que Google el va retirar de la vista pública, però va continuar confiant-hi per als seus algorismes de classificació.

El Barra d’eines PageRank es va retirar el 2016 i, finalment, es va reduir tot l’accés públic a PageRank. Però en aquest moment, Majestic (una eina de SEO), en particular, havia estat capaç de correlacionar força bé els seus propis càlculs amb PageRank.

Google va passar molts anys animant els professionals del SEO a evitar manipular enllaços a través del seu “Directrius de Google” i mitjançant l’assessorament del seu equip de correu brossa, encapçalat per Matt Cutts, fins al gener de 2017.

algorismes de Google també van canviar durant aquest temps.

L’empresa confiava menys en PageRank i, després de la compra de MetaWeb i la seva propietat Gràfic de coneixement (anomenat “Freebase” el 2014), Google va començar a indexar la informació del món de diferents maneres.

Barra d’eines PageRank vs. PageRank

Inicialment, Google estava tan orgullós del seu algorisme que es va alegrar de compartir públicament el resultat del seu càlcul a tothom que el volgués veure.

La representació més notable va ser una extensió de barra d’eines per a navegadors com Firefox, que mostrava una puntuació entre 0 i 10 per a cada pàgina d’Internet.

De fet, PageRank té un ventall de puntuacions molt més ampli, però 0-10 va oferir als professionals del SEO i als consumidors una manera instantània d’avaluar la importància de qualsevol pàgina a Internet.

La barra d’eines PageRank va fer que l’algoritme fos molt visible, que també va comportar complicacions. En particular, significava que estava clar que els enllaços eren la manera més fàcil de “jugar” a Google.

Com més enllaços (o, més exactament, millor sigui l’enllaç), millor es podria classificar una pàgina a les SERP de Google per a qualsevol paraula clau orientada.

Això va significar que es va formar un mercat secundari, comprant i venent enllaços valorats al PageRank de l’URL on es venia l’enllaç.

Aquest problema es va agreujar quan Yahoo va llançar una eina gratuïta anomenada Yahoo Search Explorer, que permetia a qualsevol persona la possibilitat de començar a trobar enllaços a qualsevol pàgina determinada.

Més tard, dues eines, Moz i Majestic, es van basar en l’opció gratuïta construint els seus propis índexs a Internet i avaluant els enllaços per separat.

Com el PageRank va revolucionar la cerca

Altres motors de cerca van confiar molt en l’anàlisi del contingut de cada pàgina individualment. Aquests mètodes tenien poc per identificar la diferència entre una pàgina influent i una altra simplement escrita amb text aleatori (o manipulatiu).

Això significava que els mètodes de recuperació d’altres motors de cerca eren extremadament fàcils de manipular per als professionals del SEO.

L’algoritme PageRank de Google, doncs, va ser revolucionari.

Combinat amb un concepte relativament senzill de “nGramsPer ajudar a establir la rellevància, Google va trobar una fórmula guanyadora.

Aviat va superar els principals titulars del dia, com AltaVista i Inktomi (que van impulsar MSN, entre d’altres).

En operar a nivell de pàgina, Google també va trobar una solució molt més escalable que l’enfocament basat en “directori” adoptat per Yahoo i posteriorment DMOZ, tot i que DMOZ (també anomenat Open Directory Project) va poder proporcionar a Google inicialment un codi obert. directori propi.

Com funciona el PageRank

La fórmula per a PageRank es presenta en diverses formes, però es pot explicar en poques frases.

Inicialment, cada pàgina d’Internet té una puntuació estimada de PageRank. Aquest podria ser qualsevol número. Històricament, el PageRank es presentava al públic com una puntuació entre 0 i 10, però a la pràctica, les estimacions no han de començar en aquest rang.

Aleshores, el PageRank d’aquesta pàgina es divideix pel nombre d’enllaços de la pàgina, donant com a resultat una fracció més petita.

A continuació, el PageRank es distribueix a les pàgines enllaçades, i el mateix es fa per a totes les altres pàgines d’Internet.

Aleshores, per a la següent iteració de l’algorisme, la nova estimació de PageRank per a cada pàgina és la suma de totes les fraccions de pàgines que enllacen a cada pàgina determinada.

La fórmula també conté un “factor d’amortiment”, que es va descriure com la possibilitat que una persona que navegui per la web deixi de navegar per complet.

Abans que comenci cada iteració posterior de l’algorisme, el nou PageRank proposat es redueix pel factor d’amortiment.

Aquesta metodologia es repeteix fins que les puntuacions de PageRank assoleixen un equilibri establert. Aleshores, els nombres resultants es van transposar generalment a un rang més reconeixible de 0 a 10 per comoditat.

Una manera de representar-ho matemàticament és:

Fórmula de PageRankImatge de l’autor, abril de 2023

On:

  • PR = PageRank a la següent iteració de l’algorisme.
  • d = factor d’amortiment.
  • j = el número de pàgina a Internet (si cada pàgina tenia un número únic).
  • n=nombre total de pàgines a Internet.
  • i = la iteració de l’algorisme (inicialment establert com a 0).

La fórmula també es pot expressar en forma de matriu.

Problemes i iteracions de la fórmula

La fórmula té alguns reptes.

Si una pàgina no enllaça amb cap altra pàgina, la fórmula no arribarà a un equilibri.

En aquest cas, per tant, el PageRank es distribuiria entre totes les pàgines d’Internet. D’aquesta manera, fins i tot una pàgina sense enllaços entrants podria arribar alguns PageRank, però no acumularia prou per ser significatiu.

Un altre repte menys documentat és que les pàgines més noves, encara que potencialment més important que les pàgines més antigues, tindrà un PageRank més baix. Això vol dir que amb el temps, el contingut antic pot tenir un PageRank desproporcionadament alt.

El temps que una pàgina ha estat activa no es té en compte a l’algorisme.

Com flueix el PageRank entre les pàgines

Si una pàgina comença amb un valor de 5 i té 10 enllaços, a cada pàgina a la qual enllaça se’ls dóna 0,5 PageRank (menys el factor d’amortiment).

D’aquesta manera, el PageRank flueix per Internet entre iteracions.

A mesura que les pàgines noves arriben a Internet, comencen amb només una petita quantitat de PageRank. Però a mesura que altres pàgines comencen a enllaçar a aquestes pàgines, el seu PageRank augmenta amb el temps.

Encara s’utilitza PageRank?

Tot i que l’accés públic a PageRank es va eliminar el 2016, es creu que la puntuació encara està disponible per als enginyers de cerca de Google.

Una filtració dels factors utilitzats per Yandex va demostrar que el PageRank continuava sent un factor que podia utilitzar.

Els enginyers de Google han suggerit que la forma original de PageRank es va substituir per una nova aproximació que requereix menys potència de processament per calcular. Tot i que la fórmula és menys important en com Google classifica les pàgines, segueix sent una constant per a cada pàgina web.

I independentment dels altres algorismes que Google pugui optar per invocar, probablement PageRank segueixi integrat en molts dels sistemes del gegant de cerca fins avui.

Dixon explica com funciona PageRank amb més detall en aquest vídeo:



Patents i documents originals per a una lectura més aprofundida:

Més recursos:


Imatge destacada: VectorMine/Shutterstock



Source link

Google PageRank explicat per a principiants en SEO