És un factor de classificació de Google?


La indexació semàntica latent (LSI) és un mètode d’indexació i recuperació d’informació utilitzat per identificar patrons en les relacions entre termes i conceptes.

Amb LSI, s’utilitza una tècnica matemàtica per trobar semànticament termes relacionats dins d’una col·lecció de text (an índex) on aquestes relacions podrien estar amagades (o latent).

I en aquest context, sembla que podria ser molt important per al SEO.

Dret?

Al cap i a la fi, Google és un índex massiu d’informació i n’estem escoltant tot tipus de coses cerca semàntica i la importància de la rellevància en l’algorisme de classificació de cerca.

Si heu sentit rumors sobre la indexació semàntica latent en SEO o us han aconsellat que utilitzeu paraules clau LSI, no esteu sols.

Però LSI ajudarà realment a millorar el vostre rànquing de cerca? Fem una ullada.

La reclamació: la indexació semàntica latent com a factor de classificació

L’afirmació és senzilla: optimitzar el contingut web amb paraules clau LSI ajuda a Google a entendre’l millor i se us recompensarà amb una classificació més alta.

Backlinko defineix les paraules clau LSI d’aquesta manera:

“Les paraules clau LSI (Latent Semantic Indexing) són termes relacionats conceptualment que els motors de cerca utilitzen per entendre profundament el contingut d’una pàgina web”.

Mitjançant l’ús de termes relacionats amb el context, podeu aprofundir en la comprensió de Google del vostre contingut. O això diu la història.

Aquest recurs continua fent alguns arguments força convincents per a les paraules clau LSI:

  • Google es basa en paraules clau LSI per entendre el contingutt a un nivell tan profund”.
  • Les paraules clau LSI NO són ​​sinònims. En canvi, són termes que estan estretament lligats a la vostra paraula clau objectiu”.
  • Google no només utilitza termes en negreta que coincideixen exactament el que acabes de cercar (als resultats de la cerca). També tenen paraules en negreta i frases semblants. No cal dir que aquestes són paraules clau LSI que voleu espolvorear al vostre contingut”.

Aquesta pràctica d'”aspersió” de termes estretament relacionats amb la vostra paraula clau objectiu ajuda a millorar la vostra classificació mitjançant LSI?

L’evidència de LSI com a factor de classificació

La rellevància s’identifica com un dels cinc factors clau que ajuden Google a determinar quin resultat és la millor resposta per a una consulta determinada.

Com explica Google és el seu Com funciona la cerca recurs:

“Per retornar resultats rellevants per a la vostra consulta, primer hem d’establir quina informació esteu cercantーla intenció darrere de la vostra consulta”.

Un cop establerta la intenció:

“… els algorismes analitzen el contingut de les pàgines web per avaluar si la pàgina conté informació que podria ser rellevant per al que esteu buscant”.

Google continua explicant que el “senyal més bàsic” de rellevància és que les paraules clau utilitzades en la consulta de cerca apareixen a la pàgina. Això té sentit: si no utilitzeu les paraules clau que cerca el cercador, com podria Google dir que sou la millor resposta?

Ara, aquí és on alguns creuen que entra en joc LSI.

Si utilitzar paraules clau és un senyal de rellevància, utilitzar només les paraules clau adequades ha de ser un senyal més fort.

Hi ha eines de creació de propòsits dedicades a ajudar-vos a trobar aquestes paraules clau LSI, i els creients en aquesta tàctica recomanen utilitzar tot tipus d’altres tàctiques de recerca de paraules clau per identificar-les també.

L’evidència contra LSI com a factor de classificació

John Mueller de Google ha estat clar com el cristall en aquest:

“…no tenim cap concepte de paraules clau LSI. Així que això és una cosa que pots ignorar completament”.

Hi ha un escepticisme saludable en el SEO que Google pot dir coses que ens enganxin per tal de protegir la integritat de l’algorisme. Així que anem a cavar aquí.

En primer lloc, és important entendre què és LSI i d’on prové.

L’estructura semàntica latent va sorgir com una metodologia per recuperar objectes textuals dels fitxers emmagatzemats en un sistema informàtic a finals dels anys vuitanta. Com a tal, és un exemple d’un dels conceptes anteriors de recuperació d’informació (IR) disponibles per als programadors.

A mesura que la capacitat d’emmagatzematge de l’ordinador va millorar i els conjunts de dades disponibles electrònicament van créixer en mida, es va fer més difícil localitzar exactament el que es buscava en aquella col·lecció.

Els investigadors van descriure el problema que estaven intentant resoldre en a sol·licitud de patent presentada el 15 de setembre de 1988:

“La majoria dels sistemes encara requereixen que un usuari o proveïdor d’informació especifiqui relacions i enllaços explícits entre objectes de dades o objectes de text, fent que els sistemes siguin tediosos d’utilitzar o aplicar-los a fitxers d’informació informàtics grans i heterogenis, el contingut dels quals pot ser desconegut per a l’usuari. ”

En aquell moment, la concordança de paraules clau s’utilitzava a IR, però les seves limitacions eren evidents molt abans que Google aparegués.

Massa sovint, les paraules que una persona utilitzava per cercar la informació que buscava no eren coincidències exactes amb les paraules utilitzades a la informació indexada.

Hi ha dues raons per a això:

  • Sinonímia: la diversitat de paraules utilitzades per descriure un sol objecte o idea fa que es perdin resultats rellevants.
  • Polisèmia: els diferents significats d’una sola paraula fa que es recuperin resultats irrellevants.

Aquests encara són problemes avui en dia, i us podeu imaginar el gran mal de cap que suposa per a Google.

No obstant això, les metodologies i la tecnologia que Google utilitza per resoldre la rellevància fa temps que van passar de LSI.

El que va fer LSI va ser crear automàticament un “espai semàntic” per a la recuperació d’informació.

Tal com explica la patent, LSI va tractar aquesta falta de fiabilitat de les dades d’associació com un problema estadístic.

Sense ficar-se massa a les males herbes, aquests investigadors creien essencialment que hi havia una estructura semàntica latent subjacent oculta que podrien treure de les dades d’ús de paraules.

Si ho fes, revelaria el significat latent i permetria que el sistema retornés resultats més rellevants, i només els resultats més rellevants, fins i tot si no hi ha una concordança exacta de paraula clau.

Aquí teniu el que sembla realment aquest procés LSI:

Diagrama de flux del procés LSIImatge creada per l’autor, gener de 2022

I aquí teniu el més important que heu de tenir en compte sobre la il·lustració anterior d’aquesta metodologia de la sol·licitud de patent: hi ha dos processos separats.

En primer lloc, la col·lecció o índex se sotmet a una anàlisi semàntica latent.

En segon lloc, s’analitza la consulta i després es busca semblances en l’índex ja processat.

I aquí és on rau el problema fonamental amb LSI com a senyal de classificació de cerca de Google.

L’índex de Google és massiva a les centenars de milers de milions de pàgines, i està creixent constantment.

Cada vegada que un usuari introdueix una consulta, Google està ordenant el seu índex en una fracció de segon per trobar la millor resposta.

L’ús de la metodologia anterior a l’algorisme requeriria que Google:

  1. Recrea aquest espai semàntic utilitzant LSA a tot el seu índex.
  2. Analitzar el significat semàntic de la consulta.
  3. Trobeu totes les semblances entre el significat semàntic de la consulta i documents en l’espai semàntic creat a partir de l’anàlisi de tot l’índex.
  4. Ordena i classifica aquests resultats.

Això és una simplificació excessiva, però la qüestió és que no es tracta d’un procés escalable.

Això seria molt útil per a petites col·leccions d’informació. Va ser útil per mostrar informes rellevants dins de l’arxiu informatitzat de documentació tècnica d’una empresa, per exemple.

La sol·licitud de patent il·lustra com funciona LSI mitjançant una col·lecció de nou documents. Per això va ser dissenyat. LSI és primitiu pel que fa a la recuperació d’informació per ordinador.

Indexació semàntica latent com a factor de classificació: el nostre veredicte

Indexació semàntica latent (LSI): és un factor de classificació de Google?

Tot i que els principis subjacents d’eliminar el soroll mitjançant la determinació de la rellevància semàntica segurament han informat els desenvolupaments en el rànquing de cerca des que es va patentar LSA/LSI, LSI en si no té cap aplicació útil en SEO avui dia.

No s’ha descartat completament, però no hi ha proves que Google hagi utilitzat mai LSI per classificar els resultats. I Google definitivament no utilitza paraules clau LSI o LSI avui per classificar els resultats de la cerca.

Aquells que recomanen utilitzar paraules clau LSI s’enganxen a un concepte que no acaben d’entendre en un esforç per explicar per què les maneres en què es relacionen (o no) les paraules són importants en SEO.

La rellevància i la intenció són consideracions fonamentals en l’algoritme de classificació de cerca de Google.

Aquestes són dues de les grans preguntes que intenten resoldre per trobar la millor resposta per a qualsevol consulta.

La sinonímia i la polisèmia segueixen sent grans reptes.

Semàntica –és a dir, la nostra comprensió dels diferents significats de les paraules i de com es relacionen– és essencial per produir resultats de cerca més rellevants.

Però LSI no té res a veure amb això.


Imatge destacada: Paulo Bobita/Search Engine Journal





Source link

És un factor de classificació de Google?
× +info?
%d bloggers like this: