Generació automàtica de contingut per a SEO: possibilitats i trampes de GPT-3


Des de l’arribada de GPT-3, els generadors de contingut han multiplicat els casos d’ús de SEO. Sembla que està en ordre una actualització bimensual per revisar el nou progrés en el camp dels models lingüístics.

En primer lloc, a finals del 2021, el club de models de llenguatge molt gran va créixer significativament.

Cada país ha intentat mostrar les seves tecnologies i fer-les accessibles mitjançant treballs de recerca i demostracions públiques o privades.

Aquests són els principals competidors de la cursa:

  • EUA: OpenAI – Turing NLG.
  • Xina: Wu Dao 2.0 – PanGu-Alpha.
  • Corea del Sud: HyperCLOVA.
  • Israel: A121 (Jurassic-1).
  • Europa: Aleph Alpha.
  • Codi obert: EleutherAI.

Cada model té els seus punts forts i els seus punts febles.

Per provar-los, molts editors de programari de SEO o agències de SEO estan provant aquests models.

Com triar un model GPT-3?

Podeu pensar que, com més paràmetres tingui el model, millor seria (Nota de l’editor: un paràmetre correspon a un concepte après per l’IA).

Publicitat

Continueu llegint a continuació

Però us equivocaríeu.

El criteri número u no és absolutament el nombre de paràmetres, perquè podeu obtenir resultats excel·lents amb models més lleugers.

Més aviat, són les dades sobre les quals es va formar el model.

De fet, per ser eficaç, un model ha de ser capaç d’entendre un gran nombre de dominis dispars.

El primer que cal fer és esbrinar com s’ha format el model. Per a GPT-3, el diagrama següent ajuda:

Diagrama GPT-3.Captura de pantalla de GPT-3, octubre de 2021

Podem veure que GPT-3 es va formar principalment amb dades de:

Publicitat

Continueu llegint a continuació

  • Arxiu web entre 2016 i 2019.
  • WebText, que correspon a la recuperació de dades al web.
  • Viquipèdia.
  • Llibres en anglès (Books1)
  • Llibres en altres idiomes (Llibres2).

Ara, si observem com s’entrenen els models de codi obert, veiem que les fonts són força diferents.

Fonts basades en el projecte The Pile.Captura de pantalla de Gpt-3, octubre de 2021

Tot es basa en el projecte The Pile, que és un conjunt de dades de 825 GB de textos en anglès diversificats que són gratuïts i accessibles al públic.

Amb The Pile trobem dades molt variades, com ara llibres, dipòsits de GitHub, pàgines web, revistes de debat, articles de medicina, física, matemàtiques, informàtica i filosofia.

En general, serà important provar el model d’idioma en el vostre idioma i, sobretot, en el vocabulari específic del vostre lloc web.

Abans d’examinar casos d’ús específics de SEO, vegem les trampes.

Trampes de generació de contingut GPT-3 per a SEO

Per generar textos qualitatius que interessin els vostres usuaris, és important conèixer les trampes que cal evitar.

En primer lloc, sigui quin sigui el model que trieu, heu de proporcionar-li exemples de qualitat com a entrada perquè els pugui imitar i, sobretot, respectar un tipus de text concret.

Si demaneu a un model d’idioma que generi contingut a “lampistes de Nova York”, el model recorrerà diversos camins i sovint no adequats:

  • Hauria de crear un directori compost?
  • Hauria de crear contingut sobre un lampista de Nova York?
  • Hauria de crear un diàleg entre lampistes a París?
  • Potser un poema sobre fontaneria a Nova York?

En resum, el model es perdrà.

En segon lloc, els models d’idiomes no gestionen gens el contingut duplicat.

Publicitat

Continueu llegint a continuació

Per tant, sigui quin sigui el text que generis, hauràs d’utilitzar una eina de tercers per comprovar que el model no ha duplicat alguna cosa que ha après i, més concretament, que el text no existeix i que és únic.

Hi ha moltes eines disponibles confirmeu si el vostre contingut és únic. Si no és així, simplement regenereu el contingut.

A més, les plantilles de generació de contingut no optimitzen en absolut el text per a la cerca.

Una vegada més, estan formats en una gran varietat de fonts, de manera que haurà de guiar-los amb totes les eines semàntiques que existeixen al mercat.

També els podeu demanar que emfatitzin paraules clau, i per explicar els seus conceptes amb més detall.

Finalment, el model pot inventar dades. De fet, els models tenen un entorn de creativitat.

Si el model està configurat per permetre una alta creativitat, de vegades pot inventar característiques per a un objecte, per exemple, que poden generar incoherències en els vostres textos.

Casos d’ús de generació de contingut per a SEO

Durant els darrers vuit mesos, he estat provant molts casos d’ús de generació de contingut diferents.

Publicitat

Continueu llegint a continuació

Amb plantilles gratuïtes com GPT-Neo i GPT-J, hem obtingut molt bons resultats en els casos d’ús següents:

  • Extracció de conceptes (extracció de llocs, persones, etc.).
  • Extracció de preguntes d’un text.
  • Respostes a preguntes basades en un text.
  • Generació de textos breus en anglès només per crear títols o meta descripcions.

D’altra banda, amb un model de pagament com GPT-3 amb preus accessibles, no només hem aconseguit generar textos llargs i específics, sinó també crear resums textuals sofisticats.

Resums textuals sofisticats a OpenAI.Captura de pantalla de GPT-3, octubre de 2021

La imatge no és fàcil de llegir, però mostra els exemples d’entrada que es mostren en negreta i, a continuació, el text generat pel model en cursiva.

Publicitat

Continueu llegint a continuació

Aquí, l’objectiu és crear un text d’incentius per fer que la gent vulgui comprar un producte.

GPT-3 entén perfectament el to i la longitud necessaris del text i inclou les paraules que s’utilitzaran. El text es genera en menys de 10 segons.

Aquí teniu el text generat:

Cedeix els teus somnis infantils. Encara recordes el teu primer videojoc? Gràcies al progrés tecnològic, podeu tornar a viure-les de nou. Podeu jugar amb un altre jugador a la carretera a través de les consoles Nintendo DS, PlayStation o Xbox.

Amb el Nintendo Switch, proveu jocs divertits com Mario Kart 8 Deluxe: aixeca’t contra els teus rivals i gaudeix d’aventures màgiques amb Mario, Zelda i altres personatges. Gaudeix d’una increïble gamma de jocs AAA; Tant si preferiu jocs de lluita o aventura com multijugador, PS4 ofereix subscripcions a PS Plus que s’adapti a les vostres necessitats.

Xbox també ofereix accés il·limitat a aplicacions d’entreteniment com Netflix i Youtube per pocs diners. Tant si escolliu PS4, Xbox com el nou Nintendo Switch, serà fàcil connectar-vos amb la família o els amics mitjançant aplicacions com Skype per passar una bona estona amb els vostres amics.

Publicitat

Continueu llegint a continuació

Assegureu-vos de no deixar passar aquesta oportunitat.

Per descomptat, la revisió encara es requereix per millorar el text, però aquesta tecnologia estalvia molt de temps i permet als humans concentrar-se en problemes d’alt valor afegit.

Passem a dues revolucions en la generació de contingut.

Dues revolucions per al SEO

Abans, GPT-3 podia no haver estat capaç de generar contingut específic perquè no estava entrenat per fer-ho, com vam veure anteriorment.

Ara, teniu la capacitat de tornar a entrenar el model.

Només cal que doneu entre 20 i 100 exemples amb les vostres instruccions com a entrada i la finalització ideal que vulgueu produir com a sortida:

{"prompt":"CTA:nnsubject: smartphonenn words: smartphone, Samsung, mobile phones, Xiaomi, Samsung, Apple, Huawei, Sony, iPhone, intelligent mobile phones, Androidnn ","completion":"Looking for a new smartphone? You've shortlisted a Samsung Galaxy or a Huawei model, but you haven't made a decision yet? Choose a smartphone in our product range and enjoy the best of the new mobile phones at an unbeatable price! You're guaranteed to find a smartphone at the best price, so don't miss out! It's never easy to find the best option among a multitude of smartphones: Xiaomi, Samsung, Apple, Huawei, Sony, or even Honor. Smartphones - intelligent mobile phones - aren't just synonymous with Apple's iPhone, but include many models. Smartphones using the Android operating system are the most common."}

L’operació requereix molt de temps, però teniu una plantilla optimitzada que s’adapta al vostre cas d’ús, sobretot si heu d’utilitzar un vocabulari específic per a un nínxol, una indústria o un tema en concret quan optimitzeu el vostre SEO.

Això només requereix dues línies de codi Python. La part que més temps requereix és, per descomptat, la creació d’aquest fitxer d’exemple.

Fitxer d'exemple a OpenAI.Captura de pantalla de GPT-3, octubre de 2021

Finalment, passem a l’últim tema que m’ha fet especial il·lusió aquest mes: la generació de codi.

Publicitat

Continueu llegint a continuació

De fet, s’ha llançat una nova tecnologia on donem instruccions i el nou motor OpenAI Codex és capaç de generar codi Python per resoldre els nostres problemes.

Comencem assenyalant que es tracta de problemes senzills: no pot substituir els desenvolupadors perquè hauríem de proporcionar a la IA tot el codi configurat i totes les limitacions tècniques.

D’altra banda, des d’un punt de vista pedagògic i sobretot en un enfocament sense codi, és fantàstic poder demanar-li que es connecti a una font de dades (Mysql, Excel, CSV, API, etc.) i generar visualitzacions correctes en pocs segons.

Obtenció del fitxer de registre de la NASA durant un dia.Captura de pantalla de GPT-3, octubre de 2021

A continuació, es mostra un mini-exemple en què obteniu el fitxer de registre de la NASA del dia 1 d’agost de 1995 i demano un gràfic de barres amb el nombre total d’URL visitats a l’hora.

Publicitat

Continueu llegint a continuació

A continuació, amb un senzill editor de text, podeu veure el resultat copiant i enganxant el codi.

Per tal d’aprofundir encara més en el concepte de no codi, estic preparant una aplicació web on tot estarà impulsat pel text.

L’únic límit en l’ús de models de llenguatge en SEO és la vostra imaginació. Sens dubte, podeu crear tot un tauler de SEO d’aquesta manera desglossant cadascuna de les visualitzacions que vulgueu, pas a pas.

Els models lingüístics encara tenen moltes sorpreses a la botiga i hi ha molts usos nous per al màrqueting.

Més recursos:


Imatge destacada: Vector Juice / Shutterstock





Source link

Generació automàtica de contingut per a SEO: possibilitats i trampes de GPT-3