Arbre de pensaments que demana millors resultats generatius d’IA


Molts són conscients del popular mètode de la cadena de pensaments (CoT) per impulsar la IA generativa per obtenir respostes millors i més sofisticades. Els investigadors de Google DeepMind i la Universitat de Princeton van desenvolupar una estratègia d’incitació millorada anomenada Tree of Thoughts (ToT) que porta la indicació a un nivell més alt de resultats, desbloquejant mètodes de raonament més sofisticats i millors resultats.

Els investigadors expliquen:

“Mostrem com la cerca deliberada en arbres de pensaments (ToT) produeix millors resultats i, el que és més important, noves maneres interessants i prometedores d’utilitzar models lingüístics per resoldre problemes que requereixen cerca o planificació”.

Els investigadors comparen amb tres tipus d’indicacions

El document de recerca compara ToT amb altres tres estratègies d’impuls.

1. Indicació d’entrada-sortida (IO).
Això és bàsicament donar al model lingüístic un problema per resoldre i obtenir la resposta.

Un exemple basat en el resum del text és:

Sol·licitud d’entrada: resumeix l’article següent.
Sol·licitud de sortida: resum basat en l’article introduït

2. Cadena de pensament

Aquesta forma d’incitació és on es guia un model de llenguatge per generar respostes coherents i connectades animant-lo a seguir una seqüència lògica de pensaments. El prompt de la cadena de pensament (CoT) és una manera de guiar un model de llenguatge a través dels passos intermedis de raonament per resoldre problemes.

Exemple de la cadena de pensament:

Pregunta: En Roger té 5 pilotes de tennis. Compra 2 llaunes més de pilotes de tennis. Cada llauna té 3 pilotes de tennis. Quantes pilotes de tennis té ara?
Raonament: Roger va començar amb 5 boles. 2 llaunes de 3 pilotes de tennis cadascuna són 6 pilotes de tennis. 5 + 6 = 11. La resposta: 11

Pregunta: La cafeteria tenia 23 pomes. Si n’han fet servir 20 per fer el dinar i n’han comprat 6 més, quantes pomes tenen?

3. Autoconsistència amb CoT

En termes simples, es tracta d’una estratègia d’incitació de demanar el model d’idioma diverses vegades i després escollir la resposta més freqüent.

El treball de recerca sobre Sel-coherència amb CoT a partir de març de 2023 ho explica:

“Primer mostra un conjunt divers de camins de raonament en lloc de prendre només el cobdiciós, i després selecciona la resposta més coherent marginant els camins de raonament mostrats. L’autocoherència aprofita la intuïció que un problema de raonament complex normalment admet múltiples maneres diferents de pensar que condueixen a la seva única resposta correcta”.

Models de doble procés en la cognició humana

Els investigadors s’inspiren en una teoria de com el pensament humà de decisions s’anomena models de procés dual en la cognició humana o teoria del procés dual.

Els models de procés dual en la cognició humana proposen que els humans participen en dos tipus de processos de presa de decisions, un que és intuïtiu i ràpid i un altre que és més deliberatiu i més lent.

  • Ràpid, automàtic, inconscient
    Aquest mode implica un pensament ràpid, automàtic i inconscient que sovint es diu que es basa en la intuïció.
  • Lent, Deliberat, Conscient
    Aquest mode de presa de decisions és un procés de pensament lent, deliberat i conscient que implica una consideració acurada, anàlisi i raonament pas a pas abans d’establir una decisió final.

El marc d’indicacions de l’Arbre de pensaments (ToT) utilitza una estructura d’arbre de cada pas del procés de raonament que permet al model de llenguatge avaluar cada pas del raonament i decidir si aquest pas del raonament és viable o no i condueixi a una resposta. Si el model lingüístic decideix que el camí del raonament no conduirà a una resposta, l’estratègia de sol·licitud obliga a abandonar aquest camí (o branca) i seguir avançant amb una altra branca, fins que arribi al resultat final.

Arbre de pensaments (ToT) versus cadena de pensaments (CoT)

La diferència entre ToT i CoT és que ToT té un marc d’arbre i branca per al procés de raonament, mentre que CoT pren un camí més lineal.

En termes senzills, CoT diu al model de llenguatge que segueixi una sèrie de passos per dur a terme una tasca, que s’assembla al model cognitiu del sistema 1 que és ràpid i automàtic.

ToT s’assembla al model cognitiu del sistema 2 que és més deliberatiu i li diu al model de llenguatge que segueixi una sèrie de passos però també que hi hagi un avaluador que intervingui i revisi cada pas i si és un bon pas seguir endavant i, si no, aturar-se i seguir. un altre camí.

Il·lustracions d’estratègies d’orientació

El document de recerca va publicar il·lustracions esquemàtiques de cada estratègia d’incitació, amb caixes rectangulars que representen un “pensament” dins de cada pas per completar la tasca, resoldre un problema.
A continuació es mostra una captura de pantalla de com és el procés de raonament de ToT:

Arbre de pensaments que demana millors resultats generatius d'IA

Il·lustració de la cadena de tot i que s’indica

Aquesta és la il·lustració esquemàtica de CoT, que mostra com el procés de pensament és més un camí recte (lineal):

Arbre de pensaments que demana millors resultats generatius d'IA

El document de recerca explica:

“La investigació sobre la resolució de problemes humans suggereix que la gent cerqui a través d’un espai de problemes combinatori: un arbre on els nodes representen solucions parcials i les branques corresponen als operadors.
que els modifiquen. Quina branca s’ha d’adoptar està determinada per les heurístiques que ajuden a navegar per l’espai del problema i guiar el solucionador de problemes cap a una solució.

Aquesta perspectiva destaca dues deficiències clau dels enfocaments existents que utilitzen LM per resoldre problemes generals:

1) A nivell local, no exploren diferents continuacions dins d’un procés de pensament: les branques de l’arbre.

2) A nivell global, no incorporen cap tipus de planificació, anticipació o retrocés per ajudar a avaluar aquestes diferents opcions, el tipus de cerca guiada per heurística que sembla característica de la resolució de problemes humans.

Per abordar aquestes deficiències, introduïm l’Arbre dels Pensaments (ToT), un paradigma que permet als LM explorar múltiples camins de raonament sobre pensaments…

Provat amb un joc matemàtic

Els investigadors van provar el mètode utilitzant un joc de matemàtiques Game of 24. El joc dels 24 és un joc de cartes matemàtiques on els jugadors utilitzen quatre números (que només es poden utilitzar una vegada) d’un conjunt de cartes per combinar-los mitjançant l’aritmètica bàsica (suma, resta, multiplicació i divisió) per aconseguir un resultat de 24.

Resultats i conclusions

Els investigadors van provar l’estratègia de sol·licitud de ToT contra els altres tres enfocaments i van trobar que produïa resultats constantment millors.

Tanmateix, també assenyalen que ToT pot no ser necessari per completar tasques en què GPT-4 ja fa bé.

Conclouen:

“El “Sistema 1” associatiu dels LM es pot augmentar de manera beneficiosa amb un “Sistema 2” basat en la recerca d’un arbre de possibles camins cap a la solució d’un problema.

El marc Tree of Thoughts proporciona una manera de traduir els coneixements clàssics sobre la resolució de problemes en mètodes accionables per als LM contemporanis.

Al mateix temps, els LM aborden una debilitat d’aquests mètodes clàssics, proporcionant una manera de resoldre problemes complexos que no es formalitzen fàcilment, com ara la creativitat.
escriptura.

Veiem aquesta intersecció de LM amb enfocaments clàssics de la IA com una direcció emocionant”.

Llegeix el document de recerca original:

Arbre de pensaments: resolució deliberada de problemes amb grans models lingüístics



Source link

Arbre de pensaments que demana millors resultats generatius d’IA