5 preguntes respostes sobre el motor de cerca OpenAI


Es va informar que OpenAI està treballant en un motor de cerca que desafiaria directament Google. Però els detalls que falten a l’informe plantegen preguntes sobre si OpenAI està creant un motor de cerca autònom o si hi ha un altre motiu per a l’anunci.

Informe de cerca web d’OpenAI

L’informe publicat el La informació relata que OpenAI està desenvolupant un producte de cerca web que competirà directament amb Google. Un detall clau de l’informe és que estarà impulsat en part per Bing, el motor de cerca de Microsoft. A part d’això, no hi ha altres detalls, inclòs si serà un motor de cerca autònom o s’integrarà a ChatGPT.

Tots els informes assenyalen que serà un repte directe per a Google, així que comencem per aquí.

1. El muntatge d’OpenAI és un repte per a Google?

Es diu que OpenAI utilitza la cerca de Bing com a part del motor de cerca que es rumoreja, una combinació d’un GPT-4 amb Bing Search, a més d’alguna cosa al mig per coordinar-se entre tots dos.

En aquest escenari, el que OpenAI no està fent és desenvolupar la seva pròpia tecnologia d’indexació de cerca, utilitza Bing.

Aleshores, el que falta per a OpenAI per crear un motor de cerca és idear com interactua la interfície de cerca amb GPT-4 i Bing.

I aquest és un problema que Bing ja ha resolt utilitzant el que Microsoft anomena una capa d’orquestració. Bing Chat utilitza la generació augmentada per la recuperació (RAG) per millorar les respostes afegint dades de cerca web per utilitzar-les com a context per a les respostes que crea GPT-4. Per obtenir més informació sobre com funciona l’orquestració i el RAG, mireu la conferència a l’esdeveniment Microsoft Build 2023 de Kevin Scott, director de tecnologia de Microsoft, a les 31:45 minuts. aquí).

Si OpenAI està creant un repte per a la Cerca de Google, què li queda exactament per fer a OpenAI que Microsoft encara no està fent amb Bing Chat? Bing és una tecnologia de cerca experimentada i madura, una experiència que OpenAI no té.

OpenAI desafia Google? Una resposta més plausible és que Bing està desafiant Google mitjançant OpenAI com a proxy.

2. OpenAI té l’impuls per desafiar Google?

ChatGPT és l’aplicació de creixement més ràpid de tots els temps, actualment amb uns 180 milions d’usuaris, aconseguint en dos mesos el que va trigar anys a Facebook i Twitter.

Tot i això, malgrat aquest avantatge, el lideratge de Google és un turó costerut perquè OpenAI pugi. Tingueu en compte que Google té aproximadament 3 a 4 mil milions usuaris de tot el món, eclipsant absolutament els 180 milions d’OpenAI.

Suposant que els 180 milions d’usuaris d’OpenAI realitzen una mitjana de 4 cerques al dia, el nombre diari de cerques podria arribar als 720 milions de cerques al dia.

Estadística estima que hi ha 6,3 milions de cerques a Google per minut, la qual cosa equival a més de 9.000 milions de cerques al dia.

Si OpenAI vol competir, hauran d’oferir un producte útil amb una raó convincent per utilitzar-lo. Per exemple, Google i Apple tenen una audiència captiva en un ecosistema de dispositius mòbils que els integra a la vida diària dels seus usuaris, tant a la feina com a casa. És bastant evident que no n’hi ha prou amb crear un motor de cerca per competir.

De manera realista, com pot OpenAI assolir aquest nivell d’ubiqüitat i utilitat?

OpenAI s’enfronta a una batalla difícil no només contra Google, sinó també contra Microsoft i Apple. Si comptem les aplicacions i els aparells d’Internet de les coses, afegiu Amazon a aquesta llista de competidors que ja tenen presència en milers de milions d’usuaris a la vida diària.

OpenAI no té l’impuls per llançar un motor de cerca per competir amb Google perquè no té l’ecosistema per suportar la integració en la vida dels usuaris.

3. L’OpenAI no té experiència en la recuperació d’informació

La cerca es coneix formalment com a Recuperació d’Informació (IR) en documents de recerca i patents. Cap quantitat de cerques al dipòsit d’articles de recerca d’Arxiv.org sortirà a la llum articles escrits per investigadors d’OpenAI relacionats amb la recuperació d’informació. El mateix es pot dir de la recerca de patents relacionades amb la recuperació d’informació (IR). OpenAI’s llista de treballs de recerca també no té estudis relacionats amb IR.

No és que OpenAI estigui sent secret. OpenAI té una llarga història de publicació d’articles de recerca sobre les tecnologies que estan desenvolupant. La investigació sobre IR no existeix. Aleshores, si l’OpenAI realment té previst llançar un repte a Google, on és el fum d’aquest incendi?

És una conjectura justa que la cerca no és una cosa que OpenAI està desenvolupant ara mateix. No hi ha indicis que fins i tot estigui coquetejant amb la construcció d’un motor de cerca, no hi ha res.

4. El motor de cerca OpenAI és un projecte de Microsoft?

Hi ha proves substancials que Microsoft està investigant furiós com utilitzar els LLM com a part d’un motor de cerca.

Tots els treballs de recerca següents es classifiquen com a pertanyents als camps de la recuperació d’informació (també conegut com a cerca), la intel·ligència artificial i la informàtica en llenguatge natural.

Aquests són alguns articles de recerca només del 2024:

Millora de l’anotació humana: aprofitant grans models de llenguatge i processament per lots eficient
Es tracta d’utilitzar la IA per classificar les consultes de cerca.

Extracció d’entitats estructurades utilitzant grans models de llenguatge
Aquest treball de recerca descobreix una manera d’extreure informació estructurada de text no estructurat (com ara pàgines web). És com convertir una pàgina web (dades no estructurades) en un format comprensible per màquina (dades estructurades).

Millorar les incrustacions de text amb models de llenguatge grans (Versió PDF aquí)
Aquest document de recerca analitza una manera d’aconseguir incrustacions de text d’alta qualitat que es poden utilitzar per a la recuperació d’informació (IR). Les incrustacions de text és una referència a la creació d’una representació del text d’una manera que els algorismes puguin utilitzar per comprendre els significats semàntics i les relacions entre les paraules.

El document de recerca anterior explica l’ús:

“Les incrustacions de text són representacions vectorials del llenguatge natural que codifiquen la seva informació semàntica. S’utilitzen àmpliament en diverses tasques de processament del llenguatge natural (PNL), com ara la recuperació d’informació (IR), la resposta a preguntes, etc. En el camp de la IR, la recuperació de la primera etapa sovint es basa en incrustacions de text per recordar de manera eficient un petit conjunt de documents candidats d’un corpus a gran escala utilitzant tècniques de cerca aproximades de veïns més propers”.

Hi ha més investigacions de Microsoft relacionades amb la cerca, però aquestes són les que es relacionen específicament amb la cerca juntament amb grans models de llenguatge (com GPT-4.5).

Seguir el rastre de les ratlles de pa porta directament a Microsoft com la tecnologia que alimenta qualsevol motor de cerca que se suposa que OpenAI està planejant… si aquest rumor és cert.

5. El rumor està destinat a robar el focus de Bessons?

El rumor que OpenAI està llançant un motor de cerca competidor es va publicar el 14 de febrer. L’endemà, 15 de febrer, Google va anunciar el llançament de Bessons 1.5després d’anunciar Gemini Avançat el 8 de febrer.

És una coincidència que l’anunci d’OpenAI va eclipsar completament l’anunci de Gemini l’endemà? El moment és increïble.

En aquest moment, el cercador OpenAI és només un rumor.

Imatge destacada de Shutterstock/rafapress



Source link

5 preguntes respostes sobre el motor de cerca OpenAI