Eina gratuïta d’anàlisi d’imatges de Google AI


Google ofereix una eina de classificació d’imatges d’IA que analitza les imatges per classificar-ne el contingut i assignar-hi etiquetes.

L’eina està pensada com una demostració de Google Visionque pot escalar la classificació d’imatges de manera automatitzada, però es pot utilitzar com a eina autònoma per veure com un algorisme de detecció d’imatges veu les vostres imatges i per a què són rellevants.

Fins i tot si no utilitzeu l’API de Google Vision per escalar la detecció i la classificació d’imatges, l’eina ofereix una visió interessant de què són capaços els algorismes de Google relacionats amb imatges, cosa que fa que sigui interessant penjar imatges per veure com les classifica l’algoritme de Google Vision. .

Aquesta eina demostra l’IA de Google i Aprenentatge automàtic algorismes per comprendre imatges.

És una part de Google Suite d’API Cloud Vision que ofereix models d’aprenentatge automàtic de visió per a aplicacions i llocs web.

L’eina Cloud Vision reflecteix l’algoritme de Google?

Aquest és només un model d’aprenentatge automàtic i no un algorisme de classificació.

Per tant, no és realista utilitzar aquesta eina i esperar que reflecteixi alguna cosa sobre l’algoritme de classificació d’imatges de Google.

No obstant això, és una gran eina per entendre com els algorismes d’IA i aprenentatge automàtic de Google poden entendre les imatges i oferirà una visió educativa de com d’avançats són els algorismes actuals relacionats amb la visió.

La informació proporcionada per aquesta eina es pot utilitzar per entendre com una màquina pot entendre de què tracta una imatge i possiblement proporcionar una idea de la precisió amb què la imatge encaixa el tema general d’una pàgina web.

Per què és útil una eina de classificació d’imatges?

Imatges pot tenir un paper important en la visibilitat de la cerca i CTR de les diferents maneres en què apareix el contingut de la pàgina web a Google.

Els visitants potencials del lloc que estan investigant un tema utilitzen imatges per navegar al contingut adequat.

Per tant, l’ús d’imatges atractives que siguin rellevants per a les consultes de cerca pot, en determinats contextos, ser útil per comunicar ràpidament que una pàgina web és rellevant per al que una persona està cercant.

L’eina Google Vision ofereix una manera d’entendre com un algorisme pot veure i classificar una imatge en funció del que hi ha a la imatge.

de Google directrius per a la imatge SEO recomana:

“Les fotos d’alta qualitat atrauen més als usuaris que les imatges borroses i poc clares. A més, les imatges nítides són més atractives per als usuaris a la miniatura del resultat i augmenten la probabilitat d’obtenir trànsit dels usuaris”.

Si l’eina Vision té problemes per identificar de què tracta la imatge, això pot ser un senyal que els visitants potencials del lloc també poden tenir els mateixos problemes i decidir no visitar el lloc.

Què és l’eina d’imatge de Google?

L’eina és una manera de demostrar l’API Cloud Vision de Google.

L’API Cloud Vision és un servei que permet que aplicacions i llocs web es connectin a l’eina d’aprenentatge automàtic, proporcionant serveis d’anàlisi d’imatges que es poden escalar.

L’eina autònoma us permet pujar una imatge i us indica com l’interpreta l’algoritme d’aprenentatge automàtic de Google.

Pàgina de Google Cloud Vision descriu com es pot utilitzar el servei així:

“Cloud Vision permet als desenvolupadors integrar fàcilment les funcions de detecció de visió a les aplicacions, com ara l’etiquetatge d’imatges, la detecció de cares i punts de referència, el reconeixement òptic de caràcters (OCR) i l’etiquetatge de contingut explícit”.

Aquestes són cinc maneres en què les eines d’anàlisi d’imatges de Google classifiquen les imatges penjades:

  1. Cares.
  2. Objectes.
  3. Etiquetes.
  4. Propietats.
  5. Cerca segura.

Cares

La pestanya “cares” ofereix una anàlisi de l’emoció expressada per la imatge.

La precisió d’aquest resultat és bastant precisa.

La imatge de sota és una persona descrita com a confusa, però això no és realment una emoció.

L’IA descriu l’emoció expressada a la cara com a sorpresa, amb una puntuació de confiança del 96%.

Google Image AIImatge composta creada per l’autor, juliol de 2022; imatges procedents de l’API de Google Cloud Vision i Shutterstock/Cast Of Thousands

Objectes

La pestanya “objectes” mostra quins objectes hi ha a la imatge, com ara ulleres, persona, etc.

L’eina identifica amb precisió els cavalls i les persones.

Captura de pantalla de l'eina Google VisionImatge composta creada per l’autor, juliol de 2022; imatges procedents de l’API de Google Cloud Vision i Shutterstock/Lukas Gojda

Etiquetes

La pestanya “etiquetes” mostra detalls sobre la imatge que Google reconeix, com les orelles i la boca, però també aspectes conceptuals com el retrat i la fotografia.

Això és especialment interessant perquè mostra fins a quin punt la IA d’imatge de Google pot entendre què hi ha en una imatge.

Captura de pantalla de l'IA de Google Vision que identifica objectes dins d'una foto penjadaImatge composta creada per l’autor, juliol de 2022; imatges procedents de l’API de Google Cloud Vision i Shutterstock/Lukas Gojda

Google ho fa servir com a part de l’algoritme de classificació? Això és una cosa que no se sap.

Propietats

Les propietats són els colors utilitzats a la imatge.

Captura de pantalla de l'eina Google Vision que identifica els colors dominants d'una imatgeCaptura de pantalla de l’API de Google Cloud Vision, juliol de 2022

A la superfície, el punt d’aquesta eina no és obvi i pot semblar que no té utilitat.

Però en realitat, els colors d’una imatge poden ser molt importants, especialment per a una imatge destacada.

Imatges que contenen una gamma de colors molt àmplia pot ser una indicació d’una imatge mal triada amb una mida inflada, cosa que cal tenir en compte.

Una altra visió útil sobre les imatges i el color és que les imatges amb un rang de colors més fosc tendeixen a donar lloc a fitxers d’imatge més grans.

Pel que fa al SEO, la secció de propietats pot ser útil per identificar imatges a tot un lloc web que es poden canviar per altres de menys grans.

A més, els intervals de color de les imatges destacades que estan silenciades o fins i tot en escala de grisos poden ser una cosa a tenir en compte perquè les imatges destacades que no tenen colors vius solen no aparèixer a les xarxes socials. Google Discoveri Google News.

Per exemple, les imatges destacades que són vívides es poden escanejar fàcilment i possiblement reben un percentatge de clics (CTR) més alt quan es mostren als resultats de la cerca o a Google Discover, ja que criden a la vista millor que les imatges silenciades i s’esvaeixen. al fons.

Hi ha moltes variables que poden afectar el rendiment del CTR de les imatges, però això proporciona una manera d’escalar el procés d’auditoria de les imatges d’un lloc web sencer.

eBay va dur a terme a estudi de les imatges del producte i CTR i va descobrir que les imatges amb colors de fons més clars tendien a tenir un CTR més alt.

Els investigadors d’eBay van assenyalar:

“En aquest document, trobem que les característiques de la imatge del producte poden tenir un impacte en el comportament de cerca dels usuaris.

Trobem que algunes característiques d’imatge tenen correlació amb el CTR en un motor de cerca de productes i que aquestes característiques poden ajudar a modelar la taxa de clics per a les aplicacions de cerca de compres.

Aquest estudi pot oferir als venedors un incentiu per enviar millors imatges dels productes que venen”.

De manera anecdòtica, l’ús de colors vius per a les imatges destacades pot ser útil per augmentar el CTR dels llocs que depenen del trànsit de Google Discover i Google News.

Òbviament, hi ha molts factors que afecten el CTR de Google Discover i Google News. Però una imatge que es distingeixi de les altres pot ser útil.

Per aquest motiu, utilitzar l’eina Vision per entendre els colors utilitzats pot ser útil per a una auditoria a escala de les imatges.

Cerca segura

Cerca segura mostra com es classifica la imatge per al contingut no segur. Les descripcions d’imatges potencialment insegures són les següents:

  • Adult.
  • Parodia.
  • Medicina.
  • Violència.
  • Raçat.

La cerca de Google té filtres que avaluen una pàgina web per si hi ha contingut insegur o inadequat.

Per això, la secció Cerca segura de l’eina és molt important perquè, si una imatge activa involuntàriament un filtre de cerca segura, és possible que la pàgina web no es classifiqui per als visitants potencials del lloc que cerquin el contingut a la pàgina web.

Anàlisi de la cerca segura de Google VisionCaptura de pantalla de l’API de Google Cloud Vision, juliol de 2022

La captura de pantalla de dalt mostra l’avaluació d’una foto de cavalls de carreres en una pista de curses. L’eina identifica amb precisió que no hi ha contingut mèdic o per a adults a la imatge.

Text: reconeixement òptic de caràcters (OCR)

Google Vision té una capacitat notable per llegir el text que es troba en una fotografia.

L’eina Vision és capaç de llegir amb precisió el text de la imatge següent:

Captura de pantalla de l'eina Vision llegint amb precisió el text d'una imatgeImatge composta creada per l’autor, juliol de 2022; imatges procedents de l’API de Google Cloud Vision i Shutterstock/Melissa King

Com es pot veure més amunt, Google té la capacitat (a través de Reconeixement òptic de caràcters, també conegut com OCR), per llegir paraules en imatges.

Tanmateix, això no és una indicació que Google utilitzi OCR per a la classificació de cerca.

El fet és que Google recomana l’ús de paraules al voltant de les imatges per ajudar-lo a entendre de què tracta una imatge i pot ser que fins i tot per a imatges amb text dins, Google encara depengui de les paraules que envolten la imatge per entendre quina és la imatge. tracta i rellevant per a.

de Google directrius sobre SEO d’imatges recalca repetidament l’ús de paraules per proporcionar context a les imatges.

“En afegir més context al voltant de les imatges, els resultats poden ser molt més útils, cosa que pot provocar un trànsit de major qualitat al vostre lloc.

… Sempre que sigui possible, col·loqueu imatges a prop del text rellevant.

…Google extreu informació sobre el tema de la imatge del contingut de la pàgina…

… Google utilitza el text alternatiu juntament amb algorismes de visió per ordinador i el contingut de la pàgina per entendre el tema de la imatge”.

A la documentació de Google queda molt clar que Google depèn del context del text al voltant de les imatges per entendre de què tracta la imatge.

Emportar

L’eina Vision AI de Google ofereix una manera de provar la Vision AI de Google perquè un editor pugui connectar-s’hi mitjançant una API i utilitzar-la per escalar la classificació d’imatges i extreure dades per utilitzar-les al lloc.

Però també proporciona una visió de fins a quin punt han arribat els algorismes per a l’etiquetatge d’imatges, l’anotació i el reconeixement òptic de caràcters.

Puja una imatge aquí per veure com està classificat i si una màquina ho veu de la mateixa manera que tu.

Més recursos:


Imatge destacada de Maksim Shmeljov/Shutterstock





Source link

Eina gratuïta d’anàlisi d’imatges de Google AI