Slike na web sajtovima više nisu samo vizuelna dopuna teksta. U eri veštačke inteligencije, one postaju izvor informacija koji se analizira, tumači i rangira gotovo isto kao i pisani sadržaj. Savremeni AI sistemi ne gledaju slike samo “očima korisnika”, već ih razlažu, čitaju i povezuju sa kontekstom cele stranice.

U nastavku teksta donosimo pregled ključnih principa optimizacije slika u savremenom, AI-orijentisanom SEO okruženju.

KAKO JE BILO DO SADA?

Iskusni web dizajneri i SEO stručnjaci znaju da su slike mač sa dve oštrice - povećavaju angažovanje korisnika, ali mogu negativno da utiču na brzinu učitavanja i stabilnost stranice.

Zato je optimizacija slika godinama bila pre svega tehnički zadatak, koji je uključivao:

·     kompresiju JPEG fajlova kako bi se učitavanje ubrzalo i zadovoljili nestrpljivi posetioci.

·     kreiranje alt teksta radi pristupačnosti

·     implementaciju “lazy loading-a” kako bi se slike učitavale postepeno tokom skrolovanja, i time poboljšali LCP i UX metrički pokazatelji.

Ove prakse su i dalje važne, ali više nisu dovoljne.

ŠTA SE PROMENILO?

Sa pojavom velikih multimodalnih modela (poput ChatGPT-a i Gemini-ja) - pravila se menjaju. Slike se više ne procenjuju samo prema tome kako izgledaju korisnicima, već i prema tome kako ih „vidi“ mašina. Drugim rečima, SEO se postepeno pomera sa same brzine učitavanja i estetike - ka razumljivosti i semantičkoj jasnoći za AI sisteme.

Ako slika nije jasna, ako je rezolucija loša, ili ako tekst na slici nije čitljiv, AI može pogrešno da je protumači. A takve greške direktno utiču na vidljivost sadržaja u pretrazi.

ČITLJIVOST NA NIVOU PIKSELA (VIZUELNA TOKENIZACIJA)

Za velike jezičke modele (LLM) - slike, video i audio su važni izvori podataka. Pomoću tehnike koja se zova vizuelna tokenizacija oni dele slike na male delove, poput mreže kvadrata, i svaki deo se pretvara u niz brojeva (vektora), koje AI može da razume. 

Ovaj pristup omogućava da veštačka inteligencija “vidi” sliku kao celinu i interpretira je slično kao da je rečenica. Ako je slika previše kompresovana ili mutna, ti vizuelni „tokeni“ postaju nejasni. 

Posledica toga može biti:

·     pogrešno prepoznavanje objekata

·     „izmišljanje“ detalja koji ne postoje

·     potpuno pogrešno razumevanje sadržaja slike.


ALT TEKST KAO SIDRO

U savremenom SEO-u, alt tekst više nije obična tehnička obaveza i mesto za ubacivanje ključnih reči. Za AI sisteme, on ima ulogu semantičkog pojašnjenja; objašnjava šta je na slici i zašto je važno (naročito kada je slika nejasna).

Dobro napisan alt tekst pomaže AI-u naročito kada slika:

·     može da se tumači na više načina

·     sadrži složene elemente ili tekst

·     ima simboličko ili kontekstualno značenje.

Kvalitetan alt tekst sadrži:

·     kakvo je osvetljenje (prirodno, studijsko, tamno)

·     kako su elementi raspoređeni

·     koji se tekst vidi na samom predmetu ili u kadru.

Alt tekst više nije samo niz ključnih reči (keyword stuffing), već opisna podrška. Ako slika prikazuje "ženu koja trči", a alt tekst kaže "najbolje patike za trčanje prodaja", AI će primetiti neslaganje između onoga što vidi na slici i onoga što piše u kodu.

OCR (OPTIČKO PREPOZNAVANJE TEKSTA) – MESTO GDE ČESTO DOLAZI DO GREŠAKA

AI alati koriste OCR tehnologiju da bi pročitli tekst sa slika. To znači da kvalitet vizuelnog prikaza postaje vaoma važan faktor za razumevanje sadržaja.

Softverski paketi poput Google Lens-a i Gemini-ja koriste optičko prepoznavanje teksta da bi sa slika pročitali sastojke proizvoda, njegove karakteristike, deklaracije, uputstva za upotrebu, itd. To im daje mogućnost da odgovare na složena korisnička pitanja, čak i kada na web stranici nema klasičnog teksta.

Iz prakse se izdvajaju sledeća pravila:

·     Visina slova bi trebalo da bude najmanje 30 piksela,

·     Kontrast između teksta i pozadine mora biti jasan (preporučuje se minimum 40 nijansi sive razlike),

·     Izbegavati dekorativne fontove i reflektujuće površine zbog potencijalnih grešaka (na primer malo slovo „i“ može da se pročita kao „1“).

Ukoliko je tekst presitan ili kontrast preslab, AI ga ne prepoznaje dovoljno dobro. To vodi ka pogrešnom tumačenju informacija, “izmišljanju “ podataka (hallucination) ili potpunog izostavljanja proizvoda u rezultatima pretrage (što je verovatno najgori ishod).

ORIGINALNOST KAO SIGNAL STVARNOG ISKUSTVA

Originalne slike više nisu samo estetska prednost, već merljiv signal kvaliteta i snažan signal za pretraživače.

Google putem opcije Web Detection može da utvrdi da li se ista slika već pojavljuje na drugim sajtovima i stranicama. Ukoliko je određena stranica prva indeksirana i sadrži jedinstvene vizuelne elemente (poseban ugao fotografisanja, intenzitet svetlosti i sl), prepoznaje se kao originalan izvor, znak stvarnog iskustva i uloženog truda

Takav sadržaj dobija već skor i bolje se pozicionira u SERP-u.

ANALIZA KONTEKSTA I ZAJEDNIČKOG POJAVLJIVANJA

AI ne prepoznaje samo jedan objekat na slici, već i odnos između svih prisutnih elemenata. Ovaj kontekst, koji se naziva product adjacency, koristi se za procenu brenda, njegove vrednosti i ciljne publike.

Evo jednog primera:

·     kožni kaiš pored starinskog mesinganog kompasa sugeriše sofisticiranost, i bezvremensku eleganciju

·     međutim, ako se pored istog kaiša stavi limenka energetskog pića, vizuelna priča je drugačija, jeftinija, masovnija, a percepcija vrednosti proizvoda opada.

Softver može da identifikuje predmete kao što su kaiš, limenka, kompas, itd, ali ne zna kakav je njihov kontekst. Autor mora sam da utvrdi - da li objekti na slici šalju istu poruku kao sam brend.


KVANTIFIKOVANJE EMOCIONALNOG UTISKA

Savremeni AI sistemi mogu da prepoznaju osnovne emocije na ljudskim licima, poput sreće, tuge, iznenađenja, itd. Emocija prikazana na fotografiji utiče na to da li se slika smatra relevantnom u odnosu na korisničku nameru.

Ako se, na primer, prodaje vesela letnja garderoba, a modeli deluju ozbiljno ili ravnodušno, AI može da zaključi da slika ne odgovara nameni sadržaja. Daće joj manju težinu i manju važnost u pretrazi.

Pogrešna emocija znači slab signal iako se radi o dobrom proizvodu. Da bi procena bila tačna, AI mora jasno da “vidi” lice. Ako je ono premalo, mutno, u senci, okrenuto sa strane i slično, procena emocije postaje nepouzdana.

NA KRAJU...

Slike, video klipovi i ostali vizuelni sadržaji više nisu sporedni dodatak web sajtova, već njihov važan deo. Prema njima se web dizajneri moraju odnositi sa istim uredničkim i strateškim kriterijumima kao i prema tekstu. 

U eri veštačke inteligencije, optimizacija slika više nije samo tehničko pitanje veličine fajla ili brzine učitavanja, već proces kojim se vizuelni sadržaj čini razumljivim i ljudima i mašinama.

Granica između slike i reči se briše, jer slike se sve češće obrađuju kao deo jezičkog niza. U tom kontekstu, kvalitet, jasnoća i semantička preciznost piksela postaju jednako važni kao i ključne reči na stranici, jer direktno utiču na to kako AI sistemi tumače, rangiraju i povezuju sadržaj.

Kako vi pristupate optimizaciji slika u ovom kontekstu? Da li ste već primetili promene u načinu na koji AI i pretraživači „čitaju“ vaš vizuelni sadržaj? Podelite svoja iskustva i mišljenja sa nama u komentarima ispod teksta. Hvala!

 

Slike: AI

Autor: Nenad Savić