Google face zoomul și îmbunătățirea fotografiilor o realitate

Probabil ați văzut filme fantasy sau emisiuni TV în care personajul principal cere să mărească imaginea și să îmbunătățească rezultatul - să arate o față, sau o plăcuță de înmatriculare sau orice alt detaliu cheie. Cele mai recente sisteme de inteligență artificială (AI) ale Google, bazate pe așa-numitele modele de difuzie, sunt capabili să efectueze acest truc.

Este un proces dificil de stăpânit, deoarece în esență se adaugă detalii la o imagine pe care camera nu a capturat-o inițial, folosind presupuneri super-inteligente bazate pe alte imagini similare.

Google

La Google, această tehnică se numește sinteza naturală a imaginii și, în acest scenariu special, rezoluție ultra-înaltă a imaginii. Începi cu o fotografie mică, pixelată și ajungi cu ceva clar, clar și natural. Poate că nu este exact originalul, dar este suficient de aproape pentru a părea real pentru ochiul uman.

Google a introdus două noi instrumente AI pentru acest job. Primul se numește SR3 sau Super-Rezoluție prin rafinare repetată și funcționează prin adăugarea de zgomot la o imagine și apoi eliminarea acesteia. Printr-o serie de calcule probabilistice bazate pe o bază de date mare de imagini și pe o magie de învățare automată, SR3 își poate imagina cum arată o versiune de super-înaltă rezoluție a unei imagini cu pixeli cu rezoluție joasă.

Al doilea instrument este CDM, sau modele de difuzie în cascadă. Google le descrie drept „conducte” de-a lungul cărora modelele de difuzie – inclusiv SR3 – pot fi direcționate pentru o creștere a imaginii de înaltă calitate. Este nevoie de modele îmbunătățite și le transformă în imagini mai mari.

Google

Prin utilizarea diferitelor modele de îmbunătățire la rezoluții diferite, abordarea CDM este capabilă să depășească metodele alternative de creștere a imaginii, potrivit Google. Noul motor AI a fost testat pe ImageNet, o bază de date uriașă de imagini de antrenament utilizate în mod obișnuit pentru cercetarea în recunoașterea vizuală a obiectelor.

Rezultatele finale ale SR3 și CDM sunt impresionante. Într-un test standard cu 50 de voluntari umani, imaginile cu fețe umane generate de SR3 au fost confundate cu fotografii reale în aproximativ 50% din timp – și având în vedere că un algoritm ideal ar trebui să atingă 50%, este impresionant. Merită să repetăm că aceste imagini îmbunătățite nu sunt potriviri exacte ale originalelor, ele sunt simulări atent calculate bazate pe matematica probabilității.

Google

Google promite mult mai mult din noile sale motoare AI și tehnologiile conexe - nu numai în ceea ce privește creșterea imaginilor fețelor și a altor obiecte naturale, ci și în alte domenii ale modelării probabilistice.

Citeste si:

Dzherelosciencealert

Inscrie-te

0 Comentarii

Recenzii încorporate

Vezi toate comentariile

Alte articole

Ca în filme: noua IA de procesare a fotografiilor de la Google face ca scalarea și îmbunătățirea acestora să devină realitate

Comentarii recente