Genialny algorytm Google'a powiększa zdjęcia. Aż nie chce się wierzyć, co potrafi
Upscaling, czyli powiększanie zdjęć, to nie lada zadanie. Dotychczas zachwycaliśmy się algorytmem zaimplementowanym w Adobe Photoshop, ale to już przeszłość. Google zaprezentowało SR3, czyli sztuczną inteligencję, która o powiększaniu obrazów wie wszystko i robi to doskonale!
31.08.2021 | aktual.: 31.08.2021 12:25
Nowy algorytm powiększania zdjęć nazywa się SR3, od Super Resolition (ang. Super Rozdzielczość). Google informuje, że został on wytrenowany na zbiorach danych pokazujących zdjęcia o małej rozdzielczości i dużej, na podstawie czego program nauczył się dodawać szczegóły podczas upscalingu.
SR3 jest pokłosiem prac rozpoczętych już w 2015 roku, gdy wykorzystywano metody głębokiego uczenia do generowania treści, rozpoznawaniach ich i przetwarzania – również graficznych. Dzięki rozumieniu tego, co jest na obrazie, algorytm potrafi wzbogacić powiększenie w istotne szczegóły, jak brwi, oczy, kosmyki włosów czy nawet zarost.
Google utrzymuje, że SR3 jest w stanie wygenerować dobrej jakości obraz na podstawie zlepku kilkuset pikseli, które układają się w jakiś kształt. W przypadku przetwarzania zdjęć portretowych, algorytm notuje współczynnik pomyłki na poziomie blisko 50 proc. pierwotnego obrazu, co według producenta wskazuje na umiejętność fotorealistycznego odtwarzania wyglądu osoby ze zdjęcia. Inne metody dostępne na rynku mają ten współczynnik zaledwie na poziomie 34 proc., co oznacza, że jedynie 1/3 pierwotnego zdjęcia zgadza się ze stanem faktycznym.
Interesująca jest nowa metoda powiększania obrazów (CDM), którą wykorzystuje SR3. Nie polega ona na tym, że z mikroskopijnego obrazka od razu robi duży, ale działa stopniowo. Przykładowo – pierwotne zdjęcie powiększa dwukrotnie, a następnie to, co wyszło kolejne dwa razy. Sekwencjonowanie upscalingu w tym przypadku polega na mnożeniu każdego kolejnego wyniku kilkukrotnie, aż do momentu otrzymania zadowalającego efektu.
Efekty wyglądają bardzo dobrze – nawet w porównaniu do algorytmu powiększania w Adobe Photoshop. Błędy oczywiście występują, ale można je zauważyć dopiero przy ekstremalnych zmianach. Google jest na doskonałej drodze do znacznego udoskonalenia wielkości obrazów. Jeśli zostałby on zaimplementowany do smartfonów marki Pixel, reszta rynku fotografii obliczeniowej na pewno poczułaby jak włos jeży się jej na karku.