NVIDIA GauGAN2 ma tworzyć piękne obrazy z opisu. Przynajmniej w teorii

NVIDIA GauGAN2 ma tworzyć piękne obrazy z opisu. Przynajmniej w teorii

NVIDIA GauGAN2 ma tworzyć piękne obrazy z opisu. Przynajmniej w teorii
Marcin Watemborski
23.11.2021 14:54, aktualizacja: 26.07.2022 14:18

Firma NVIDIA będące producentem silników oraz kart graficznych pokazała światu udoskonaloną wersję swojej sztucznej inteligencji. GauGAN 2 to niezwykły program, który zamienia słowo w obraz i idzie mu to... różnie.

Sztuczna inteligencja jest przyszłością fotografii – zarówno tej konwencjonalnej, obliczeniowej, jak i wirtualnej. Mówiąc o ostatniej dziedzinie, mamy na myśli generowanie cyfrowych obrazów, które wyglądają jak prawdziwe zdjęcia. W tej branży króluje firma NVIDIA i trudno się z tym nie zgodzić.

Algorytm GauGAN2 to ulepszona wersja silnika GauGAN AI. Wspominaliśmy o nim w kontekście projektu NVIDIA Canvas, który dotyczył malowania krajobrazów za pomocą prostych kolorów i kształtów. Wówczas sztuczna inteligencja odczytywała poszczególne barwy, jako konkretny element – drzewa, trawy, kamienie, góry, niebo etc.

Paint Me a Picture: NVIDIA Research Shows GauGAN AI Art Demo Now Responds to Words

Jeśli macie ochotę przetestować GauGAN2, możecie to zrobić za pośrednictwem specjalnej strony internetowej. Koniecznie zobaczcie, jak działa generowanie obrazów na podstawie wpisanych słów. O ile prostsze anglojęzyczne kombinacje nie są wyzwaniem dla algorytmu, to te bardziej skomplikowane nijak nie przypominają pierwotnego opisu.

Oto przykłady tego, co wpisaliśmy:

Miasto na tle wysokich gór z mnóstwem ludzi.Mountains in the background of a crowded city.
Miasto na tle wysokich gór z mnóstwem ludzi.Mountains in the background of a crowded city.
Zachód słońca nad wielkim jeziorem.A susnset over a big lake.
Zachód słońca nad wielkim jeziorem.A susnset over a big lake.
Łąka pełna czerwonych kwiatów.A meadow full of red flowers.
Łąka pełna czerwonych kwiatów.A meadow full of red flowers.

Jak widać – algorytm nie radzi sobie dobrze. Dostając konkretną informację, nie jest jej w stanie przetworzyć dokładnie. O ile faktycznie pojawiły się góry i miasto, tak ludzi na próżno tam szukać. Nad jeziorem nie widać zachodu słońca, zaś na łące nie ma czerwonych kwiatów. Wygląda trochę jakby ktoś chciał dobrze, a wyszło średnio.

Więcej o algorytmie przeczytacie na stronie internetowej NVIDIA.

Źródło artykułu:WP Fotoblogia
Oceń jakość naszego artykułuTwoja opinia pozwala nam tworzyć lepsze treści.
Wybrane dla Ciebie
Komentarze (0)