NVIDIA GauGAN2 ma tworzyć piękne obrazy z opisu. Przynajmniej w teorii
Firma NVIDIA będące producentem silników oraz kart graficznych pokazała światu udoskonaloną wersję swojej sztucznej inteligencji. GauGAN 2 to niezwykły program, który zamienia słowo w obraz i idzie mu to... różnie.
23.11.2021 | aktual.: 26.07.2022 14:18
Sztuczna inteligencja jest przyszłością fotografii – zarówno tej konwencjonalnej, obliczeniowej, jak i wirtualnej. Mówiąc o ostatniej dziedzinie, mamy na myśli generowanie cyfrowych obrazów, które wyglądają jak prawdziwe zdjęcia. W tej branży króluje firma NVIDIA i trudno się z tym nie zgodzić.
Algorytm GauGAN2 to ulepszona wersja silnika GauGAN AI. Wspominaliśmy o nim w kontekście projektu NVIDIA Canvas, który dotyczył malowania krajobrazów za pomocą prostych kolorów i kształtów. Wówczas sztuczna inteligencja odczytywała poszczególne barwy, jako konkretny element – drzewa, trawy, kamienie, góry, niebo etc.
Paint Me a Picture: NVIDIA Research Shows GauGAN AI Art Demo Now Responds to Words
Jeśli macie ochotę przetestować GauGAN2, możecie to zrobić za pośrednictwem specjalnej strony internetowej. Koniecznie zobaczcie, jak działa generowanie obrazów na podstawie wpisanych słów. O ile prostsze anglojęzyczne kombinacje nie są wyzwaniem dla algorytmu, to te bardziej skomplikowane nijak nie przypominają pierwotnego opisu.
Oto przykłady tego, co wpisaliśmy:
Jak widać – algorytm nie radzi sobie dobrze. Dostając konkretną informację, nie jest jej w stanie przetworzyć dokładnie. O ile faktycznie pojawiły się góry i miasto, tak ludzi na próżno tam szukać. Nad jeziorem nie widać zachodu słońca, zaś na łące nie ma czerwonych kwiatów. Wygląda trochę jakby ktoś chciał dobrze, a wyszło średnio.
Więcej o algorytmie przeczytacie na stronie internetowej NVIDIA.