Algorytm przetwarza zdjęcia turystów i tworzy z nich trójwymiarowe animowane obrazy
12.08.2020 09:32, aktual.: 26.07.2022 14:47
Zalogowani mogą więcej
Możesz zapisać ten artykuł na później. Znajdziesz go potem na swoim koncie użytkownika
Programiści z Google nie przestają zaskakiwać. Za każdym razem, gdy przedstawiają coś nowego, patrzymy na to z zapartym tchem. Tym razem wzięli na warsztat ogromną bazę danych zdjęć turystów i zrobili z nich animowany model 3D. Jak wygląda? Genialnie!
Naukowcy, programiści i inżynierowie pracujący w Google robią coś dobrze albo wcale. Właśnie udowodnili to po raz kolejny. Wszystko zaczęło się od tysięcy zdjęć, na podstawie których został wyszkolony algorytm sztucznej inteligencji.
Na zdjęciach autorstwa turystów można zobaczyć jeden obiekt pod różnymi kątami i z różnym oświetleniem. To doskonały materiał do maszynowego uczenia. Dzięki ogromnej bazie danych, algorytm był w stanie zrozumieć, jaką budowę ma obiekt i odtworzyć go jako trójwymiarowy model.
NeRF in the Wild: Neural Radiance Fields for Unconstrained Photo Collections
Mimo tego, że fotografie miały bardzo zróżnicowaną estetykę i dodatkowe elementy, jak samochody czy ludzie, sztuczna inteligencja skoncentrowała się na stałym obiekcie. "NeRF in the Wild" (NeRF-W), jak nazywa się system, spisuje się bardzo dobrze. Wszystko to dzięki punktom zaczepienia odtwarzanego obiektu – są one tak powtarzalne na wszystkich zdjęciach, że bez większego problemu NeRF -W wygenerował rendery.
Badacze z Google informują, że NeRF-W znajdzie zastosowanie w technologiach rozszerzonej rzeczywistości (AR) oraz wirtualnej rzeczywistości (VR). Patrząc na to, że to właściwie początek prac nad algorytmem, w przyszłości możemy spodziewać się wykorzystania go w grach wideo, filmach czy tworzeniu wirtualnych wycieczek po różnych zakątkach świata. Czyżby szykowała się nowa odsłona Google Earth? Musimy poczekać na to, co przyniesie przyszłość.
Pełna dokumentacja jest dostępna na stronie projektu, natomiast więcej trójwymiarowych filmików przedstawiających Fontannę di Trevi, Bramę Brandenburską czy Bazylikę Sacre-Coeur znajdziecie na GitHubie.