DALL-E to sztuczna inteligencja, która wygeneruje niemal każdy obraz

DALL-E to sztuczna inteligencja, która wygeneruje niemal każdy obraz

DALL-E to sztuczna inteligencja, która wygeneruje niemal każdy obraz
Marcin Watemborski
08.01.2021 06:27, aktualizacja: 26.07.2022 14:35

Generowanie fotorealistycznych obrazów za sprawą sztucznej inteligencji to zagadnienie badane od wielu lat. Dotychczas wychodziło to przeważnie dość miernie, ale program DALL-E to swego rodzaju fenomen. Żeby uwierzyć, wystarczy zobaczyć efekty.

Firma OpenAI stworzyła program DALL-E, którego zadaniem jest generowanie obrazów na postawie wprowadzonego opisu. Opiera on się na algorytmie Generative Pre-trained Transformer 3, autorstwa tego samego producenta i bierze pod uwagę aż 12 miliardów zmiennych czynników.

DALL-E jest w stanie stworzyć ilustracje, zdjęcia, obrazy, szkice i rendery 3D. OpenAI chwali się jego niesamowitą dokładnością i umiejętnością rozumienia pisanego tekstu. W opisie programu znalazły się liczne przykłady, które po prostu wprawiają w osłupienie. Poniżej możecie zobaczyć, jak DALL-E rozumie frazę "fotel w kształcie awokado, fotel udający awokado".

Obraz

To, co robi sztuczna inteligencja OpenAI, nie jest niczym nowym w rozumieniu pomysłu, ale wyniki są zaskakująco dobre. Oczywiście nie brakuje przykładów, które wyszły inaczej, niż oczekiwaliby twórcy, lecz są one rzadkością. Wśród zbiorów wygenerowanych obrazów większość będzie spełniała założenia wpisanego tekstu.

Na stworzonych przez DALL-E obrazach pojawiają się artefakty. Mimo tego, że samo przetwarzanie słów działa naprawdę dobrze, to końcowe efekty znacznie odbiegają od prawdziwych zdjęć. Niektórym obiektom może brakować detali lub ostrości, za którą cenimy współczesne aparaty cyfrowe.

Oprócz tego, że algorytm potrafi wygenerować obiekt, jest w stanie zrozumieć sposób patrzenia na niego. Jeśli nakażemy mu stworzenie obrazu ukazującego interesujący nas przedmiot z danego kąta, to jest ogromne prawdopodobieństwo, że zobaczymy właśnie to, co nas interesuje. Poniżej możecie zobaczyć "żółwia siedzącego w lesie ukazanego przez obiektyw typu rybie oko". Nieźle, co?

Obraz

Techniczne szczegóły algorytmu i jego zaawansowany sposób działania poznacie, czytając oficjalną dokumentację OpenAI.

  • Slider item
[1/1]

[h4]Wybierz najlepszą technologię roku i wygraj 5 tys. złotych!Wejdź na [url=https://imperatory.wp.pl/strona-glowna]imperatory.wp.pl[/url] i zagłosuj.[/h4]

Źródło artykułu:WP Fotoblogia
Oceń jakość naszego artykułuTwoja opinia pozwala nam tworzyć lepsze treści.
Wybrane dla Ciebie
Komentarze (0)