Dzięki algorytmowi Google, automatyczne podpisywanie i tagowanie zdjęć to tylko kwestia czasu

Dzięki algorytmowi Google, automatyczne podpisywanie i tagowanie zdjęć to tylko kwestia czasu27.09.2016 14:35

Opisywanie zdjęć i tworzenie słów kluczowych to dość mozolna praca. Każdy, kto pracuje na obszernej bibliotece obrazów, na pewno spotkał się z tym zadaniem i niejednokrotnie na nie narzekał. Dzięki opracowanemu przez Google algorytmowi stanie się to o wiele łatwiejsze i szybsze.

Słowa kluczowe i poprawne podpisanie zdjęcia jest podstawowym zadaniem, które musi wykonać każdy, kto kataloguje zdjęcia w bazie obrazów. Umożliwia to ich łatwiejsze wyszukanie oraz, co za tym idzie – sprzedaż. Od tego zależy, do ilu potencjalnych klientów trafi dana fotografia.

Jako fotoreporter musiałem się zmagać z podpisywaniem zdjęć wg. standardów IPTC. Dwa pola spędzały mi sen z powiek niejednokrotnie – opis zdjęcia oraz słowa kluczowe. Mimo częściowej automatyzacji i stworzenia bazy tagów i tak zabierało to więcej czasu, niż powinno.

Algorytm Google o nazwie „Show and Tell” jest open-source’owym kodem, który każdy z nas może poddać treningowi w rozpoznawaniu i opisywaniu obrazów. Gigant medialny pracuje nad tym rozwiązaniem od kilku dobrych lat. Na obecnym poziomie maszyna potrafi zinterpretować i poprawnie podpisać obraz na poziomie 93,9%, co jest naprawdę zdumiewającym wynikiem.

Można zaryzykować stwierdzenia, że obecnie uczymy sztuczną inteligencję „widzieć” zdjęcia oraz je opisywać, co jakiś czas temu było jeszcze nie do pomyślenia. 10 lat temu nie mogliśmy sobie wyobrazić, że maszyna, po wgraniu zdjęcia, będzie w stanie powiedzieć, że widzi na nim „osobę puszczającą latawiec na plaży”.

Rozpoznawanie obrazów polega na zaimplementowaniu odpowiedniego algorytmu, który uczy się, dzięki ludzkiemu treningowi. Sztuczna inteligencja interpretuje zdjęcia na podstawie pokazania jej określonej sceny oraz podpisania jej we właściwy sposób. Zdjęcia podobne do tego wgranego zostaną poprawnie „zrozumiane” przez maszynę bez większego problemu.

Google ma nadzieję, że dzięki udostępnieniu kodu źródłowego, technologia pójdzie do przodu. Patrząc na to z perspektywy fotografa – niebawem może nam to znacznie ułatwić pracę na polu poprawnego, automatycznego opisywania zdjęć oraz dobierania słów i fraz kluczowych. Nie będziemy musieli się już przedzierać przez setki stworzonych przez nas wyrazów, by odpowiednio skategoryzować zdjęcie.

Drugim zastosowaniem, które widzę dla tej technologii, jest ułatwienie dostępu do treści wyświetlanych w Internecie dla osób niewidzących. Jeśli technologia ta dalej będzie się tak prężnie rozwijała, to w połączeniu z Google Voice osoby z problemami ze wzrokiem nie będą dłużej potrzebowały asystentów i będą bardziej niezależne w korzystaniu z nowych mediów. Mam szczerą nadzieję, że rozwój algorytmu pójdzie właśnie w tym kierunku.

Niestety, rozpoznawanie obrazów działa natywnie w języku angielskim, ale z drugiej strony – co to za problem dla Google, skoro jest automatyczny tłumacz. Jeśli twórcy rozwiną umiejętność programu do rozumienia kontekstów, zyskamy potężne narzędzie, które umożliwi bezproblemową komunikację ludzi na całym świecie.

Szanowna Użytkowniczko! Szanowny Użytkowniku!
×
Aby dalej móc dostarczać coraz lepsze materiały redakcyjne i udostępniać coraz lepsze usługi, potrzebujemy zgody na dopasowanie treści marketingowych do Twojego zachowania. Twoje dane są u nas bezpieczne, a zgodę możesz wycofać w każdej chwili na podstronie polityka prywatności.

Kliknij "PRZECHODZĘ DO SERWISU" lub na symbol "X" w górnym rogu tej planszy, jeżeli zgadzasz się na przetwarzanie przez Wirtualną Polskę i naszych Zaufanych Partnerów Twoich danych osobowych, zbieranych w ramach korzystania przez Ciebie z usług, portali i serwisów internetowych Wirtualnej Polski (w tym danych zapisywanych w plikach cookies) w celach marketingowych realizowanych na zlecenie naszych Zaufanych Partnerów. Jeśli nie zgadzasz się na przetwarzanie Twoich danych osobowych skorzystaj z ustawień w polityce prywatności. Zgoda jest dobrowolna i możesz ją w dowolnym momencie wycofać zmieniając ustawienia w polityce prywatności (w której znajdziesz odpowiedzi na wszystkie pytania związane z przetwarzaniem Twoich danych osobowych).

Od 25 maja 2018 roku obowiązuje Rozporządzenie Parlamentu Europejskiego i Rady (UE) 2016/679 (określane jako "RODO"). W związku z tym chcielibyśmy poinformować o przetwarzaniu Twoich danych oraz zasadach, na jakich odbywa się to po dniu 25 maja 2018 roku.

Kto będzie administratorem Twoich danych?

Administratorami Twoich danych będzie Wirtualna Polska Media Spółka Akcyjna z siedzibą w Warszawie, oraz pozostałe spółki z grupy Wirtualna Polska, jak również nasi Zaufani Partnerzy, z którymi stale współpracujemy. Szczegółowe informacje dotyczące administratorów znajdują się w polityce prywatności.

O jakich danych mówimy?

Chodzi o dane osobowe, które są zbierane w ramach korzystania przez Ciebie z naszych usług, portali i serwisów internetowych udostępnianych przez Wirtualną Polskę, w tym zapisywanych w plikach cookies, które są instalowane na naszych stronach przez Wirtualną Polskę oraz naszych Zaufanych Partnerów.

Dlaczego chcemy przetwarzać Twoje dane?

Przetwarzamy je dostarczać coraz lepsze materiały redakcyjne, dopasować ich tematykę do Twoich zainteresowań, tworzyć portale i serwisy internetowe, z których będziesz korzystać z przyjemnością, zapewniać większe bezpieczeństwo usług, udoskonalać nasze usługi i maksymalnie dopasować je do Twoich zainteresowań, pokazywać reklamy dopasowane do Twoich potrzeb. Szczegółowe informacje dotyczące celów przetwarzania Twoich danych znajdują się w polityce prywatności.

Komu możemy przekazać dane?

Twoje dane możemy przekazywać podmiotom przetwarzającym je na nasze zlecenie oraz podmiotom uprawnionym do uzyskania danych na podstawie obowiązującego prawa – oczywiście tylko, gdy wystąpią z żądaniem w oparciu o stosowną podstawę prawną.

Jakie masz prawa w stosunku do Twoich danych?

Masz prawo żądania dostępu, sprostowania, usunięcia lub ograniczenia przetwarzania danych. Możesz wycofać zgodę na przetwarzanie, zgłosić sprzeciw oraz skorzystać z innych praw wymienionych szczegółowo w polityce prywatności.

Jakie są podstawy prawne przetwarzania Twoich danych?

Podstawą prawną przetwarzania Twoich danych w celu świadczenia usług jest niezbędność do wykonania umów o ich świadczenie (tymi umowami są zazwyczaj regulaminy). Podstawą prawną przetwarzania danych w celu pomiarów statystycznych i marketingu własnego administratorów jest tzw. uzasadniony interes administratora. Przetwarzanie Twoich danych w celach marketingowych realizowanych przez Wirtualną Polskę na zlecenie Zaufanych Partnerów i bezpośrednio przez Zaufanych Partnerów będzie odbywać się na podstawie Twojej dobrowolnej zgody.