Sztuczna inteligencja lepiej opisuje zdjęcia niż ludzie. Zaskoczeni?
Microsoft zaprezentował nowy algorytm sztucznej inteligencji, który zajmuje się opisywaniem zdjęć. O dziwo robi to lepiej i dokładniej niż ludzie. Może to znacznie pomóc niewidomym w rozumieniu treści internetowych i nie tylko. A z drugiej strony – czy właśnie nie rodzi się nam prawdziwy Skynet?
15.10.2020 | aktual.: 26.07.2022 14:42
Jeśli oglądaliście kiedyś "Terminatora" to na pewno Skynet nie jest wam obcy. Ten fikcyjny antagonista był w rzeczywistości bardzo, ale to bardzo zaawansowaną sztuczną inteligencją. Cóż, wygląda na to, że ta prawdziwa SI staje się coraz mądrzejsza, czego przykładem jest nowy algorytm Microsoftu.
Nowa sztuczna inteligencja giganta systemów operacyjnych ma proste zadanie – opisywać tekstem obrazki, które zostaną jej dostarczone. Niby nic takiego, ale jednak to ogromny krok naprzód. Rzecz w tym, że jest dokładniejsza niż ludzie i potrafi bardzo dobrze analizować to, co widzi.
Microsoft AI breakthrough in automatic image captioning
Jak to w przypadku programów komputerowych bywa i ten nie jest idealny. Zdarza mu się pomylić, aczkolwiek jeśli trafi, to robi to dobrze. W porównaniu do poprzedniej wersji, jest znacznie lepiej i dokładniej, co widać na powyższym filmie. Przykładowo – wcześniej SI opisywała obrazek kota słowami: "zbliżenie kota"; teraz dowiemy się, że na zdjęciu jest "szary kot z zamkniętymi oczami". Nieźle, co?
Saqib Shaikh zarządzający grupą inżynierów oprogramowania w Microsofcie tłumaczy, że doskonałym działaniem byłoby wprowadzenie algorytmu do wszelkiego rodzaju treści wizualnych, w tym do mediów społecznościowych, by osoby niewidome były na bieżąco i nic ich nie omijało. Dodatkowo można by było połączyć tę sztuczną inteligencję z programami, które automatycznie uzupełniają luki w tekście, tworząc zdania mające sens. Dzięki temu niewidomi mogliby otrzymać rzetelne informacje na temat treści w internecie, podane w przystępny sposób.
Sukces algorytmu doprowadził do tego, że Microsoft zintegrował go z usługami Azure Cognitive Services, by programiści zaczęli go wdrażać. Póki co – nie widać zagrożeń rodem z filmów science-fiction, a pomoc dla osób niewidomych i niedowidzących.
Więcej o programie przeczytacie na blogu Microsoftu.