Sztuczna inteligencja sprawia, że twarze na zdjęciach są wyraźniejsze

Redakcja NTL
NTL
31.07.2020
Przewidywany czas: 2 min

Narzędzie oparte na sztucznej inteligencji (AI), które zamienia rozmyte zdjęcia ludzi w ostre portrety z dużo większą liczbą szczegółów niż dotychczas, opracowali naukowcy z amerykańskiego Duke University.

Poprzednie metody umożliwiały wyostrzenie zdjęć o osiem razy w stosunku do oryginalnej rozdzielczości. Jednak specjaliści z Duke opracowali system PULSE, który z niewielkiej liczby pikseli może stworzyć realistyczne twarze, zwiększając rozdzielczość aż 64 razy i dodając szczegóły takie jak zmarszczki, rzęsy czy zarost.

„Nigdy wcześniej nie tworzono zdjęć o tak wysokiej rozdzielczości z podobną dokładnością” – powiedziała informatyk Cynthia Rudin, która prowadziła zespół badawczy.

Systemu nie można wykorzystywać do identyfikowania ludzi. Nie zamieni on nieostrego zdjęcia z kamery przemysłowej w wyraźny wizerunek prawdziwej osoby. Jest raczej zdolny do generowania nowych, nieistniejących twarzy, wyglądających jak prawdziwe.

Choć naukowcy skupili się na ludzkich twarzach, to ta sama technika mogłaby przydać się do wyostrzania niemal wszystkich niedoskonałych ujęć i tworzenia realistycznych obrazów – czy to w medycynie lub mikroskopii, czy też w astronomii i obrazowaniu satelitarnym.

Tradycyjne metody poprawiania obrazów o niskiej rozdzielczości skupiają się na „zgadywaniu”, jakie piksele należałoby do nich wstawić. Dzieje się to w oparciu o zdjęcia o wysokiej rozdzielczości, na podstawie których system wcześniej się uczył. W wyniku takiego uśredniania niektóre elementy zdjęcia mogą być wciąż niewyraźne i mało realistyczne.

Zespół z Duke zaproponował inne rozwiązanie. Zamiast dodawać kolejne szczegóły do obrazu o niskiej rozdzielczości, system przeszukuje wygenerowane przez AI przykłady wizerunków w wysokiej rozdzielczości i sprawdza, które wyglądałyby podobnie po zmniejszeniu ich do rozmiaru wyjściowego zdjęcia. System pracuje na bazie dwóch sieci neuronowych.

Badacze poprosili grupę 40 osób, aby oceniła ponad 1,4 tys. zdjęć wygenerowanych przez ich system i pięć innych narzędzi. Rozwiązanie zespołu uzyskało najwyższe noty.

Narzędzie zostało zaprezentowane na ubiegłotygodniowej konferencji online 2020 Conference on Computer Vision and Pattern Recognition (CVPR).

 

PAP – Nauka w Polsce

Zobacz również

Podcasty NTL