newsprogramy

AI Google potrafi już czytać z ruchu warg lepiej niż ludzie

Pamiętacie słynną scenę z Odysei Kosmicznej, w której HAL 9000 czytał z ruchu warg rozmowę załogi Discovery One? No to możemy podziękować Google, które właśnie tego nauczyło swoją sieć neuronową.

Zespół naukowców z należącego do Google DeepMind, we współpracy z naukowcami z Uniwersytetu Oksfordzkiego wykorzystał sztuczną inteligencję do opracowania najdokładniejszego jak do tej pory programu do czytaniu z ruchu warg. Opierając się na analizie tysięcy godzin nagrań telewizyjnych, naukowcom udało się osiągnąć trafność odczytu z ruchu warg na poziomie 46,8 procent.

Choć nie wydaje się, by było to dużo, dla porównania profesjonalny tłumacz z ruchu warg osiągnął na tym samym materiale skuteczność na poziomie 12,4 procent.

Niedawno podobna praca została opublikowana przez inny zespół z Oksfordu. Opracowany przez nich program o nazwie LipNet mógł szczycić się skutecznością na poziomie 93,4 procent (w porównaniu do 52,3 procent w przypadku kontrolnego odczytu przez ludzi), ale LipNet był testowany na specjalnych nagraniach przygotowanych z myślą o czytaniu z ruchu warg. Watch, Listen, Attend, and Spell, bo tak nazywa się program opracowany we współpracy z DeepMind, uczył się natomiast na ponad 5 tysiącach godzin nagrań zwykłych programów emitowanych w brytyjskiej telewizji, miał więc przed sobą dużo trudniejsze zadanie.


podobne treści


Logotomia.com.pl – Tworzymy grafikę użytkową dla firm i organizacji, wydarzeń i produktów.>>>



BrowarPerun.pl – Nowy browar rzemieślniczy!


Kolorydnia.pl – Blog kobiecy – kultura, rozrywka, fitness, lifestyle.