Podejrzewam że to po prostu zwykła, dobrze rozbudowana sieć neuronowa, czyli pogram uczący się na podstawie swoich poprzednich wersji.
Zanim ją dopuścili do tego challengu to przepuścili X tysięcy podobnych rozmów i po prostu wybiera najbardziej "ludzką" odpowiedź, uwzględniając pytanie (rozpoznawanie mowy) i otoczenie (rozpoznawanie obrazu).
Zresztą sama zobacz co prymitywne AI zdziałało w 14 godzin
Ale... dlaczego Kizuna Ai ma być komputerem? Jej głos jest w 100% człowiekiem, z tego co widzę po internetach, to ludzie dobrze wiedzą, że to jest prawdziwa osoba za mikrofonem. To, co może być AI tutaj, to animacja podczas live streamów, która dopasowuje się (z opóźnieniem) do głosu, który leci przez mikrofon
Love178, też z początku myślałam, że ktoś sobie animu dziewczynkę generował i jej głos podkłada. Ale poczytałam i się okazało, że jednak nie. Wygenerowany wygląd, podano jej próbkę głosu i działa przy użyciu sztucznej inteligencji, tak ja w Internetach wyczytałam. I zaczęło mnie zastanawiać, jak ona działa.
- japoński jest na tyle specyficznym językiem, że bardzo łatwo aby coś brzmiało nienaturnalnie przez sam dobór słów, tu tego nie ma. W dodatku ona nie mówi normalnym japońskim tylko z manierą, że specjalnie przysładza - kto by spędzał czas na programowaniu głosu, który nawet nie może być uniwersalny, tylko pasuje do jednej postaci?
- momentami mówi ona bardzo szybko, komputer w tej sytuacji zacinałby głos, tu wszystko jest płynnie
- modulacja głośności głosu też wskazuje na mikrofon, słychać jak przy bardzo cichym mówieniu mikrofon nie wyłapuje dokładnie
- momentami głos jest zachrypnięty - skąd AI ma wiedzieć kiedy dokładnie zachrypnięty głos brzmi naturalnie? Nie mamy jeszcze takiej technologii
Najwyżej technologicznie są rozwinięte takie symulatory jak Siri czy Alexa - a jednak brzmią bardzo robotycznie. Nie wierzę, że ktoś w swoim prywatnym domu w Japonii stworzył generator głosu wyprzedzający o kilka dekad amerykańskie koncerny pchające w swoje AI miliony dolarów...
[ Dodano: 2018-06-21, 20:18 ]
Ona działa w ten sposób, że osoba, która podkłada jej głos posługuje się technologią motion tracking żeby poruszała ona ustami za nią, a generalnie jej model został stworzony dla niej przez kogoś... generalnie nie widzę informacji, jakoby to miał być w pełni komputerowy twór
Nie możesz pisać nowych tematów Nie możesz odpowiadać w tematach Nie możesz zmieniać swoich postów Nie możesz usuwać swoich postów Nie możesz głosować w ankietach Nie możesz załączać plików na tym forum Nie możesz ściągać załączników na tym forum