DeepMind е самостоятелен отдел на Google, който работи в областта на ИИ. Именно тази компания създаде AlphaGo - системата, победила световния шампион по Го - корееца Ли Седол.
DeepMind не се занимава само с логически игри. В момента специалистите на компанията работят върху компютърна система за генериране на човешка реч. Използва се слаб ИИ, който според експертите може кардинално да подобри ситуацията с изкуствено синтезираната реч.
Компютрите и сега генерират човешка реч, като най-често се използват фрагменти от речта на реален човек, които образуват по-сложни отрязъци, или се използват най-разнообразни математически модели за генериране на звукови фрази. Но нито един от тези методи не е особено добър, понеже хората веднага забелязват изкуствените гласове и проблемите с интонацията и произношението.
WaveNet използва достойнствата и на двата метода. В новия модел също се използват фрагменти от реални човешки гласове, от които самообучаващи се невронни мрежи формират звуковите фрази. Но на тази система може да се подаде информация за лингвистичните и фонетични правила.
Резултатите са впечатляващи. Изкуственият глас звучи някак си човешки. При тестовете с доброволци, 50% от хората са сметнали, че гласът на машината всъщност е човешки.
Във WaveNet вече са записани над 44 часа човешка реч, а думите, звуците и фразите са на 109 различни хора. Оказа се, че WaveNet перфектно моделира гласа на всеки участник в експеримента и дори вмъква специфичното поемане на дъх и говорните дефекти на конкретния човек.