Нейронные сети научили в точности воспроизводить любой голос HD

youtube 11.10.2017

В прошлом году компания DeepMind, занимающаяся разработками технологий искусственного интеллекта, поделилась деталями о своем новом проекте WaveNet – нейронной сети глубинного обучения, использующейся для синтезации реалистичной человеческой речи. На днях была выпущена усовершенствованная версия этой технологии, которая будет использоваться в качестве основы цифрового мобильного ассистента Google Assistant. Система голосового синтезирования (также известная как функция преобразования «текст-в-речь», text-to-speech, TTS) обычно строится на базе одного из двух основных методов. Конкатенативный (или компилятивный) метод подразумевает построение фраз путем сбора отдельных кусков записанных слов и частей, заранее записанных с привлечением актера озвучания. Основным недостатком такого метода является необходимость постоянной замены звуковой библиотеки всякий раз, когда происходят какие-нибудь обновления или вносятся изменения. Другой метод носит название параметрического TTS, и его особенностью является использование наборов параметров, с помощью которых компьютер генерирует нужную фразу. Минус метода в том, что чаще всего результат проявляется в виде нереалистичного или так называемого роботизированного звучания. Что же касается WaveNet, то она производит звуковые волны с нуля на базе системы, работающей на основе сверточной нейронной сети, где генерация звука происходит в несколько слоев. Сначала для тренировки платформы синтезации «живой» речи ей «скармливают» огромный объем образцов, при этом отмечая, какие звуковые сигналы звучат реалистично, а какие нет. Это наделяет голосовой синтезатор возможностью воспроизводить натуралистичную интонацию и даже такие детали, как чмокающие звуки губами. В зависимости от того, какие образцы речь прогоняются через систему, это позволяет ей развить уникальный «акцент», что в перспективе может использоваться для создания множества разных голосов. Остра на язык Пожалуй, самым большим ограничением системы WaveNet являлось то, что для ее работы требовалось наличие огромного объема вычислительной мощности, и даже при выполнении этого условия она не отличалась скоростью работы. Например, для генерации 0,02 секунды звука ей требовалось около 1 секунды времени. Спустя год работы инженеры DeepMind все-таки нашли способ, как улучшить и оптимизировать систему таким образом, что теперь она способна производить сырой звук длительностью в одну секунду всего на 50 миллисекунд, что в 1000 раз быстрее ее изначальных возможностей. Более того, специалистам удалось повысить частоту дискретизации звука с 8-битного до 16-битного, что положительно сказалось на тестах с привлечением слушателей. Благодаря этим успехам, для WaveNet была открыта дорога к интеграции в такие потребительские продукты, как Google Assistant. В настоящий момент WaveNet может использоваться для генерации английских и японских голосов через Google Assistant и все платформы, где используется этот цифровой ассистент. Так как система может создавать особый тип г

Нейронные сети научили в точности воспроизводить любой голос HD

Похожие видео

Нейронные сети научили в точности воспроизводить любой голос

Искусственный интеллект и нейронные сети C#. Машинное обучение для начинающих. Простая нейросеть.

Анализ качества обучения нейронной сети | Нейросети на Python

Введение | Глубокие нейронные сети на Python

Как Научиться Петь без Слуха и Голоса?

Я люблю еб@ться в Ж0ПУ... [ Юечка любит в попу ]

Превращаем в инфракрасный пульт, "любое устройство" IR remote infrared jack 3.5 Audio wav Arduino

Превращаем в инфракрасный пульт, "любое устройство" IR remote infrared jack 3.5 Audio wav Arduino

ГИТАРИСТ в ЧАТ РУЛЕТКЕ удивил ГОЛОСОМ | Лучшие реакции девушек @Хижина Музыканта

ГИТАРИСТ в ЧАТ РУЛЕТКЕ удивил ГОЛОСОМ | Лучшие реакции девушек by Хижина Музыканта ​

ГИТАРИСТ в ЧАТ РУЛЕТКЕ удивил ГОЛОСОМ | Лучшие реакции девушек @Хижина Музыканта

ГИТАРИСТ в ЧАТ РУЛЕТКЕ удивил ГОЛОСОМ | Лучшие реакции девушек @Хижина Музыканта

СКИДКИ В STEAM | КАК ПОЛУЧИТЬ СКИДКУ В СТИМЕ НА ЛЮБУЮ ИГРУ

Искусственный интеллект C#. Обучение нейронных сетей. Алгоритм обратного распространения ошибки

Нейронная Сеть Превратит Мир В АНИМЕ | AnimeGAN Python

Убийца с Искусственным Интеллектом. История вопроса. Что дальше Осень 2021 конференция в РФ.

Тайны сознания - бог в нейронах - исцеление онлайн +380632333987

Как эволюционировали нейросети и что они научились делать | Даниил Трабун, Яндекс Маркет

«Бог в нейронах». Теория всего от Атена.

Шумодав Clarity Vx Pro установка и тест плагина в Adobe Premiere Pro

Какая математика нужна в анализе данных? Для обучения нейронной сети?

КАК РАЗВИТЬ В СЕБЕ ХАРИЗМУ

СОЗДАНИЕ ПОЗИТИВНЫХ ИЗМЕНЕНИЙ В ВАШЕЙ ЖИЗНИ! [Семинар] Луиза Хей

УЧИСЬ СЕБЯ ЛЮБИТЬ! ★ Луиза Хей

СОЗДАНИЕ ПОЗИТИВНЫХ ИЗМЕНЕНИЙ В ВАШЕЙ ЖИЗНИ! ○ Луиза Хей

Ученые научились управлять нейронной сетью с помощью инфракрасного излучения

Как нейросети делают контент в 2020. Возможности искусственного интеллекта для работы с фото и видео

Научись петь за час. Евгений Койнов, семинар-мастер-класс 08.02.2015 Кременчуг

Научись петь за час. Евгений Койнов, семинар-мастер-класс 08.02.2015 Кременчуг

КАК БЫСТРО И ПРОСТО ИЗМЕНИТЬ СВОЙ ГОЛОС ТАК, КАК ТЫ ХОЧЕШЬ / Как пародировать голоса / Часть 1

КАК ПЕТЬ ВЫСОКИЕ НОТЫ :: Ariana Grande :: One last time :: Как поставить голос :: Диапазон голоса

КАК ПЕТЬ ВЫСОКИЕ НОТЫ :: Ariana Grande :: One last time :: Как поставить голос :: Диапазон голоса

ГИТАРИСТ в ЧАТ РУЛЕТКЕ удивил ГОЛОСОМ | Лучшие реакции девушек by Хижина Музыканта