Новинки deep learning. Часть 2: Trusted Media Challenge, HeSeR и Tortoise-tts

Продолжаем обзор интересных работ в области глубокого обучения. На очереди — создание и распознавание дипфейков, плюс новый способ генерации речи по заданному тексту. Читать далее…

Telegram Premium отправляет голосовые сообщения клиентов в сервисы Google

Буду краток. На днях Телеграм выкатил премиум-подписку и Дуров высказался за все хорошее, мол цитата: «This will herald a new, user-centric era in the history of social media services».Сейчас я случайно натолкнулся на пункт 7.4 Terms of Service Телегра…

Синхронный вывод на экран распознаваемого текста на Flutter

В статье хочу поделиться опытом создания легкого приложения, которое синхронно проговариваемой фразе выделяет текст внутри подсказки.От клиента поступил заказ на разработку тренажера говорения на иностранных языках. Пользователю показывается фраза, он …

Распознание длинных аудио сервисом Yandex SpeechKit из командной строки bash/shell через API

Довольно давно Яндекс предоставляет платные сервисы по синтезу и распознанию речи. К сожалению, интерфейса для регулярного использования сервисов нет, поэтому на досуге написал скрипт, который позволяет через консоль отправлять запросы и получать резул…