Обновляем сравнение систем распознавания русского языка

Наконец-то пришло время обновить наше исследование качества систем распознавания русского языка. Лучше поздно, чем никогда! С момента прошлого исследования утекло много воды … и мы думали, что мы не добежим до обновления, но таки добежали. По сравнению…

Как мы генерили генератор скриптов

Привет, Хабр! На связи VS Robotics. Мы по–прежнему занимаемся машинным обучением и автоматизацией решений на базе речевых технологий. И мы по-прежнему верим в светлое будущее в то, что в скором времени роботизированные системы будут внедрены повсеместн…

Хакатон «GameDev + AI»

Всем привет! 18-20 ноября 2022 года в Российском Технологическом Университете МИРЭА при поддержке нашей компании «Наносемантика» пройдет (снова) студенческий хакатон.У студентов МИРЭА будет возможность испытать свои силы в разработке игры или виртуальн…

Как мы сделали распознавание речи нескольких говорящих

В психологии есть понятие эффекта коктейльной вечеринки: человек способен воспринимать полезную для себя информацию даже в ситуации, когда вокруг него много источников речи и шума. Но насколько хорошо с такой задачей справляется искусственный интеллект…

Как мы подходим к поддержке ML-моделей в синтезе речи

Всем привет! Меня зовут Александра Сорока, я занимаюсь синтезом речи в Тинькофф. А это — мой текст о том, зачем вообще думать о долгосрочной поддержке кода и ML-моделей. Я расскажу, почему мы отказались от опенсорсных решений, как работаем с датасетами…

Как робот-оператор научился помогать людям во время пандемии

Весной 2020 года, на заре пандемии, мы начали делать голосовой справочник по коронавирусной инфекции, самоизоляции и всему, что связано с covid19 на основе нашего робота-оператора. Мы привлекли к созданию вопросн…

Оплата не отходя от девайса: как мы реализовали персонализацию в устройствах Sber с помощью распознавания голоса и лица

Сегодня на рынке изобилие умных домашних устройств. Часто они становятся своего рода центром дома – инструментом, к которому обращаются домочадцы с разными задачами: узнать погоду, найти фильм, заказать еду или такси. Некоторые сценарии платные, и пров…

Как улучшить распознавание русской речи до 3% WER с помощью открытых данных

Меня зовут Николай, когда в 2009 году я защищал диссертацию по распознаванию речи, скептики мне говорили, что слишком поздно, так как Microsoft и Google уже “всё сделали”. Сейчас в SberDevices я обучаю модели распознавания речи, которые используются в …