Что я бы хотел знать про ML System Design раньше

Около года назад я начал проходить собеседования в разные компании на позицию Machine Learning Engineer. Одним из этапов в каждой компании было проектирование ML системы. В данной статье я делюсь опытом и ресурсами, которые помогли мне пройти собеседов…

Практический Metric learning

В этом посте мы поговорим о задаче metric learning, подходах к её решению, и разберём их на практике, используя open-source проект OpenMetricLearning. В качестве бонуса покажем, как с помощью простых эвристик можно догнать текущие SotA модели. Читать д…

Запуск ML скриптов в облаке с помощью dstack. Бонус – про запуск open-source проектов

Привет! На прошлой неделе мы выложили на GitHub утилиту для запуска ML скриптов в AWS. В этом посте я бы хотел рассказать, об этой утилите, а также с какими трудностями мы столкнулись при ее разработке. Во второй части статьи, я бы хотел поделитьс…

Распознавание речи, генерация субтитров и изучение языков при помощи Whisper

Есть ряд платных решений по переводу речи в текст (Automatic Speech Recognition). Сравнительно малыми усилиями можно сделать бесплатное решение, — дообучить на своих данных end2end модель (например, взять фреймворк NeMo от NVIDIA) или гибридную модель …

Новый запуск курса Natural Language Processing

Уже в среду мы делаем новый запуск курса по обработке естественного языка от ODS и Huawei. Ссылка на курс вот. В этом запуске дополнительно расскажу про то, как устроены Github Copilot и OpenAI Codex, ну и в целом про NLP4Code. Читать далее…

Эй-Яй, крипта, MLOps и командный пет-проджект

В этой статье я расскажу, как мы командой пилили пет-проджект в рамках курса ODS по MLOps. Покажу не только финальный результат, но и немного расскажу про процесс работы, какие были сложности, как организовывали эффективную работу в команде.&…

Как мы заняли 1-е место в задаче Matching в соревновании Data Fusion Contest 2022, или как нейронка обогнала бустинг

На платформе ods.ai прошло  соревнование по машинному обучению Data Fusion Contest 2022 от банка ВТБ (https://ods.ai/tracks/data-fusion-2022-competitions ).Мы, команда Лаборатории ИИ Сбера и Института искусственного интеллекта AIRI, приняли решени…

Причинно-следственный анализ в машинном обучении: итоги 2021 г

Недавно мы поговорили о том, что такое causal inference или причинно-следственный анализ, и почему он стал так важен для развития машинного обучения. А в этой статье — под катом — хотелось бы рассказать о трендах в развитии Causal Inference в ML в 2021…