Матрица уровней дата инженеров Amazon

Матрица показывает, как меняются профессиональные навыки специалистов от уровня к уровню. Сюда не включены Принципы Лидерства Amazon (https://www.amazon.jobs/en/principles), поскольку они едины для всех и не зависят от уровня сотрудника.Матрица уровней…

Dagster | Туториал

Dagster — это оркестратор, предназначенный для организации конвейеров обработки данных: ETL, проведение тестов, формирование отчетов, обучение ML-моделей и т.д.На паре несложных примеров посмотрим как его развернуть, настроить и работать с ним. Читать …

Как мы строим свою платформу для аналитиков

Привет, с вами снова Галина Вакулина, и в этой статье я расскажу, как мы строим платформу для аналитиков и избавляем их от ненужной работы.Цель нашей команды — сделать так, чтобы в Точке работать с данными было удобно и быстро. Чем меньше времени анали…

Как полюбить задачи регрессии

У задач классификации, в отличии от задач регрессии, есть одно очень приятное свойство:большинство ML алгоритмов решения задач классификации выдают не просто ответ, а некоторую оценку уверенности модели в ответе. То есть помимо метрик самой модели мы о…

Как создать переводчик, который переводит лучше, чем Google Translate

Помню, как еще в школе на Basic я писал программу-переводчик. И это было то время, когда ты сам составлял словарь, зашивал перевод каждого слова, а затем разбивал строки на слова и переводил каждое слово в отдельности. В то время я, конечно же, не мог …

Как мы взяли бронзу вместо золота на Kaggle или умей верно выбрать сабмит

Привет, чемпион!Мы тут недавно потратили месяц на соревнование «UW-Madison GI Tract Image Segmentation» и не взяли золото. Золотую медаль не взяли, но теперь у каждого из нас есть первая бронза. И сейчас мы кратко расскажем про сработавшие подходы в се…

[Перевод] Как мониторить золотые сигналы SRE

Принципы Site Reliability Engineering (SRE) в последнее время очень популярны, отчасти благодаря знаменитой книге о SRE в Google, где говорится о золотых сигналах, за которыми нужно следить, чтобы наши системы работали быстро и безотказно в любых масшт…

Проблемы качества промышленных данных (временных рядов)

Привет, Хабр! На связи Юрий Кацер, эксперт по ML и анализу данных в промышленности, а также руководитель направления предиктивной аналитики в компании «Цифрум» Госкорпорации “Росатом”. В рамках рабочих обязанностей я решаю задачи в промышленности с пом…

Язык Go Excel API Excelize выпущен версии 2.6.1

Excelize — это библиотека, написанная на чистом Go, предоставляющая набор функций, которые позволяют записывать и читать файлы XLAM / XLSM / XLSX / XLTM / XLTX. Поддерживает чтение и запись электронных таблиц, созданных в Microsoft Excel 2007 и более п…