Как за две недели проверить гипотезы применимости анализа данных в горно-металлургической компании

Всем привет, на связи российская компания Factory5. Мы занимаемся разработкой и постоянным развитием собственных продуктов для решения задач промышленных предприятий, среднего и крупного бизнеса. Сегодня расскажем о том, как мы ускоряем время проверки …

Наблюдай и властвуй — дашборды для бизнеса

Привет! В рамках нашего цикла постов про дашборды в СИБУРе и их практическую пользу для компании не смогли обойти стороной M2F – это обслуживание и ремонты, туда входит множество метрик из различных направлений бизнеса. Это могут быть метрики, которые …

[Перевод] Перезагрузка хранилищ данных в будущем

Команда Netflix Cloud Data Engineering с радостью открывает исходный код s3-flash-bootloader, нашего инструмента для выполнения обновления образа ОС на месте на государственных облачных инстансах, подставляя новый AMI вместо старого. В этом посте я рас…

Рецепт готовки Apache Kafka: как создавался Data Lake на 80 Тb

Kafka позволит вам грамотно организовать работу с большим массивом данных, но в процессе может подкинуть проблем. Иногда придется устроить танцы с бубном, чтобы программа продолжила работать, а не рухнула в момент запуска.О не очень стандартном использ…

[Перевод] Все, что нужно знать об ALBERT, RoBERTa и DistilBERT

Обзор различий и сходств различных трансформеров BERT из библиотеки Hugging Face и как их использовать  Читать

SDS vs традиционные СХД: почему мы редко применяем программно-определяемые хранилища?

Хранение данных — непростая задача, особенно когда к ним нужно обеспечить бесперебойный доступ. И сегодня мне хотелось бы поговорить о гиперконвергентных системах и связанных с ними программно-определяемых хранилищах, позволяющих использовать накопител…

Ускоряем кластеризацию больших векторов, анализируя страны Центральной Азии

Любите ли вы задачи кластеризации? Лично я — да. Они хорошо поддаются визуализации, понятны людям, далеким от математики, и зачастую оказывают быстрое влияние на бизнес процессы. Однако, при решении задач кластеризации мы можем столкнуться с рядом проб…

Машинное обучение как новая революция

Интеллектуальные алгоритмы машинного обучения уже умеют распознавать голос и изображения, занимаются аналитикой бизнес-процессов и используются в решении массы других задач.Их внедрение позволило не просто облегчить процесс программирования, но и совер…