[Перевод] Как работает service mesh и API-шлюзы в микросервисной архитектуре

Вы наверняка много раз слышали о service mesh и  API-шлюзе применительно к микросервисам. Их часто путают. В этой статье мы подробно поговорим о двух этих инструментах, а также разберемся, когда их лучше использовать и что будет, если их объединит…

Как агенты сбора метрик защищаются от потерь данных при работе с remote write протоколом

Привет. Меня зовут Григорий Рочев. Хотел бы поделиться сравнением Prometheus like агентами для сбора метрик (нигде я такого определения не встречал, но почему бы их так не назвать?). Рассматривать буду prometheus в режиме agent mode, grafana agent, Vic…

[Перевод] Проверяем реалистичность SLO и анализируем риски, как настоящие SRE-инженеры

Установка SLO (Service Level Objective, целевых уровней обслуживания) — одна из базовых задач SRE. По этим показателям удобно оценивать надежность службы. Противоположность SLO — бюджет на ошибки, то есть какой уровень ненадежности считать до…

Можно спать спокойно. Появился чат-бот для мониторинга чат-ботов

Разрабатывая 4 года чат-боты мы в botcreators.ru столкнулись с задачей мониторить доступность чат-ботов в телеграм. Из задачи рождается продукт, про него сегодня и расскажу. Мониторить чат-бот…

Выгрузка HDFS FSImage в Hive для мониторинга и аналитики: руководство к действию

Привет, Хабр! Меня зовут Борис Мурашин, я системный архитектор развития платформы больших данных в Х5 Tech. В статье делюсь своим опытом работы с кластером Hadoop: рассказываю, как с помощью сторонней библиотеки мне удалось организовать оперативную выг…

Мониторинг в NiFi. Часть третья. Задачи отчетности Site-to-Site

В предыдущих частях мы рассмотрели вопросы мониторинга потоков данных и состояния системы средствами GUI NiFi и задач отчетности. В этой части поближе познакомимся с задачами отчетности Site-to-Site. При отправке данных из одного экземпляра NiFi в друг…

Как свести проблемы в инфраструктуре облачного сервиса к нулю?

Как известно, управление сложным космолетом невозможно без нормальной приборной панели. Совсем недавно мы уже рассказывали, об эволюции инфраструктуры нашей облачной help desk системы Okdesk, которой пользуется каждый день более 800 компаний и о том, к…

Собираем систему потоковой аналитики из логов приложений

Приветствую, коллеги. В этой статье хочу поделиться с вами опытом построения системы мониторинга бизнес показателей в режиме реального времени, которая построена на основе сбора логов.Перед тем, как погрузиться в технические детали, немного расскажу о …

Мониторинг в Apache NiFi. Часть вторая

Задачи отчетности (Reporting Tasks) В первой статье мы рассмотрели вопросы мониторинга потоков данных и состояния системы средствами GUI NiFi. Теперь рассмотрим, как передать необходимые метрики и отчеты об ошибках и состоянии кластера во в…