Конференция завершена. Ждем вас на Highload++ в следующий раз!
Москва, СКОЛКОВО
8 и 9 ноября 2018

Разработка аналитического хранилища данных в условиях стартапаБазы данных и системы хранения

Доклад отклонён
Алексей Кузьмин
ДомКлик

Директор разработки.

Тезисы

Дано:
- 40+ реплик баз данных продакшн-систем (PostgreSQL) + одна БД (тоже PostgreSQL), которая держит на них fdw;
- Несколько бизнес-аналитиков, которые хорошо знают SQL и уже привыкли пользоваться этой системой;
- 100+ отчетов, завязанных на эту систему;
Надо:
- На всем этом взлететь.

Летом прошлого года нашей команде на поддержку и развитие достался такой проект. Разумеется, работал он крайне нестабильно. Падение любой реплики на сутки и более (в зависимости от загрузки сисадминов) останавливало аналитический процесс. Аналитики исчерпали возможность простых запросов и перешли на использование материализованных представлений, которые исчезали, как только менялась схема данных в любой из таблиц, на которую они были завязаны. Более того, все это было повязано взаимозависимостью материализованных представлений с полным отсутствием документации.

Основная задача была максимально стабилизировать систему, при этом драматически менять архитектуру (переходить на колонки, например) было нельзя.

В докладе я расскажу, какую архитектуру на основе PostgreSQL мы придумали, как все это взлетало, затрону вопросы работы PostgreSQL с foreign-servers и расскажу, как мы организовали мониторинг.

Другие доклады секции Базы данных и системы хранения

Rambler's Top100