Конференция завершена. Ждем вас на Highload++ в следующий раз!

Москва, СКОЛКОВО
8 и 9 ноября 2018

support@ontico.ru

@ontico_support

+7 (495) 646-0768

Под капотом in-memory db: как обработать миллионы запросов в секунду. Или, почему Reindexer такой быстрыйБазы данных и системы хранения

Доклад отклонён

Олег Герасимов

Ростелеком Информационные Технологии

Директор по разработке в АО «Рестрим».

Тезисы

Мы уже 2 года разрабатываем in-memory базу данных Reindexer, которая была создана для решения задачи фильтрации и отдачи контента со сложной бизнес логикой в системе, обслуживающий 10м+ пользователей.
На одном физическом сервере Reindexer может выполнять более миллиона простых запросов в секунду и десятки тысяч запросов с JOIN и нетривиальной фильтрацией.

В этом докладе я расскажу, как нам удалось достичь такой производительности и о "под-капотном" пространстве Reindexer - какие структуры используются для хранения данных в RAM, как реализованы индексы и как это помогает выполнять выборки данных за минимальное количество итераций.

Кроме оптимизированных структур данных, на производительность БД очень влияет количество выделений/освобождений динамической памяти. Нам удалось свести количество аллокаций памяти при выполнении запросов к минимуму - многие запросы выполняются вообще без единого аллока.

Обратная сторона низко-уровневых оптимизаций - появление "опасного" кода, который напрямую работает с памятью и в случае ошибок потенциально может приводить к "падениям" и порче данных - что недопустимо для БД.
Поэтому, рассказ об оптимизациях был бы не полным, если не рассказать об автотестах и верификации оптимизаций, которые мы используем.

Другие доклады секции Базы данных и системы хранения

Последние изменения в IO-стеке Linux с точки зрения DBA

Илья Космодемьянский

Data Egret

Apache Kafka как основа для велосипедостроения

Николай Сивко

okmeter.io

Выбираем систему репликации для PostgreSQL

Виктор Егоров

DataEgret

Hadoop at scale: мы построили большой кластер, как его теперь сохранить?

Сергей Корсаков

Onfido

VShard - горизонтальное масштабирование в Tarantool

Владислав Шпилевой

Ubisoft

Яндекс.Метрика и нестандартный ClickHouse

Александр Макаров

Yii

Эксперименты с Postgres в Docker и облаках — оптимизация настроек и схемы вашей БД без риска «уронить прод»

Николай Самохвалов

Postgres.ai

Make Your Database Dream of Electric Sheep: Designing for Autonomous Operation

Carnegie Mellon University

Топ ошибок со стороны разработки при работе с PostgreSQL

Алексей Лесовский

Coins.ph

Один из вариантов реализации Data Discovery в микросервисной архитектуре

Николай Голов

ManyChat

Базы данных в облаках

Владимир Бородин

Yandex Cloud

Как устроить хайлоад на ровном месте

Олег Бартунов

Postgres Professional

В Tarantool 2.1 появилась поддержка SQL: подробности

Кирилл Юхин

Tarantool

Will Postgres Live Forever?

EnterpriseDB

Как снять бэкап в распределенной системе, чтобы этого никто не заметил

Иван Раков

GridGain

MariaDB и MySQL — какую статистику использует оптимизатор, или Как обойтись без индексов

Сергей Голубчик

MariaDB Corporation

Руководство по выживанию с MongoDB

Сергей Загурский

Joom

Как стать классным спецом по базам данных?

Илья Космодемьянский

Data Egret

MyRocks deep dive and production deployment at Facebook

Yoshinori Matsunobu

Facebook

Как Tinkoff.ru использует Greenplum

Дмитрий Немчин

Tinkoff.ru

Переезжаем в облака: опыт миграции 10 TB PostgreSQL-кластера на AWS

Александр Кукушкин

Zalando SE

Место row level security в высоконагруженном проекте

Александр Токарев

Xsolla

MySQL 8.0: SQL and NoSQL Scalability

Oracle - MySQL

Инструменты создания бэкапов PostgreSQL

Андрей Сальников

Data Egret

The cost of MongoDB ACID transactions in theory and practice

MongoDB

Анализ производительности запросов в ClickHouse

Алексей Миловидов

Яндекс

ClickHouse тормозит

Кирилл Шваков

Kinescope

Software Defined Storage the Linux way

Philipp Reisner

LINBIT

Репликация в Tarantool: конфигурация и использование

Георгий Кириченко

Mail.ru

BBM’s 150M+ users Oracle to Postgres migration without downtime

Álvaro Hernandez

OnGres

Масштабирование реплик PostgreSQL под нагрузкой с точки зрения технологий резервного копирования

Андрей Бородин

Yandex Cloud

Demystifying MySQL Replication Crash Safety

Jean-François Gagné

MessageBird

PostgreSQL 11 и далее: обзор новинок и тенденций

Иван Панченко

Postgres Professional

Continuous Optimization for distributed BigData analysis

Treasure Data Inc.

Репликация между разными СУБД: для чего мы написали репликатор MySQL-Tarantool

Михаил Буйлов

Мамба

Забиваем телескопом гвозди, или Нестандартные способы использования ClickHouse

Александр Зайцев

LifeStreet, Altinity

"Заряжай" или CDC из MariaDB и Postgres в аналитическую СУБД MariaDB Columnstore

Роман Ноздрин

MariaDB Corporation

Построение аналитического хранилища на 100 петабайт

Александр Мазуров

Criteo