Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

Крупнейшая профессиональная конференция для разработчиков высоконагруженных систем

17 и 18 мая 2021 Москва, Крокус-Экспо 3, зал 20

Crash Recovery в Распределенном Хранилище Архитектуры, масштабируемость

18 мая, 13:00

Доклад принят в программу конференции

Тезисы

Скачать презентацию Все презентации конференции

Мы используем распределенное хранилище Apache Ignite в продакшне, как следствие, — предъявляем к нему высокие требования по надежности и доступности.

Раньше, в случае выхода узла из строя, обработка поступающих операций приостанавливалась на продолжительный период времени, до десятков секунд в некоторых кейсах. Простои такой длительности недопустимы для наших сервисов, поэтому процедура восстановления в Apache Ignite была мною доработана. Расскажу о том, как было, что изменилось и что еще предстоит сделать.

В докладе рассмотрим:
- гарантии сохранности данных в распределенных хранилищах,
- партиционирование и ребалансировку данных,
- разницу между кластером, кэшем и партицией,
- типы распределенных кэшей, статусы партиций,
- механизмы, позволяющие кластеру сохранять работоспособность и консистентность при смене топологии (входе и выходе узлов),
- "трюки", позволившие минимизировать время простоя при смене топологии,
- способы проверки эффективности оптимизаций, разрабатываемых и уже включенных в Apache Ignite.

Антон Виноградов

СберТех

Делает Platform V DataGrid и Сбер лучше.

Другие доклады секции Архитектуры, масштабируемость

Мониторинг большого количества движущихся по карте объектов

Егор Маслов

big3.ru

Микросервисы с нуля

Семен Катаев

Авито

Public Cloud. Гайд по масштабированию

Нарек Татевосян

Яндекс

Согласованная локализация: версии, транзакции, очереди

Алексей Тимин

Badoo

Почему распределенный SQL сложнее, чем кажется

Станислав Лукьянов

GridGain

Проектирование высоконагруженных систем на основе моделирования и теории массового обслуживания

Максим Юнусов

IT1

Кошелек с нуля в 2020 году: технологии, вызовы, решения

Филипп Дельгядо

lekton.io

Пишем свой Domain Crawler

Евгений Карагодин

Plesk

Как мы добавляли распределенный SQL в Hazelcast

Владимир Озеров

Querify Labs

Чёрная магия JIT-компиляции

Алексей Рагозин

Дойче Банк

GraphQL Federation, или Как не выстрелить себе в ногу

Иван Решетин

Озон Банк

Разработка приложений, устойчивых к кратковременным отказам

Георгий Полевой

Dodo Pizza

Платформа для любой биометрии: проблемы и решения, или Как устроена Единая биометрическая система

Сергей Браун

РТЛабс

Как правильно выбирать очередь

Владимир Перепелица

Tarantool, VK

Платформа видеоконференций ВКонтакте – сделано удалённо

Александр Тоболь

ВКонтакте, VK

API Gateway: пустая трата сил или полезный инструмент?

Василий Сошников

Quantil Inc.

Архитектура отказоустойчивого платежного шлюза

Алексей Павлов

Wildberries

Отказоустойчивое Такси, или Как мы строим надежный сервис

Максим Педченко

Яндекс.Go

Как сдержать самые сложные обещания: планирование batch-задач в системе Yandex.YT

Игнат Колесниченко

Яндекс

Консенсус на пальцах, или Как договориться в распределенной системе

Владимир Протасов

Yandex.Cloud

Высоконагруженная платежная система "Мир": что под капотом

Юрий Бабак

Т-Банк

Как мы попали в истории. Stories в сервисе объявлений

Александр Инякин

Юла

Тысяча и один бэкап, или Резервное копирование Compute Cloud

Артемий Капитула

VK Cloud

Python и Ruby под нагрузкой: самый низкий уровень

Григорий Петров

Evrone

Как мы создавали Data Management Platform в OZON

Евгений Чмель

Ozon

Metadata management system в Авито

Фрол Крючков

Авито

Угнать за 5 миллисекунд: как мы делали транспорт для торговых ядер Московской Биржи

Николай Карлов

VK Cloud

Игровой сервер: что там внутри?

Марк Локшин

IT Territory/Mail.ru Group

Серебряная пуля геораспределенных систем

Евгений Кузовлев

Т-Банк