HighLoad++ 2015 завершён! Ждём вас в 2016 году!

Профессиональная конференция разработчиков высоконагруженных систем

2 и 3 ноября 2015 Крокус-Экспо МОСКВА
Профессиональная конференция разработчиков высоконагруженных систем

Ужимай и властвуй: алгоритмы компрессии в базах данных
Базы данных, системы хранения

Доклад принят в Программу конференции
Percona

Пётр Зайцев окончил МГУ им. М.В. Ломоносова и ещё в студенческие годы являлся техническим директором проекта SpyLOG — сервиса статистики для веб-сайтов. В начале 2000-х Пётр стал сотрудником MySQL AB и возглавил группу оптимизации производительности (High Performance Group) внутри компании. В 2006 году Пётр Зайцев за рубежом основал собственную компанию Percona со специализацией на MySQL, а впоследствии — на оптимизации производительности баз данных MySQLⓇ и MongoDBⓇ. Пётр также является соавтором опубликованной издательством O’Reilly книги «MySQL. Оптимизация производительности» (High Performance MySQL) — одной из самых популярных книг по данной теме. В должности генерального директора Percona Пётр совмещает опыт руководства компанией с получением и практической проверкой новых знаний. Пётр является одним из авторов блога Percona Database Performance Blog (ранее — MySQL Performance Blog) и часто выступает с докладами на технологических и бизнес-конференциях.

Тезисы

Чем меньше размер данных, тем дешевле их хранить и часто быстрее обрабатывать. Разработчики баз данных издавна задумывались над тем, как обеспечить максимальную степень сжатия данных.

В данном докладе мы рассмотрим, почему интерес к компрессии информации в базах данных особенно высок в последние годы. Мы также рассмотрим различные подходы к уменьшению размера хранимых данных, включая:
- дедубликацию данных;
- префикс-компрессию индексов;
- компрессию на уровне файловой системы;
- поколоночное хранение данных;
- постраничную компрессию (на примере хранилища Innodb);
- компрессию во фрактальных и LSM деревьях;
- компрессию путем "прокалывания дырок" в файлах;
- компрессию данных на уровне пользователя.




Другие доклады секции
Базы данных, системы хранения

Rambler's Top100