Highload++ 2017 завершён!

Профессиональная конференция разработчиков высоконагруженных систем

СКОЛКОВО, Москва 7 и 8 ноября

11-я ежегодная конференция для разработчиков highload-систем, которая соберет   2 700 участников из разных регионов России и мира. Мероприятие направлено на обмен знаниями о технологиях, позволяющих одновременно обслуживать многие тысячи и миллионы пользователей.

Программа охватывает такие аспекты веб-разработок, как архитектуры крупных проектов, базы данных и системы хранения, системное администрирование, нагрузочное тестирование, эксплуатация крупных проектов и другие направления, связанные с высоконагруженными системами.

  • Главная
  • Базы данных и системы хранения

Нереляционный SQL
Базы данных и системы хранения

Доклад принят в Программу конференции
IBS

Архитектор в IBS, в последнее время работает над проектированием серийных инфраструктурных и платформенных комплексов на базе российского оборудования и программного обеспечения. Ранее внедрял приложения для энергетики в корпорации Oracle, руководил разработческим подразделением в CBOSS — итого более 20 лет опыта разработки и внедрения крупных IТ-систем для сектора государственного управления, энергетики, телекоммуникаций.

Тезисы

Если ещё 10 лет назад движение нереляционных СУБД подчёркнуто называлось NoSQL и ходило под лозунгом «SQL is kludge», то сейчас мы видим, что на SQL можно «поговорить» практически с любыми источниками данных: двигаясь от SQL-подобных диалектов (вроде HiveQL, AQL, CQL), возникла целая плеяда SQL-on-Hadoop, среди которых есть способный просверлиться в самые невероятные нереляционные структуры Apache Drill, а в конце августа 2017 появился даже KSQL — SQL-движок над поточником Apache Kafka. И гордость российского NoSQL-субдостроения — Tarantool — также оснастился SQL-движком, а в мире IMDG (резидентных гридов данных) уже речь идёт не просто о поддержке SQL, а ведётся соревнование между движками за полноту соответствия стандартам SQL-99.

Цель доклада — разобраться, что же такого в SQL от реляционной специфики, а что в нём — универсальное, позволяющее его использовать для «общения» с любыми данными. В связи с этим разберём идею Мейера о coSQL — двойственности реляционной модели и модели «семейство столбцов», проведём обзор подходов работы на SQL в условиях бессхемности. Предполагается особо обсудить SQL-федераторы (соединяющие данные из разнородных источников) и средства Hadoop-гибридизации в РСУБД (отдельные из которых позволяют «отогнать» выбранные секции данных в HDFS и продолжать приложениям работать как ни в чём не бывало): именно в таких смешанных условиях наиболее отчётливо проявляются новые проблемы с построением планов запросов, и это важный момент как для разработчиков платформ данных, так и для практиков, их эксплуатирующих. Будет представлен ряд примеров из практики, где обеспечение эффективного плана оказалось неразрешимой задачей без кардинальных мер по перемолке всего хранилища. Одним из перспективных путей преодоления трудностей с планированием SQL-запросов над новыми типами источников представляются современные теоретические наработки по универсальной семантике эквивалентности SQL (HoTTSQL), поверхностное представление которых также планируется включить в доклад.

В заключении будет разобран умозрительный пример использования SQL (с некоторыми дополнительными конструкциями, но без процедурных расширений!) в качестве языка программирования общего назначения и языка командной оболочки. Пример, конечно же, абсурдный, но всем коллегам, уверенным, что SQL никогда не станет тьюринг-полным языком, обязательно участие в дискуссии по итогам.

Oracle
,
Tarantool
,
Базы данных / другое
,
Организация доступа к базам данных, ORM, собственные драйвера
,
Hadoop

Другие доклады секции
Базы данных и системы хранения

Rambler's Top100