Конференция завершена. Ждем вас на HighLoad++ в следующий раз!

Xsolla — форма ужасна, содержание верное!

Ну вот, бигдата из Xsolla уволила 150 человек. Проанализировала активность каждого сотрудника компании и отсортировала всех по вовлеченности. А основатель уволил 150 человек внизу списка.

Да, форма увольнения (письмом) выбрана ужасно. Но по сути Xsolla сделала то, что уже давно должны были сделать все российские IT-компании. А именно — перешла к управлению и менеджменту на основе данных. А не с помощью чуйки, интуиции и не «по понятиям».

Почему российское предпринимательство — это, в большинстве своём, самозанятость? Почему не выполняются задачи? Почему продавцы не перезванивают? Да потому, что в большинстве компаний нет элементарного дашборда, на который подгружаются данные по продажам за вчерашний день. А если и подгружаются, то девочкой-студенткой.

То, что для американского предпринимателя — управление на основе данных, на основе цифр — является естественным и нормальным, у нас, россиян, вызывает недоумение. Как это, бигдата проанализировала активность? Как это меня уволили на основе сухой цифры в отчёте?! Так что...

Xsolla — форма ужасна, содержание верное!

Самые ожидаемые доклады конференции HighLoad++ (техническая, на минутку, конфа) в Санкт-Петербурге — про подготовку данных для озёр данных и ускорение движков OLAP. Может, у России и есть шанс запрыгнуть в четвертую промышленную революцию, если инженеры озаботились подготовкой данных для бизнеса.

Иван Зерин расскажет про бизнес-модель данных и о том, как она влияет на процесс подготовки данных к загрузке в datalake:

  • отличия концепции ETL и ELT;
  • базовые концепции инструмента для преобразования данных DBT;
  • как используется DBT для построения сложных моделей, а также осуществляется тестирование данных;
  • как масштабируется такое решение.

Тему ETL продолжит Владимир Верстов из Яндекса в докладе «ETL-сервисы для Такси, Еды и Лавки. Как мы разрабатываем платформу управления данными»:

  • Какие данные хранятся в Data Lake и в каком формате, какие слои и потоки данных есть в DWH: как в Яндексе несут данные от десятков различных источников до дашбордов в Tableau и OLAP кубов в MS SSAS.
  • Почему в Яндексе решили вместо готового ETL-инструмента написать свой/
  • Как устроена монорепа из ETL-сервисов и процесс разработки, отладки и деплоя/
  • Запуск ETL-процессов в двух дата-центрах, организация тяжелых потоков данных между большими хранилищами, мониторинг наших процессов, проверки качества данных и многое другое
  • Про взаимодействие между дата-инженерами и бэкенд-разработчиками и аналитиками данных на уровне кода.

Роман Кондаков раскроет тему, как ускоряют движки OLAP-баз данных. На какие ухищрения идут разработчики, чтобы ускорить ваши запросы. Мы поговорим об индексах, оптимизации запросов, параллелизме, векторизации, разных железяках. И о многом другом, что разработчики пускают в ход, лишь бы запросы не тормозили (а бизнес получал информацию вовремя).

Завершит блок data driven Максим Лапшин с рассказом о том, как они внедрили систему телеметрии, которая позволяет находить тех клиентов, кто молчит, но так же страдает, как те, что обратились; а также находить тех, кому плохо ещё до того, как они обратятся.

Реальный пример использования data driven, позволяющий принимать решения на основе цифр, оценивать реальный урон от выявленных проблем и получить реальную картинку происходящего не только со слов клиента.

Хотите поспорить о data-driven-подходе в бизнесе? Заходите в комментарии к этой статье. А технические подробности приходите обсуждать на Saint HighLoad++ 202120-21 сентября в Петербурге.

Забронировать билет на Saint HighLoad++ 2021

До встречи на конференции!