Полезноe
бесплатная книга Продуманная оптимизация
Материалы HighLoad++
материалы За все восемь лет вебинар Пошаговый
алгоритм
вебинар Вопросы
и ответы
Презентации
2014 года
Видеозаписи
2014 года
Как это было
книга Услуги и скидки корпоративный Обучающий тренинг Тезисы и расписание Шаржи на докладчиков
2014 года

HighLoad++

31 октября
и 1 ноября
Место проведения: Москва,
Краснопресненская наб. 12.

Аналитика, близкая к real-time, с Elasticsearch
Архитектуры

Самоотвод
Wingify

Окончив колледж в прошлом году, я начал работать над аналитикой проекта, который я взял за 3 месяца до завершения, не имея никаких предварительных знаний или опыта в качестве аналитика.
После своего первого проекта в области аналитики я взял на себя полную ответственность за всю инфраструктуру автоматизации с применением Puppet and Fabric в нашей компании и автоматизировал абсолютно всё. Стоит отметить, что на старте проекта автоматизации не было совсем.
Создал Sherlock (http://github.com/vaidik/sherlock), Python-библиотеку для распределенных блокировок с поддержкой множества различных бэкендов на выбор.
Продолжаю вносить вклад в различные open source проекты, в числе которых Drupal, Fedora and Mozilla.
Во время своей первой стажировки работал над несколькими проектами в течение 5 недель. Мой первый проект состоял в построении каркаса REST API нашего продукта, который я сумел сделать в первые 2 недели. В рамках второго проекта я должен был построить распределенную систему, которая делала бы полные скриншоты отображения веб-страницы в браузере. Нам это было нужно для сравнения отображения страниц в различных браузерах. Я реализовал это, использовав Python, Selenium и несколько популярных вычислительных алгоритмов для распределённых систем.

Тезисы

Elasticsearch – это гибкий и эффективный открытый поисковый движок на основе Apache Lucene. Изначально созданная специально для распределённых сред, система Elasticsearch является практичной, стремится к простоте в использовании, работает и масштабируется даже тогда, когда все остальные поисковые системы «падают». REST API и поддержка документов в формате JSON делают этот движок очень гибким и простым в использовании.
Хотя движок Elasticsearch создавался для поиска, его структура запросов, фильтрация и фасетизация делают Elasticsearch одним из немногих простых решений для аналитики, близкой к real-time. Такие его возможности, как фреймворк агрегации (ранее – фасеты), могут использоваться для агрегации больших объёмов данных.
Свой доклад я начну с рассказа об использовании Elasticsearch для аналитики, близкой к real-time, для стуктурированных и неструктурированных данных, а затем мы перейдём к более «продвинутым» возможностям – таким, как маппинг, фильтрация и агрегация для аналитики. Мы также поговорим об особенностях проектирования при необходимости обработки большого числа операций чтения, записи и поиска для аналитики. Мы также уделим некоторое время возможным оптимизациям для аналитической рабочей нагрузки, которая во многом полагается на агрегацию.
Охватываемые темы
1. Elasticsearch, очень краткое представление.
2. Эффективный фреймворк агрегации.
3. Маппинг для структурированных и неструктурированных данных.
4. Особенности проектирования для обеспечения масштабируемости и высокой производительности (быстрые операции записи, чтения и поиска).
5. Оптимизация Elasticsearch для аналитической рабочей нагрузки.
6. Библиотеки Python для Elasticsearch – очень краткое обсуждение.
7. Отсылка к внешним ресурсам после доклада.
Очень кратко мы поговорим о том, как мы внутри VWO построили углублённое сегментирование для аналитики с использованием Elasticsearch и Python, конкретнее, о том, как мы взяли PoC для продакшна и о проблемах, с которыми мы столкнулись в процессе.

Другие доклады секции
Архитектуры

Спонсоры конференции

  • Nutanix
  • Webzilla
  • Badoo
  • Parallels
  • Филанко
  • Treatface
  • Дата центр Selectel

Информационная поддержка

  • SQLInfo.ru
  • Интернет Хостинг Центр
  • Sports.ru
  • Rusonyx
  • Adriver
  • SuperJob
  • REG.RU
  • ООО «Юмисофт»
  • Агава
  • PCWeek
  • PС Мagazine
  • Bugtraq.ru
  • TRINET
  • FL.ru
  • Телеканал «Конференция ТВ»
По любым вопросам обращайтесь:
Бухгалтерия и вопросы оплаты :
Олег Бунин , +7(495) 646-07-68
Организационный комитет :
Олег Бунин , +7 (495) 646-07-68
Программный комитет :
Олег Бунин , +7 (916) 635-95-84
Горячая линия :
+7 (495) 646-07-68, ежедневно с 10 до 22

Почтовый адрес:
119180, Москва, Бродников пер., д. 7 стр. 1, +7 (495) 646-07-68 ООО «Онтико»

Rambler's Top100
Рейтинг@Mail.ru