Полезноe
бесплатная книга Продуманная оптимизация
Материалы HighLoad++
материалы За все восемь лет вебинар Пошаговый
алгоритм
вебинар Вопросы
и ответы
Презентации
2014 года
Видеозаписи
2014 года
Как это было
книга Услуги и скидки корпоративный Обучающий тренинг Тезисы и расписание Шаржи на докладчиков
2014 года

HighLoad++

31 октября
и 1 ноября
Место проведения: Москва,
Краснопресненская наб. 12.

Cosmify: как мы строим разведочный анализ данных для всех
Архитектуры

Программный комитет ещё не принял решения по этому докладу
Cosmify, Inc.

Eugene "Юджен" Сиурана - евангелист Open Source и автор, специализирующийся на Agile-разработке высокомасштабируемых и высоконадёжных систем. Он занимался проектированием и внедрением высокопроизводительных систем для решения критически важных задач и систем Big Data во многих ведущих организациях – таких, как Summly, Walmart.com, AT&T, LeapFrog Enterprises, JP Morgan Chase, Credit Suisse, Badoo, Oracle, Bank of America, National Oilwell Varco, IBM и др. Также он часто помогал другим разработчикам ##java, #python, #awk, #R-Finance, #docker, и #security в сети Freenode IRC. В Сети его можно узнать по прозвище pr3d4t0r.

Тезисы

• Эволюция: бизнес-аналитика, Big Data, разведочный анализ данных.

• Анализ структурированных данных: логов, баз данных, табличных данных.

• Анализ неструктурированных данных: документов, веб-страниц, электронных писем, резюме, записей чатов, и т.д.
o Язык не важен (английский, русский, испанский - безразлично)
o Выделение кластеров с общими признаками.
o Приложения.

• Наш стек:
o Python, R
o графовая база данных (Neo4J, Titan, GraphX)
o C
o Наименьшее значение (минимальный элемент)

• Система Cosmify:
o PaaS-реализация разведочного анализа данных.
o Серверы: локальные центр обработки данных или в облаке.
o Docker для упрощения развертывания.

• Компоненты Cosmify:
o Rover/Проводник: обнаружение документов (Python, AngularJS, Docker и встроенное развертывание на OS X, Linux и Windows).
o Orbiter/Спутник: веб-интерфейс, прикладной программный интерфейс (API) прокси-сервера, инструменты разведочного анализа данных (Python, Tinker Pop, Docker).
o Dark Matter/Тёмная Материя: как мы перемещаем данные в облако без шифрования, сохраняя конфиденциальность и соблюдая закон о защите персональных данных.
o Применение разведочного анализа данных для других целей: интерфейс Excel (C, интерфейс ODBC).

• Reactor/Атомный Котел:
o Разведочный анализ данных для программистов: интеграция IPython/Jupyter и RStudio (Python, R).
o Разведочный анализ данных для бизнес-аналитиков: интерфейс пользователя с возможностью перетаскивания элементов (AngularJS, D3.js) и автоматическая генерация документов (Dexy).

• Nebula/Туманность: облако для вычислений.
o Nebula/облако – Amazon Web Services, другой облачный хостинг.
o Локальное решение: разверните свое облако.
o Docker, Chef; логика вычислений: Python (NumPy, SciPy), R
o GraphX - графовая и колоночная база данных
o Создаем свое собственное приложение: RESTful API для Orbiter/Nebula (Mule, RAML, Python/Jython, JSON).

• Сравнение с Databricks, машинным обучением Microsoft Azure и т.д.

• Вопросы и ответы.

Другие доклады секции
Архитектуры

Спонсоры конференции

  • Nutanix
  • Webzilla
  • Badoo
  • Parallels
  • Филанко
  • Treatface
  • Дата центр Selectel

Информационная поддержка

  • SQLInfo.ru
  • Интернет Хостинг Центр
  • Sports.ru
  • Rusonyx
  • Adriver
  • SuperJob
  • REG.RU
  • ООО «Юмисофт»
  • Агава
  • PCWeek
  • PС Мagazine
  • Bugtraq.ru
  • TRINET
  • FL.ru
  • Телеканал «Конференция ТВ»
По любым вопросам обращайтесь:
Бухгалтерия и вопросы оплаты :
Олег Бунин , +7(495) 646-07-68
Организационный комитет :
Олег Бунин , +7 (495) 646-07-68
Программный комитет :
Олег Бунин , +7 (916) 635-95-84
Горячая линия :
+7 (495) 646-07-68, ежедневно с 10 до 22

Почтовый адрес:
119180, Москва, Бродников пер., д. 7 стр. 1, +7 (495) 646-07-68 ООО «Онтико»

Rambler's Top100
Рейтинг@Mail.ru