Data mining in the Nutshell Смежные области
Тезисы
1. Нужна ли программисту математика?
- Общий обзор науки о данных
-- Что такое данные?
-- Явные и скрытые закономерности
- Нейробиология, Computer Science и Data Mining
- Что такое Data Mining?
2. Data Science
- DS как наука
- DS как часть модного тренда: BigData
- Data mining как часть DS
3. Алгоритмы Data Mining:
- Обзор алгоритмов работы с данными
- Кластеризация
- Регрессия
- Классификация
- Ассоциативные правила
- Деревья принятия решений
4. Data mining & Machine learning
- Формирование обучающих выборок
- Пересечение машинного обучения и анализа данных
-- Обучение с учителем
-- Обучение без учителя
5. Визуализация данных
- Важность визуального представления данных
- Типы визуализации
6. Data Mining с технической стороны
- MapReduce
- Data warehousing and processing
- Специальные БД: графовые, аналитические
- HBase, Hadoop и другие страшные слова
- Софт для работы: NumPy, Scikit-learn, PyBrain, Weka
- Язык программирования R
7. Практическое применение
- Social media mining
-- Работа с внешними пользователями в момент регистрации
-- Получение информации о пользователях из "внешнего мира"
- Text mining
-- Выделение фактов из текста
- Предиктивная аналитика
- Рекомендательные системы
- Business Intelligence
-- OLAP