Это старая версия документа!
Содержание
Спецкурс «Интеллектуальный анализ данных » (5 курс)
Место и время проведения: вторник, вторая пара (11:15-12:50), ауд. 3504
Преподаватель: Коробейников Антон Иванович
Программа курса
Темы состоявшихся занятий
- Робастная регрессия (01.03.2016)
- Обобщенные линейные модели (GLM) (15.03.2016) PDF
- Model selection: AIC, BIC, ridge regression, lasso. (22.03.2016) PDF
- Деревья классификации. Bagging, random forest, boosting (29.03.2016) PDF
- SVM (05.04.2016) PDF
- Нелинейности. Сплайны, GAM. (12.04.2016) PDF
- Hidden Markov Models (19.04.2016) PDF
- Probabalistic Graphical Models (03.05.2016) PDF
Темы будущих занятий
- Простейшие задачи классификации. Логистическая регрессия. LDA, QDA, naive Bayes. Понятие ROC-кривой, AUC.
- Resampling: Кросс-валидация и бутстреп.
- Методы уменьшения размерности - PCA, principal component regression, partial least squares
- Unsupervised learning. Кластеризация
Textbook
Домашние задания
- (До 08.03 включительно) Глава 3 ISLR. Индивидуальные задания после главы 3.
- (До 28.03 включительно) Робастная регрессия
- (До 11.04 включительно) Глава 6 ISLR. Индивидуальные задания после главы 6.
- (До 17.04 включительно) Глава 8 ISLR. Индивидуальные задания после главы 8.
Prerequisites
Дистрибутив R:
Редакторы и оболочки:
Рекомендуемая литература
Книги
- Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
- John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
- John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с. PDF
- Роберт И. Кабаков R в действии. Анализ и визуализация данных в R. – М.: ДМК Пресс, 2013. – 280 с.
Статьи
- John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
- John Verzani. Simple R. PDF
- Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
- David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
- Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www
Задачи
Условные обозначения:
- Цифра в клетке - порядковый номер «подхода». Наличие цифры означает, что решение было получено, проверено, и результат отослан обратно.
- Решетка - задание запрошено и выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет
Кроме того, пишется дата и время.
Ch 3 | Robust | Ch 6 | Ch 8 | |
---|---|---|---|---|
Абрамова А. | 11,14 | Duncan | 11 | 9 |
Алиева Н. | 8,15 | alcohol | 8 | 10 |
Бзикадзе А. | 10,14 | 93CARS | 9 | 11 |
Ершов В. | 11,15 | Automobile | 10 | 12 |
Зиннатулина Б. | 10,13 | crime | 11 | 12 |
Иванова Е. | 11,14 | hills | 8 | 9 |
Кухтина Д. | 8,12 | Sleep | 10 | 11 |
Лозицкий И. | 10,12 | aircraft | 8 | 12 |
Миллер А. | 9,15 | education | 11 | 9 |
Охотников Г. | 9,12 | stackloss | 9 | 10 |