Спецкурс «Интеллектуальный анализ данных » (5 курс)

Место и время проведения: вторник, вторая пара (11:15-12:50), ауд. 3504
Преподаватель: Коробейников Антон Иванович


Программа курса

Темы состоявшихся занятий

  1. Линейные модели. Оценивание, проверка гипотез. Дисперсионный анализ как линейная модель. Анализ ковариаций. (16.02.2016) PDF PDF
  2. Робастная регрессия (01.03.2016)
  3. Обобщенные линейные модели (GLM) (15.03.2016) PDF
  4. Model selection: AIC, BIC, ridge regression, lasso. (22.03.2016) PDF
  5. Деревья классификации. Bagging, random forest, boosting (29.03.2016) PDF
  6. SVM (05.04.2016) PDF
  7. Нелинейности. Сплайны, GAM. (12.04.2016) PDF
  8. Hidden Markov Models (19.04.2016) PDF
  9. Probabilistic Graphical Models (03.05.2016) PDF

Темы будущих занятий

  1. Простейшие задачи классификации. Логистическая регрессия. LDA, QDA, naive Bayes. Понятие ROC-кривой, AUC.
  2. Resampling: Кросс-валидация и бутстреп.
  3. Методы уменьшения размерности - PCA, principal component regression, partial least squares
  4. Unsupervised learning. Кластеризация

Textbook

Домашние задания

  1. (До 08.03 включительно) Глава 3 ISLR. Индивидуальные задания после главы 3.
  2. (До 28.03 включительно) Робастная регрессия
  3. (До 11.04 включительно) Глава 6 ISLR. Индивидуальные задания после главы 6.
  4. (До 17.04 включительно) Глава 8 ISLR. Индивидуальные задания после главы 8.

Prerequisites

Рекомендуемая литература

Книги

  1. Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
  2. John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
  3. John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  4. Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  5. Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с. PDF
  6. Роберт И. Кабаков R в действии. Анализ и визуализация данных в R. – М.: ДМК Пресс, 2013. – 280 с.

Статьи

  1. John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
  2. John Verzani. Simple R. PDF
  3. Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
  4. David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
  5. Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www

Задачи

Условные обозначения:

  1. Цифра в клетке - порядковый номер «подхода». Наличие цифры означает, что решение было получено, проверено, и результат отослан обратно.
  2. Решетка - задание запрошено и выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет ;-)

Кроме того, пишется дата и время.

Ch 3 Robust Ch 6 Ch 8 Зачет
Абрамова А. + + + + +
Алиева Н. 1 + + +
Бзикадзе А. + + + + +
Ершов В. + + + + +
Зиннатулина Б. + + + + +
Иванова Е. + + + + +
Кухтина Д. + + + + +
Лозицкий И. 1 + + +
Миллер А. + + + + +
Охотников Г. + + + + +

Разное

study/spring2016/islr.txt · Последнее изменение: 2016/06/01 02:05 — nina
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0