Спецкурс «Интеллектуальный анализ данных» (5 курс)

Место и время проведения: вторник, вторая пара (11:15-12:50), ауд. 3527
Преподаватель: Коробейников Антон Иванович


Программа курса

Темы состоявшихся занятий

  1. Линейные модели. Оценивание, проверка гипотез. Дисперсионный анализ как линейная модель. Анализ ковариаций. PDF PDF
  2. Робастная регрессия
  3. Простейшие задачи классификации. Логистическая регрессия. LDA, QDA, naive Bayes. Понятие ROC-кривой, AUC.
  4. Model selection: AIC, BIC, ridge regression, lasso. PDF
  5. Support Vector Machines PDF
  6. Деревья классификации. Bagging, random forest, boosting PDF
  7. Обобщенные линейные модели (GLM) PDF

Темы будущих занятий

  1. Нелинейности. Сплайны, GAM
  2. Hidden Markov Models
  3. Probabilistic Graphical Models
  4. Resampling: Кросс-валидация и бутстреп.
  5. Методы уменьшения размерности - PCA, principal component regression, partial least squares
  6. Unsupervised learning. Кластеризация

Textbook

Домашние задания

  1. Глава 3 ISLR. Индивидуальные задания после главы 3.
  2. Глава 4 ISLR. Индивидуальные задания после главы 4.
  3. Глава 6 ISLR. Индивидуальные задания после главы 6.
  4. Глава 8 ISLR. Индивидуальные задания после главы 8.

Prerequisites

Рекомендуемая литература

Книги

  1. Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
  2. John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
  3. John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  4. Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  5. Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с. PDF
  6. Роберт И. Кабаков R в действии. Анализ и визуализация данных в R. – М.: ДМК Пресс, 2013. – 280 с.

Статьи

  1. John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
  2. John Verzani. Simple R. PDF
  3. Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
  4. David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
  5. Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www

Задачи

Условные обозначения:

  1. Цифра в клетке - порядковый номер «подхода». Наличие цифры означает, что решение было получено, проверено, и результат отослан обратно.
  2. Решетка - задание запрошено и выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет ;-)

Кроме того, пишется дата и время.

Внимание: Если напротив Вашей фамилии отсутствует назначенное задание, то для его получения Вам следует отправить запрос по почте.

Ch 3 Ch 4 Ch 6 Ch 8 Зачет
Агеев + + + + +
Жорникова + + + + +
Корчемкин + + + + +
Небожатко + + + + +
Пимахов + + + + +
Ширинкина + + + + +
Григорьева + + + + +
Сальников + + + + +
Старков + + + + +
Жуков 10 11 9 9

Разное

study/spring2017/islr.txt · Последнее изменение: 2017/05/30 01:22 — asl
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0