Это старая версия документа!


Спецкурс «Интеллектуальный анализ данных » (5 курс)

Место и время проведения: вторник, вторая пара (11:15-12:50), ауд. 3504
Преподаватель: Коробейников Антон Иванович


Программа курса

Темы состоявшихся занятий

  1. Линейные модели. Оценивание, проверка гипотез. Дисперсионный анализ как линейная модель. Анализ ковариаций. (16.02.2016) PDF PDF
  2. Робастная регрессия (01.03.2016)
  3. Обобщенные линейные модели (GLM) (15.03.2016) PDF

Темы будущих занятий

  1. Простейшие задачи классификации. Логистическая регрессия. LDA, QDA, naive Bayes. Понятие ROC-кривой, AUC.
  2. Resampling: Кросс-валидация и бутстреп.
  3. Model selection: AIC, BIC, ridge regression, lasso. Методы уменьшения размерности - PCA, principal component regression, partial least squares
  4. SVM
  5. Unsupervised learning. Кластеризация
  6. Деревья классификации. Bagging, random forest, boosting
  7. Нелинейности. Сплайны, GAM.

Textbook

Домашние задания

  1. (До 08.03 включительно) Глава 3 ISLR. Индивидуальные задания после главы 3.
  2. (До 28.03 включительно) Робастная регрессия

Prerequisites

Рекомендуемая литература

Книги

  1. Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
  2. John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
  3. John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  4. Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  5. Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с. PDF
  6. Роберт И. Кабаков R в действии. Анализ и визуализация данных в R. – М.: ДМК Пресс, 2013. – 280 с.

Статьи

  1. John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
  2. John Verzani. Simple R. PDF
  3. Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
  4. David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
  5. Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www

Задачи

Условные обозначения:

  1. Цифра в клетке - порядковый номер «подхода». Наличие цифры означает, что решение было получено, проверено, и результат отослан обратно.
  2. Решетка - задание запрошено и выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет ;-)

Кроме того, пишется дата и время.

Ch 3 Robust
Абрамова А. 11,14 Duncan
Алиева Н. 8,15 alcohol
Бзикадзе А. 10,14 93CARS
Воинкова Ю. 9,13 coleman
Ершов В. 11,15 Automobile
Зиннатулина Б. 10,13 crime
Иванова Е. 11,14 hills
Кормщикова Ю. 8,13 salarygov
Кухтина Д. 8,12 Sleep
Лозицкий И. 10,12 aircraft
Миллер А. 9,15 education
Охотников Г. 9,12 stackloss

Разное

study/spring2016/islr.1458310934.txt.gz · Последнее изменение: 2016/03/18 17:22 — asl
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0