Это старая версия документа!
Содержание
522 гр., по выбору. Спецкурс «Интеллектуальный анализ данных» (5 курс)
Место и время проведения: вторник, первая пара (09:30-11:05)
Преподаватель: Коробейников Антон Иванович
Программа курса
Темы состоявшихся занятий
- Робастная регрессия
- Support Vector Machines
Темы будущих занятий
- Обобщенные линейные модели (GLM)
- Методы уменьшения размерности - PCA, principal component regression, partial least squares
- Unsupervised learning. Кластеризация
Textbook
Онлайн-лекции
Онлайн-лекции к курсу доступны на Stanford Online Содержание лекций (и соответствие с главами ISLR):
- Week 1: Introduction and Overview of Statistical Learning (Chapters 1-2)
- Week 2: Linear Regression (Chapter 3)
- Week 3: Classification (Chapter 4)
- Week 4: Resampling Methods (Chapter 5)
- Week 5: Linear Model Selection and Regularization (Chapter 6)
- Week 6: Moving Beyond Linearity (Chapter 7)
- Week 7: Tree-based Methods (Chapter 8)
- Week 8: Support Vector Machines (Chapter 9)
- Week 9: Unsupervised Learning (Chapter 10)
Домашние задания
- Глава 3 ISLR. Индивидуальные задания после главы 3 (Regression)
- Робастная регрессия
- Глава 4 ISLR. Индивидуальные задания после главы 4 (Classification)
- Глава 5 ISLR. Индивидуальные задания после главы 5 (Resampling)
- Глава 6 ISLR. Индивидуальные задания после главы 6 (Regularization)
- Глава 8 ISLR. Индивидуальные задания после главы 8 (Trees)
- Глава 9 ISLR. Индивидуальные задания после главы 9 (SVM)
Prerequisites
Рекомендуемая литература
Книги
- Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
- John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
- John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с. PDF
- Роберт И. Кабаков R в действии. Анализ и визуализация данных в R. – М.: ДМК Пресс, 2013. – 280 с.
Статьи
- John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
- John Verzani. Simple R. PDF
- Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
- David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
- Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www
Задачи
Условные обозначения:
- Цифра в клетке - порядковый номер «подхода». Наличие цифры означает, что решение было получено, проверено, и результат отослан обратно.
- Решетка - задание запрошено и выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет
Кроме того, пишется дата и время.
Внимание: Если напротив Вашей фамилии отсутствует назначенное задание, то для его получения Вам следует отправить запрос по почте.
Regression I | Regression II | Classification | Resampling | Regularization | Trees | SVM | Зачет | |
---|---|---|---|---|---|---|---|---|
Арсланов Николай Адельевич | + | 2 (07.06) | + | + | + | + | 1 (07.06) | |
Гоголева Елена Владимировна | + | + | + | + | + | + | + | |
Гребенюк Алексей Сергеевич | + | 1 (7.06) | + | + | + | + | + | |
Ежов Федор Валерьевич | + | 2 (7.06) | + | + | + | + | + | |
Капаца Дейвид | + | + | + | + | + | + | + | |
Кононыхин Иван Александрович | + | + | + | + | + | + | + | |
Ларин Евгений Сергеевич | + | 1 (7.06) | + | + | + | + | + | |
Леонович Роман Александрович | + | 1 (27.05) | + | + | - | - | - | |
Мандрикова Анастасия Андреевна | + | + | + | + | + | + | + | |
Хе Пин | III.10 | IV.10 | V.9 | VI.8 | VIII.10 | IX.7 |