Содержание
422 гр., все. Спецкурс «Выч. методы и пакеты в статистическом исследовании» (4 курс)
Место и время проведения: вторник, 3 пара, ауд 2406; 4 пара, ауд 2406
Преподаватель: Коробейников Антон Иванович
Преподаватель: Звонарев Никита Константинович
Программа курса
Базовый R
- Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки.
- Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, matrix, data frame, list, expression. Конверсия объектов друг в друга.
- Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы).
- Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator. Область видимости переменных.
- Чтение и запись данных из файла. Функции scan, read.table, write.table и пр.
- Основные встроенные «скалярные» функции: sum, prod, max, min, which.max, which.min, range, length
- Основные встроенные «векторные» функции: round, rev, sort, rank, scale, pmin, pmax, cum{sum, prod, min, max}, diff, match, which
- Операции с матрицами: cbind, rbind, t, diag, solve, qr, eigen, svd
- Функции над блоками данных: lapply, sapply, replicate
- Графические устройства (функции dev.*). Разбиение устройства на блоки. Понятие о графических параметрах
- Высокоуровневые графические функции: plot, curve, pairs, density
- Низкоуровневые графические функции: points, line, axis, legend
- Распределения. Функции распределения, плотности. Моделирование. Функции “d”, “p”, “q”, “r”. Функция sample
- Отладка. Функции debug, browser, traceback
- Векторизация. Эффективная работа с памятью
- Нахождение (локальных) экстремумов функций
Задачи
- Оценки максимального правдоподобия
- EM-алгоритм. Построение ОМП для смеси нормально распределенных случайных величин
- Моделирование. Адаптивный метод отбора
- Вычисление интеграла методом Монте-Карло
- Markov Chain Monte Carlo
Схема сдачи и проверки задач
- У каждой задачи два дедлайна: мягкий и жесткий
- При отсылке решения задачи после жесткого дедлайна задача не проверяется и не принимается
- При отсылке решения задачи до мягкого дедлайна задача проверяется неограниченное количество раз со следующими ограничениями:
- Задача проверяется не чаще одного раза в сутки
- Задача проверяется как минимум один раз
- Остальные проверки – при наличии свободного времени
- При отсылке решения задачи после мягкого и до жесткого дедлайна задача проверятся ровно один раз
- Все дедлайны до 23:59 соотв. дня
- Задачи необходимо присылать в формате R Markdown: исходный код и полученный html
(Возможные) будущие задачи
- Вычисление интеграла методом Монте-Карло
- Моделирование. Markov Chain Monte-Carlo. Метод Метрополиса-Хастингса
- Support Vector Machines
- Бутстреп
- Вычисление стационарного распределения марковской цепи
- Метод Гусеница-SSA
- Проверка статистических гипотез
- Кластерный анализ
- Нейронные сети
- Деревья классификации и регрессии. Методы улучшения классификаторов. Bagging. Boosting. Алгоритм AdaBoost
- Логистическая и нелинейная регрессия
- Планирование эксперимента
- Hidden Markov Models
- …
Prerequisites
Рекомендуемая литература
Книги
- Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
- John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
- John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Ермаков С.М. Статистическое моделирование, часть II PDF
- Голяндина Н.Э. Метод «Гусеница»-SSA: анализ временных рядов: Учеб. пособие. СПб: Изд-во СПбГУ, 2004. 76 с.PDF
- Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с.
Статьи
- John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
- John Verzani. Simple R. PDF
- Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
- David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
- Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www
- А.И. Коробейников Оценки максимального правдоподобия в условиях цензурирования на базе EM-алгоритма PDF
- Patrick Burns The R Inferno PDF
- Patrick Burns S Poetry PDF
Задачи
- Решение принимается в виде отчета в Rmarkdown
- Подгруппа 1 сдает Simulation и MCMC Коробейникову А.И, а EM и Monte-Carlo Звонареву Н.К.
- Подгруппа 2 сдает Simulation и MCMC Звонареву Н.К, а EM и Monte-Carlo Коробейникову А.И.
Подгруппа 1
- Абильдаев
- Капаца
- Барсуков
- Железняк
- Фахртдинов
- Заляев
Подгруппа 2
- Горшечникова
- Магдич
- Полшков
- Мандрикова
- Кушнир
Условные обозначения: Решетка - задание выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет.
MLE | EM | Simulation | Monte-Carlo | MCMC | |
---|---|---|---|---|---|
Горшечникова Влада | + | + | - | + | - |
Магдич Лиза | + | + | + | + | + |
Абильдаев Темирлан | - | + | + | + | + |
Капаца Дейвид | - | + | + | + | + |
Полшков Виталий | + | + | + | + | - |
Барсуков Егор | - | + | - | + | - |
Заляев Тимур | - | - | - | - | - |
Железняк Олег | - | + | + | + | + |
Мандрикова Анастасия | + | + | - | - | + |
Кушнир Дмитрий | + | + | - | - | - |
Фахртдинов Тимур | - | - | - | + | + |
Внимание: Если напротив Вашей фамилии отсутствует назначенное задание, то для его получения Вам следует отправить запрос по почте.