Содержание
Спецкурс «Выч. методы и пакеты в статистическом исследовании» (4 курс)
Место и время проведения: вторник, 3 пара, ауд TBA; 4-5 пары, ауд TBA
Преподаватель: Коробейников Антон Иванович
Преподаватель: Шлемов Александр Юрьевич
Программа курса
Темы состоявшихся занятий
- Введение. Краткий обзор. Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки. (11.02.2014)
- Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, matrix, data frame, list, expression. Конверсия объектов друг в друга. (11.02.2014)
- Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы). (11.02.2014)
- Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator. Область видимости переменных. (11.02.2014)
- Чтение и запись данных из файла. Функции scan, read.table, write.table и пр. (18.02.2014)
- Основные встроенные «скалярные» функции: sum, prod, max, min, which.max, which.min, range, length (18.02.2014)
- Основные встроенные «векторные» функции: round, rev, sort, rank, scale, pmin, pmax, cum{sum, prod, min, max}, diff, match, which (18.02.2014)
- Операции с матрицами: cbind, rbind, t, diag, solve, qr, eigen, svd (18.02.2014)
- Функции над блоками данных: lapply, sapply, replicate (18.02.2014)
- Графические устройства (функции dev.*). Разбиение устройства на блоки. Понятие о графических параметрах (25.02.2014)
- Высокоуровневые графические функции: plot, curve, pairs, density (25.02.2014)
- Низкоуровневые графические функции: points, line, axis, legend (25.02.2014)
- Распределения. Функции распределения, плотности. Моделирование. Функции “d”, “p”, “q”, “r”. Функция sample (25.02.2014)
- Отладка. Функции debug, browser, traceback (25.02.2014)
- Векторизация. Эффективная работа с памятью (25.02.2014)
- Нахождение (локальных) экстремумов функций (25.02.2014)
Темы будущих занятий
Задачи
- Вычисление стационарного распределения марковской цепи (Task 0)
- Вычисление интеграла методом Монте-Карло (Task 1)
- Моделирование. Адаптивный метод отбора (Task 2)
- Оценки максимального правдоподобия (Task 3)
- EM-алгоритм. Построение ОМП для смеси нормально распределенных случайных величин (Task 4)
- Support Vector Machines (Task 5)
- Метод Гусеница-SSA (Task 6)
- Бутстреп (Task 7)
- Линейные модели I (Task 8)
- Линейные модели II (Task 9)
(Возможные) будущие задачи
- Проверка статистических гипотез
- Кластерный анализ
- Нейронные сети
- Деревья классификации и регрессии. Методы улучшения классификаторов. Bagging. Boosting. Алгоритм AdaBoost
- Моделирование. Markov Chain Monte-Carlo. Метод Метрополиса-Хастингса. Метод Гиббса.
- Логистическая и нелинейная регрессия
- Планирование эксперимента
- Hidden Markov Models
- …
Prerequisites
Дистрибутив R:
Редакторы и оболочки:
Рекомендуемая литература
Книги
- Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
- John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
- John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Ермаков С.М. Статистическое моделирование, часть II PDF
- Голяндина Н.Э. Метод «Гусеница»-SSA: анализ временных рядов: Учеб. пособие. СПб: Изд-во СПбГУ, 2004. 76 с.PDF
- Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с.
Статьи
- John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
- John Verzani. Simple R. PDF
- Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
- David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
- Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www
- А.И. Коробейников Оценки максимального правдоподобия в условиях цензурирования на базе EM-алгоритма PDF
- Patrick Burns The R Inferno PDF
- Patrick Burns S Poetry PDF
Задачи
Условные обозначения:
- Решетка - задание выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет. Кроме того, пишется дата и время. Если вы отправляете задание по почте, то ) — означает, что Ваше решение в целом понравилось проверяющему, ? — означает, что прислано что-то разумное, но переписку следовало бы продолжить.
Внимание: Если напротив Вашей фамилии отсутствует назначенное задание, то для его получения Вам следует отправить запрос по почте.
Task 0 | Task 1 | Task 2 | Task 3 | Task 4 | Task 5 | Task 6 | Task 7 | Task 8 | Task 9 | Penalty | |
---|---|---|---|---|---|---|---|---|---|---|---|
Андреев | + | + | + | + | + | + | + | + | + | + | 0% |
Звонарев | + | + | + | + | + | + | + | + | + | + | 0% |
Кипрушкин | + | + | 12 | 18 | + | + | + | # | + | uwgs.txt | 40% |
Куликов | + | + | + | + | 2, banknote.txt | hillvalley.zip | 5 | # | # | inss.txt | 60% |
Тарасов | + | + | + | + | + | + | + | + | + | + | 0% |
Федяева | + | + | + | + | + | + | + | + | + | + | 0% |
Багина | + | + | + | + | + | + | + | + | + | + | 0% |
Бородина | + | + | + | + | + | + | + | + | + | + | 0% |
Буракова | + | + | + | + | + | + | + | # | # | pul.txt | 30% |
Волосенко | + | + | + | + | + | + | + | + | + | + | 0% |
Погосян | + | + | + | + | + | + | + | + | + | + | 0% |
Воеводская | + | + | + | 5 | 2, wreath2.txt | ionosphere.zip | 8 | # | # | uw.txt | 70% |
Task 0 | Task 1 | Task 2 | Task 3 | Task 4 | Task 5 | Task 6 | Task 7 | Task 8 | Task 9 | Penalty | |
---|---|---|---|---|---|---|---|---|---|---|---|
Яковлева | + | + | + | + | + | + | + | + | + | + | 0% |
Калашникова | + | + | + | + | + | + | + | + | + | + | 0% |
Смирнова | + | + | + | + | + | + | + | + | + | + | 0% |
Абдрахманов | + | + | + | + | + | ozone1.zip | + | + | + | + | 10% |
Шувалов | + | + | + | 6 | + | ozone2.zip | 13 | # | # | plp.txt | 60% |
Грицай | + | + | + | + | + | + | + | + | + | + | 0% |
Просвирнина | + | + | + | + | + | + | + | + | + | + | 0% |
Севастьянова | + | + | + | + | 2, tn2.txt | spect.zip | 7 | # | # | ins.txt | 60% |
Тихомиров | + | + | + | 3 | + | + | + | # | # | pg.txt | 40% |
Сорокин | + | + | + | + | + | + | + | + | + | + | 0% |
Артишевская | + | + | + | + | + | + | + | + | + | + | 0% |