422 гр., все. Спецкурс «Выч. методы и пакеты в статистическом исследовании» (4 курс)

Место и время проведения: вторник, 3 пара, ауд 2406; 4 пара, ауд 2406
Преподаватель: Коробейников Антон Иванович
Преподаватель: Звонарев Никита Константинович


Программа курса

Базовый R

  1. Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки.
  2. Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, matrix, data frame, list, expression. Конверсия объектов друг в друга.
  3. Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы).
  4. Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator. Область видимости переменных.
  5. Чтение и запись данных из файла. Функции scan, read.table, write.table и пр.
  6. Основные встроенные «скалярные» функции: sum, prod, max, min, which.max, which.min, range, length
  7. Основные встроенные «векторные» функции: round, rev, sort, rank, scale, pmin, pmax, cum{sum, prod, min, max}, diff, match, which
  8. Операции с матрицами: cbind, rbind, t, diag, solve, qr, eigen, svd
  9. Функции над блоками данных: lapply, sapply, replicate
  10. Графические устройства (функции dev.*). Разбиение устройства на блоки. Понятие о графических параметрах
  11. Высокоуровневые графические функции: plot, curve, pairs, density
  12. Низкоуровневые графические функции: points, line, axis, legend
  13. Распределения. Функции распределения, плотности. Моделирование. Функции “d”, “p”, “q”, “r”. Функция sample
  14. Отладка. Функции debug, browser, traceback
  15. Векторизация. Эффективная работа с памятью
  16. Нахождение (локальных) экстремумов функций

Задачи

  1. Оценки максимального правдоподобия
  2. EM-алгоритм. Построение ОМП для смеси нормально распределенных случайных величин
  3. Моделирование. Адаптивный метод отбора
  4. Вычисление интеграла методом Монте-Карло
  5. Markov Chain Monte Carlo

Схема сдачи и проверки задач

  1. У каждой задачи два дедлайна: мягкий и жесткий
  2. При отсылке решения задачи после жесткого дедлайна задача не проверяется и не принимается
  3. При отсылке решения задачи до мягкого дедлайна задача проверяется неограниченное количество раз со следующими ограничениями:
    1. Задача проверяется не чаще одного раза в сутки
    2. Задача проверяется как минимум один раз
    3. Остальные проверки – при наличии свободного времени
  4. При отсылке решения задачи после мягкого и до жесткого дедлайна задача проверятся ровно один раз
  5. Все дедлайны до 23:59 соотв. дня
  6. Задачи необходимо присылать в формате R Markdown: исходный код и полученный html

(Возможные) будущие задачи

  1. Вычисление интеграла методом Монте-Карло
  2. Моделирование. Markov Chain Monte-Carlo. Метод Метрополиса-Хастингса
  3. Support Vector Machines
  4. Бутстреп
  5. Вычисление стационарного распределения марковской цепи
  6. Метод Гусеница-SSA
  7. Проверка статистических гипотез
  8. Кластерный анализ
  9. Нейронные сети
  10. Деревья классификации и регрессии. Методы улучшения классификаторов. Bagging. Boosting. Алгоритм AdaBoost
  11. Логистическая и нелинейная регрессия
  12. Планирование эксперимента
  13. Hidden Markov Models

Prerequisites

Дистрибутив R:

Редакторы и оболочки:

Рекомендуемая литература

Книги

  1. Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
  2. John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
  3. John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  4. Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  5. Ермаков С.М. Статистическое моделирование, часть II PDF
  6. Голяндина Н.Э. Метод «Гусеница»-SSA: анализ временных рядов: Учеб. пособие. СПб: Изд-во СПбГУ, 2004. 76 с.PDF
  7. Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с.

Статьи

  1. John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
  2. John Verzani. Simple R. PDF
  3. Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
  4. David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
  5. Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www
  6. А.И. Коробейников Оценки максимального правдоподобия в условиях цензурирования на базе EM-алгоритма PDF
  7. Patrick Burns The R Inferno PDF
  8. Patrick Burns S Poetry PDF

Задачи

  • Решение принимается в виде отчета в Rmarkdown
  • Подгруппа 1 сдает Simulation и MCMC Коробейникову А.И, а EM и Monte-Carlo Звонареву Н.К.
  • Подгруппа 2 сдает Simulation и MCMC Звонареву Н.К, а EM и Monte-Carlo Коробейникову А.И.

Подгруппа 1

  1. Абильдаев
  2. Капаца
  3. Барсуков
  4. Железняк
  5. Фахртдинов
  6. Заляев

Подгруппа 2

  1. Горшечникова
  2. Магдич
  3. Полшков
  4. Мандрикова
  5. Кушнир

Условные обозначения: Решетка - задание выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет.

MLE EM Simulation Monte-Carlo MCMC
Горшечникова Влада + + - + -
Магдич Лиза + + + + +
Абильдаев Темирлан - + + + +
Капаца Дейвид - + + + +
Полшков Виталий + + + + -
Барсуков Егор - + - + -
Заляев Тимур - - - - -
Железняк Олег - + + + +
Мандрикова Анастасия + + - - +
Кушнир Дмитрий + + - - -
Фахртдинов Тимур - - - + +

Внимание: Если напротив Вашей фамилии отсутствует назначенное задание, то для его получения Вам следует отправить запрос по почте.

study/spring2020/compstat.txt · Последнее изменение: 2020/06/07 13:53 — asl
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0