Спецкурс «Выч. методы и пакеты в статистическом исследовании» (4 курс)

Место и время проведения: вторник, 3 пара, ауд TBA; 4-5 пары, ауд TBA
Преподаватель: Коробейников Антон Иванович
Преподаватель: Шлемов Александр Юрьевич


Программа курса

Темы состоявшихся занятий

  1. Введение. Краткий обзор. Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки. (11.02.2014)
  2. Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, matrix, data frame, list, expression. Конверсия объектов друг в друга. (11.02.2014)
  3. Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы). (11.02.2014)
  4. Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator. Область видимости переменных. (11.02.2014)
  5. Чтение и запись данных из файла. Функции scan, read.table, write.table и пр. (18.02.2014)
  6. Основные встроенные «скалярные» функции: sum, prod, max, min, which.max, which.min, range, length (18.02.2014)
  7. Основные встроенные «векторные» функции: round, rev, sort, rank, scale, pmin, pmax, cum{sum, prod, min, max}, diff, match, which (18.02.2014)
  8. Операции с матрицами: cbind, rbind, t, diag, solve, qr, eigen, svd (18.02.2014)
  9. Функции над блоками данных: lapply, sapply, replicate (18.02.2014)
  10. Графические устройства (функции dev.*). Разбиение устройства на блоки. Понятие о графических параметрах (25.02.2014)
  11. Высокоуровневые графические функции: plot, curve, pairs, density (25.02.2014)
  12. Низкоуровневые графические функции: points, line, axis, legend (25.02.2014)
  13. Распределения. Функции распределения, плотности. Моделирование. Функции “d”, “p”, “q”, “r”. Функция sample (25.02.2014)
  14. Отладка. Функции debug, browser, traceback (25.02.2014)
  15. Векторизация. Эффективная работа с памятью (25.02.2014)
  16. Нахождение (локальных) экстремумов функций (25.02.2014)

Темы будущих занятий

Задачи

  1. Вычисление стационарного распределения марковской цепи (Task 0)
  2. Вычисление интеграла методом Монте-Карло (Task 1)
  3. Моделирование. Адаптивный метод отбора (Task 2)
  4. Оценки максимального правдоподобия (Task 3)
  5. EM-алгоритм. Построение ОМП для смеси нормально распределенных случайных величин (Task 4)
  6. Support Vector Machines (Task 5)
  7. Метод Гусеница-SSA (Task 6)
  8. Бутстреп (Task 7)
  9. Линейные модели I (Task 8)
  10. Линейные модели II (Task 9)

(Возможные) будущие задачи

  1. Проверка статистических гипотез
  2. Кластерный анализ
  3. Нейронные сети
  4. Деревья классификации и регрессии. Методы улучшения классификаторов. Bagging. Boosting. Алгоритм AdaBoost
  5. Моделирование. Markov Chain Monte-Carlo. Метод Метрополиса-Хастингса. Метод Гиббса.
  6. Логистическая и нелинейная регрессия
  7. Планирование эксперимента
  8. Hidden Markov Models

Prerequisites

Дистрибутив R:

Редакторы и оболочки:

Рекомендуемая литература

Книги

  1. Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
  2. John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
  3. John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  4. Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  5. Ермаков С.М. Статистическое моделирование, часть II PDF
  6. Голяндина Н.Э. Метод «Гусеница»-SSA: анализ временных рядов: Учеб. пособие. СПб: Изд-во СПбГУ, 2004. 76 с.PDF
  7. Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с.

Статьи

  1. John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
  2. John Verzani. Simple R. PDF
  3. Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
  4. David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
  5. Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www
  6. А.И. Коробейников Оценки максимального правдоподобия в условиях цензурирования на базе EM-алгоритма PDF
  7. Patrick Burns The R Inferno PDF
  8. Patrick Burns S Poetry PDF

Задачи

Условные обозначения:

  1. Решетка - задание выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет. Кроме того, пишется дата и время. Если вы отправляете задание по почте, то ) — означает, что Ваше решение в целом понравилось проверяющему, ? — означает, что прислано что-то разумное, но переписку следовало бы продолжить.

Внимание: Если напротив Вашей фамилии отсутствует назначенное задание, то для его получения Вам следует отправить запрос по почте.

Task 0 Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Task 7 Task 8 Task 9 Penalty
Андреев + + + + + + + + + + 0%
Звонарев + + + + + + + + + + 0%
Кипрушкин + + 12 18 + + + # + uwgs.txt 40%
Куликов + + + + 2, banknote.txt hillvalley.zip 5 # # inss.txt 60%
Тарасов + + + + + + + + + + 0%
Федяева + + + + + + + + + + 0%
Багина + + + + + + + + + + 0%
Бородина + + + + + + + + + + 0%
Буракова + + + + + + + # # pul.txt 30%
Волосенко + + + + + + + + + + 0%
Погосян + + + + + + + + + + 0%
Воеводская + + + 5 2, wreath2.txt ionosphere.zip 8 # # uw.txt 70%
Task 0 Task 1 Task 2 Task 3 Task 4 Task 5 Task 6 Task 7 Task 8 Task 9 Penalty
Яковлева + + + + + + + + + + 0%
Калашникова + + + + + + + + + + 0%
Смирнова + + + + + + + + + + 0%
Абдрахманов + + + + + ozone1.zip + + + + 10%
Шувалов + + + 6 + ozone2.zip 13 # # plp.txt 60%
Грицай + + + + + + + + + + 0%
Просвирнина + + + + + + + + + + 0%
Севастьянова + + + + 2, tn2.txt spect.zip 7 # # ins.txt 60%
Тихомиров + + + 3 + + + # # pg.txt 40%
Сорокин + + + + + + + + + + 0%
Артишевская + + + + + + + + + + 0%
study/spring2014/compstat.txt · Последние изменения: 2014/09/23 14:31 — asl
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0