Спецкурс «Выч. методы и пакеты в статистическом исследовании» (4 курс)

Место и время проведения: 3 пара, ауд 2446; 4-5 пары, ауд 4526
Преподаватель: Коробейников Антон Иванович
Преподаватель: Шлемов Александр Юрьевич


Программа курса

Темы состоявшихся занятий

  1. Введение. Краткий обзор. Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки. (09.02.2011)
  2. Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, matrix, data frame, list, expression. Конверсия объектов друг в друга. (09.02.2011)
  3. Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы). (09.02.2011)
  4. Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator. (16.02.2011)
  5. Чтение и запись данных из файла. Функции scan, read.table, write.table и пр. (16.02.2011)
  6. Основные встроенные «скалярные» функции: sum, prod, max, min, which.max, which.min, range, length (16.02.2011)
  7. Основные встроенные «векторные» функции: round, rev, sort, rank, scale, pmin, pmax, cum{sum, prod, min, max}, diff, match, which (16.02.2011, частично)
  8. Операции с матрицами: cbind, rbind, t, diag, solve, qr, eigen, svd. (16.02.2011)
  9. Функции над блоками данных: lapply, sapply, replicate. (02.03.2011)
  10. Графические устройства (функции dev.*). Разбиение устройства на блоки. Понятие о графических параметрах. (02.03.2011)
  11. Высокоуровневые графические функции: plot, curve, pairs, density. (02.03.2011)
  12. Низкоуровневые графические функции: points, line, axis, legend. (02.03.2011)
  13. Распределения. Функции распределения, плотности. Моделирование. Функции “d”, “p”, “q”, “r”. Функция sample. (02.03.2011)
  14. Отладка. Функции debug, browser, traceback. (09.03.2011)
  15. Векторизация. Эффективная работа с памятью. (09.03.2011)
  16. Нахождение (локальных) экстремумов функций. (09.03.2011)

Темы будущих занятий

Задачи

  1. Вычисление стационарного распределения марковской цепи. (Problem 0, 09.03.2011)
  2. Моделирование. Адаптивный метод отбора. (Problem 1, 09.03.2011)
  3. Вычисление интеграла методом Монте-Карло. (Problem 2, 23.03.2011)
  4. Оценки максимального правдоподобия. (Problem 3, 23.03.2011)
  5. EM-алгоритм. Построение ОМП для смеси нормально распределенных случайных величин. (Problem 4, 30.03.2011)
  6. Support Vector Machines. (Problem 5, 06.04.2011)
  7. Линейная регрессия. (Problem 6, 13.04.2011)
  8. Кластерный анализ. (Problem 7, 20.04.2011)
  9. Нейронные сети. (Problem 8, 27.04.2011)
  10. Метод Гусеница-SSA. (Problem 9, 04.05.2011)
  11. Деревья классификации и регрессии. Методы улучшения классификаторов. Bagging. Boosting. Алгоритм AdaBoost. (Problem 10, 11.05.2011)

(Возможные) будущие задачи

  1. Моделирование. Markov Chain Monte-Carlo. Метод Метрополиса-Хастингса. Метод Гиббса.
  2. Логистическая и нелинейная регрессия
  3. Планирование эксперимента

Prerequisites

Дистрибутив R:

Редакторы и оболочки:

Рекомендуемая литература

Книги

  1. Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
  2. John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
  3. John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  4. Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  5. Ермаков С.М. Статистическое моделирование, часть II PDF
  6. Голяндина Н.Э. Метод «Гусеница»-SSA: анализ временных рядов: Учеб. пособие. СПб: Изд-во СПбГУ, 2004. 76 с.PDF

Статьи

  1. John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
  2. John Verzani. Simple R. PDF
  3. Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
  4. David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
  5. Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www
  6. А.И. Коробейников Оценки максимального правдоподобия в условиях цензурирования на базе EM-алгоритма PDF
  7. Patrick Burns The R Inferno PDF
  8. Patrick Burns S Poetry PDF

Задачи

Условные обозначения:

  1. Решетка - задание запрошено и выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет

Кроме того, пишется дата и время.

0 1 2 3 4 5 6 7 8 9 10* Penalty
Бояров Андрей + 8 2 15 + + + + + + 30%
Галиаскарова Наталья + 9 + 16 + + + + 4 40%
Горбунова Ирина + + + + + + + + + 15 + 0%
Притыковская Наталья + + + + + + + + + + + -10%
Сенов Александр + 15 + + + + + + + + + 0%
Сукманская Ксения + 14 + 20 + + + + + 5 + 20%
Векличева Марья + + + + + + + + + + + -10%
Портянко Иван + + + + + + + + + + + -10%
0 1 2 3 4 5 6 7 8 9 10* Penalty
Губанов Сергей + + + + + + + + 11 20%
Жукова Екатерина + + + + + + + + + + + -10%
Сыров Денис + + + + + + + + + + 0%
Бойченко Алексей + + + + + + 11 12 40%
Чернышев Виталий + + + + + glaucomam.zip 3 13 50%
Яковлева Юлия + + + + + + + + 20%
Золкин Никита + 6 + 2 1, 2dn.txt + + + + + + 20%
Гольдвирт Серафима + + 17 + + + + + 30%
Булович Надежда + + + + + + + 1 30%

Внимание: Если напротив Вашей фамилии отсутствует назначенное задание, то для его получения Вам следует отправить запрос по почте.

Разное

study/spring2011/compstat.txt · Последние изменения: 2011/09/27 22:26 — asl
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0