Содержание
Спецкурс «Выч. методы и пакеты в статистическом исследовании» (4 курс)
Место и время проведения: 1-2 пары, ауд 4526; 3 пара, ауд 2446
Преподаватель: Коробейников Антон Иванович, Усевич Константин Дмитриевич
Программа курса
Темы состоявшихся занятий
- Введение. Краткий обзор. Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки. (10.02.2010)
- Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, matrix, data frame, list, expression. Конверсия объектов друг в друга. (10.02.2010)
- Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы). (10.02.2010)
- Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator. (10.02.2010, 17.02.2010)
- Основные встроенные «скалярные» функции: sum, prod, max, min, which.max, which.min, range, length (17.02.2010)
- Основные встроенные «векторные» функции: round, rev, sort, rank, scale, pmin, pmax, cum{sum, prod, min, max}, diff, match, which (17.02.2010)
- Функции над блоками данных: lapply, sapply, replicaten (17.02.2010)
- Операции с матрицами: cbind, rbind, t, diag, solve, qr, eigen, svd (17.02.2010)
- Графические устройства (функции dev.*). Разбиение устройства на блоки. Понятие о графических параметрах. (24.02.2010)
- Высокоуровневые графические функции: plot, curve, coplot, pairs, density (24.02.2010)
- Распределения. Функции распределения, плотности. Моделирование. Функции “d”, “p”, “q”, “r”. Функция sample. (24.02.2010)
- Низкоуровневые графические функции: points, line, axis, legend. (24.02.2010)
- Отладка. Функции debug, browser, traceback. (17.02.2010)
- Векторизация. Эффективная работа с памятью. (17.02.2010)
- Нахождение (локальных) экстремумов функций (24.02.2010)
Темы будущих занятий
Задачи
- Вычисление стационарного распределения марковской цепи (Problem 0)
- Моделирование. Адаптивный метод отбора (Problem 1)
- Вычисление интеграла методом Монте-Карло (Problem 2)
- Оценки максимального правдоподобия (Problem 3)
- EM-алгоритм. Построение ОМП для смеси нормально распределенных случайных величин (Problem 4)
- Support Vector Machines (Problem 5)
- Метод Гусеница-SSA (Problem 6)
- Кластерный анализ (Problem 7)
- Линейная регрессия (Problem 8)
- Нейронные сети (Problem 9)
(Возможные) будущие задачи
- Линейная, логистическая и нелинейная регрессия
- Планирование эксперимента
- …
Prerequisites
Дистрибутив R:
Редакторы и оболочки:
Рекомендуемая литература
Книги
- Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
- John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
- John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Ермаков С.М. Статистическое моделирование, часть II PDF
- Голяндина Н.Э. Метод «Гусеница»-SSA: анализ временных рядов: Учеб. пособие. СПб: Изд-во СПбГУ, 2004. 76 с.PDF
Статьи
- John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
- John Verzani. Simple R. PDF
- Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
- David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
- Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www
- А.И. Коробейников Оценки максимального правдоподобия в условиях цензурирования на базе EM-алгоритма PDF
Задачи
Условные обозначения:
- Решетка - задание запрошено и выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет
Кроме того, пишется дата и время.
Problem 0 | Problem 1 | Problem 2 | Problem 3 | Problem 4 | Problem 5 | Problem 6 | Problem 7 | Problem 8 | Problem 9 | Допуск | |
---|---|---|---|---|---|---|---|---|---|---|---|
Антонов А. | + | + | + | + | + | + | + | + | + | + | + |
Егорова О. | + | + | + | + | + | + | + | + | + | + | + |
Жукова М. | + | + | + | + | + | + | + | + | + | + | + |
Матвеева Ю. | + | + | + | + | + | + | + | + | + | + | + |
Шлемов А. | + | + | + | + | + | + | + | + | + | + | + |
Яковенко А. | + | + | + | + | + | + | + | + | + | + | + |
Болотов Ю. | + | + | + | + | + | + | 10 | + | # | 3 | |
Голяндина А. | + | + | + | + | + | + | + | + | + | + | + |
Евстафьева Н. | + | + | + | + | + | + | + | + | + | + | + |
Кубасова Ю. | + | + | + | + | + | + | + | + | + | + | + |
Problem 0 | Problem 1 | Problem 2 | Problem 3 | Problem 4 | Problem 5 | Problem 6 | Problem 7 | Problem 8 | Problem 9 | Допуск | |
---|---|---|---|---|---|---|---|---|---|---|---|
Александров А. | + | + | + | + | + | + | + | + | + | + | + |
Дмитриев А. | + | + | + | + | + | + | + | + | + | + | + |
Васильев Д. | + | + | + | + | + | + | + | + | + | + | + |
Бонько Е. | + | + | + | + | + | + | + | + | + | + | + |
Титоренко А. | + | + | + | + | + | + | + | + | + | + | + |
Фидельман Д. | + | + | + | + | + | + | + | + | + | + | + |
Аношина Т. | + | + | + | + | + | + | + | + | + | + | + |
Сизов А. | + | + | + | + | + | + | + | + | + | + | + |
Натекин А. | + | + | + | + | + | + | + | + | + | + | + |
Дерягин Е. | + | + | + | # | # | # | # | # | # | # | 7 |
Тамазян Г. | + | + | + | 10 | 2, cross.txt | + | 2 | + | # | + | 4 |
Внимание: Если напротив Вашей фамилии отсутствует назначенное задание, то для его получения Вам следует отправить запрос по почте.
Разное
Список рассылки: http://groups.google.com/a/statmod.ru/group/r-spring-2010
Запись на первую часть беседы по программе экзамена
27.05.2010, с 11:00. Аудитория будет известна позднее. Необходимым условием для записи является наличие допуска. Не более 12 человек.
- Егорова О.
- Жукова М.
- Александров А.
- Дмитриев А.
Запись на вторую часть беседы по программе экзамена
08.06.2010, с 11:00. Аудитория будет известна позднее. Необходимым условием для записи является наличие допуска. Не более 10 человек.
- Васильев Д.
- Кубасова Ю.
- Антонов А.