Содержание
Спецкурс «Введение в обработку данных» (3 курс)
Место и время проведения: четверг, вторая пара (11:15-12:50), ауд. 2444-II (дальняя).
Преподаватель: Голяндина Нина Эдуардовна 1)
Преподаватель: Коробейников Антон Иванович 2)
Введение
Программа курса
Курс в некотором смысле «экспериментальный»: программа может (и будет) менятся во время семестра
Темы состоявшихся занятий
- Введение. Краткий обзор. Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки. (27.09.2007)
- Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, factor, matrix, data frame, list, ts (time series), expression. Конверсия объектов друг в друга. (27.09.2007, 04.10.2007)
- Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator. (04.10.2007)
- Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы). (04.10.2007, 11.10.2007)
- Чтение данных из файла и с клавиатуры: функции read.table, scan. Запись данных в файл: функции write, write.table. (11.10.2007, 18.10.2007)
- Основные встроенные «скалярные» функции: sum, prod, max, min, which.max, which.min, range, length (18.10.2007)
- Основные встроенные «векторные» функции: round, rev, sort, rank, scale, pmin, pmax, cum{sum, prod, min, max}, diff, match, which (18.10.2007)
- Группировка, категоризующие переменные, функции над блоками данных: rowsum, aggregate, subset, lapply, sapply (25.10.2007)
- Операции с матрицами: cbind, rbind, t, diag, solve, qr, eigen, svd. (25.10.2007)
- Графические устройства (функции dev.*). Разбиение устройства на блоки: split.screen, screen, erase.screen, close.screen, layout, show.layout. (25.10.2007)
- Высокоуровневые графические функции: plot, curve, boxplot, coplot, matplot, pairs, hist. (01.11.2007)
- Распределения. Функции распределения, плотности. Моделирование. Функции «d», «p», «q», «r». (08.11.2007)
- Метод наименьших квадратов. Линейная регрессия. (08.11.2007, 15.11.2007)
Темы будущих занятий
- Низкоуровневые графические функции: points, lines, text, mtext, segments, arrows, axes, legend, title. Графические параметры.
- Пакеты grid и lattice.
- Циклы и векторизация. Написание скриптов R 3).
- …
Prerequisites
Рекомендуемая литература
Книги
- Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
- John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
- John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
- Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
Статьи
- John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
- John Verzani. Simple R. PDF
- Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
- David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
Задачи
Условные обозначения:
- Цифра в клетке - порядковый номер «подхода». Наличие цифры означает, что решение было получено, проверено, и результат отослан обратно.
- Плюс - зачет, звездочка - штраф, минус - хм, незачет
Кроме того, пишется дата и время.
Task1 | Task2 | Task3 | Task4 (on-line) | Зачет | |
---|---|---|---|---|---|
Бонько Е. | + | + | + | + | ✔ |
Попов С. | + | + | + | + | ✔ |
Тимофеев А. | + | + | + | + | ✔ |
Тимофеев И. | + | + | + | + | ✔ |
Фандеев Д. | + | + | - | - | ✘ |
Юдичев П. | 2* (31.10, 21:02) | -* | - | - | ✘ |