Спецкурс «Введение в обработку данных» (3 курс)

Место и время проведения: среда, третья пара (13:40-15:15), ауд. 2444-I (у окна)
Преподаватель: Голяндина Нина Эдуардовна 1)
Преподаватель: Коробейников Антон Иванович 2)


Программа курса

Темы состоявшихся занятий

  1. Введение. Краткий обзор. Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки. (03.10.2012)
  2. Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, factor, matrix, data frame, list, ts (time series), expression. Конверсия объектов друг в друга. (03.10.2012, 10.10.2012)
  3. Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы). (10.10.2012)
  4. Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator. (17.10.2012)
  5. Чтение данных из файла и с клавиатуры: функции read.table, scan. Запись данных в файл: функции write, write.table. (17.10.2012)
  6. Основные встроенные «скалярные» функции: sum, prod, max, min, which.max, which.min, range, length. (17.10.2012)
  7. Основные встроенные «векторные» функции: round, rev, sort, rank, scale, pmin, pmax, cum{sum, prod, min, max}, diff, match, which (17.10.2012)
  8. Операции с матрицами: cbind, rbind, t, diag, solve, qr, eigen, svd (17.10.2012)
  9. Группировка, категоризующие переменные, функции над блоками данных: rowsum, aggregate, subset, lapply, sapply, replicate (24.10.2012)
  10. Графические устройства (функции dev.*). Разбиение устройства на блоки. Понятие о графических параметрах (24.10.2012)
  11. Отладка. Функции debug, browser, traceback. (24.10.2012)
  12. Высокоуровневые графические функции: plot, curve, coplot, pairs, density (24.10.2012, 31.10.2012)
  13. Низкоуровневые графические функции: points, line, abline, axis, legend (31.10.2012)
  14. Высокоуровневые графические функции: barplot, hist, boxplot (31.10.2012)
  15. Распределения. Функции распределения, плотности. Моделирование. Функции “d”, “p”, “q”, “r”. Функция sample. (31.10.2012)
  16. Метод наименьших квадратов. Линейная регрессия. (31.10.2012)
  17. Преобразование данных. Пакет plyr. (28.11.2012, 05.12.2012) golfdata.Rdata, sac-basic.R, sac-plyr.R,reshape.R
  18. Пакет lattice. Введение. (05.12.2012) intro.R
  19. Пакет lattice. Изображение одномерных данных. (12.12.2012) univariate.R
  20. Пакет lattice. Изображение двумерных данных: скаттерплоты, матрицы скаттерплотов, parallel plot'ы. Стили линий и т.п. (12.12.2012, 19.12.2012) xyplot.R, splom.R, parallel.R
  21. Пакет lattice. Функции типа identify(). (19.12.2012) lattice.identify.R

Темы будущих занятий

  1. Пакет lattice. Изображение двумерных данных и данных большей размерности. Разное.

Prerequisites

Рекомендуемая литература

Книги

  1. Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
  2. John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
  3. John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  4. Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  5. Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с.

Статьи

  1. John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
  2. John Verzani. Simple R. PDF
  3. Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
  4. David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
  5. Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www

Задачи

Условные обозначения:

  1. Цифра в клетке - порядковый номер «подхода». Наличие цифры означает, что решение было получено, проверено, и результат отослан обратно.
  2. Решетка - задание запрошено и выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет ;-)

Кроме того, пишется дата и время.

3 курс:

Task 1 Task 2 Task 3
Андреев + + ATUS
Григорян + +
Грицай + +
Звонарев + +
Кипрушкин + + Crime
Киселев + +
Куликов + + Films - I
Тарасов + + Airlines
Федяева + + Oscar

Разное

FIXME

1)
в сентябре
2)
октябрь-декабрь
study/fall2012/intror.txt · Последние изменения: 2012/12/26 14:24 — asl
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0