322 гр., спец. СМ. Спецкурс «Введение в обработку данных»

Место и время проведения: вторник, первая пара (09:30-11:05), ауд. 2406
Преподаватель: Голяндина Нина Эдуардовна 1)
Преподаватель: Коробейников Антон Иванович 2)


Программа курса

Темы состоявшихся занятий

  1. Введение. Краткий обзор. Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки.
  2. Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, factor, matrix, data frame, list, ts (time series), expression. Конверсия объектов друг в друга.
  3. Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы).
  4. Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator.
  5. Основные встроенные «скалярные» функции: sum, prod, max, min, which.max, which.min, range, length.
  6. Основные встроенные «векторные» функции: round, rev, sort, rank, scale, pmin, pmax, cum{sum, prod, min, max}, diff, match, which
  7. Чтение данных из файла и с клавиатуры: функции read.table, scan. Запись данных в файл: функции write, write.table.
  8. Группировка, категоризующие переменные, функции над блоками данных: rowsum, aggregate, subset, lapply, sapply, replicate
  9. Операции с матрицами: cbind, rbind, t, diag, solve, qr, eigen, svd
  10. Графические устройства (функции dev.*). Разбиение устройства на блоки. Понятие о графических параметрах
  11. Высокоуровневые графические функции: plot, curve, coplot, pairs, density
  12. Низкоуровневые графические функции: points, line, abline, axis, legend
  13. Высокоуровневые графические функции: barplot, hist, boxplot
  14. Распределения. Функции распределения, плотности. Моделирование. Функции “d”, “p”, “q”, “r”.
  15. Функция sample
  16. Отладка. Функции debug, browser, traceback, recover
  17. Пакет lattice. Введение. intro.R
  18. Пакет lattice. Изображение одномерных данных. univariate.R
  19. Пакет lattice. Изображение двумерных данных: скаттерплоты, матрицы скаттерплотов, parallel plot'ы. Стили линий и т.п.xyplot.R, splom.R, parallel.R
  20. Пакет lattice. Функции типа identify(). lattice.identify.R

Темы будущих занятий

  1. Преобразование данных. Пакеты tidyr и plyr. tidyr.pdf
  2. Системы рисования. Пакет ggplot ggplot.zip.
  3. Преобразование данных. Пакет plyr
  4. Метод наименьших квадратов. Линейная регрессия

Prerequisites

Дистрибутив R:

Редакторы и оболочки:

Рекомендуемая литература

Книги

  1. Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
  2. John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
  3. John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  4. Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  5. Шипунов А.Б., Балдин Е.М., Волкова П.А., Коробейников А.И., Назарова С.А., Петров С.В., Суфиянов В.Г. Наглядная статистика. Используем R! – М.: ДМК Пресс, 2012. – 298 с. PDF
  6. Роберт И. Кабаков R в действии. Анализ и визуализация данных в R. – М.: ДМК Пресс, 2013. – 280 с.

Статьи

  1. John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
  2. John Verzani. Simple R. PDF
  3. Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
  4. David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
  5. Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www

Задачи

Условные обозначения:

  1. Цифра в клетке - порядковый номер «подхода». Наличие цифры означает, что решение было получено, проверено, и результат отослан обратно.
  2. Решетка - задание запрошено и выдано, плюс - зачтено, звездочка - штраф, минус - хм, незачет ;-)

Кроме того, пишется дата и время.

Task 1 Task 2 Data
Абильдаев Темирлан *+ *+ Izbirkom
Капаца Дейвид + + Airlines
Полшков Виталий *+ *+ ATUS
Горшечникова Владлена + + IMDB
Магдич Елизавета + + UFO

Разное

1)
в сентябре
2)
октябрь-декабрь
study/fall2018/intror.txt · Последнее изменение: 2019/11/19 18:55 — asl
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0