Содержание
522 гр. по выбору «Программирование для анализа данных»
Место и время проведения: четверг, вторая пара (11:15-12:50), ауд. 4399
Преподаватель: Коробейников Антон Иванович
Преподаватель: Шпилев Петр Валерьевич
Темы состоявшихся занятий
- Введение. Краткий обзор. Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки. Пакеты
- Воспроизводимые вычисления
- Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, factor, matrix, data frame, list, ts (time series), expression. Конверсия объектов друг в друга.
- Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы).
- Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator.
- Основные операторы (if, for, while, repeat)
- Средства отладки
- Элементы объектно-ориентированного программирования: система S3
- Чтение данных из файла и с клавиатуры: функции read.table, scan. Запись данных в файл: функции write, write.table.
- Группировка, категоризующие переменные, функции над блоками данных: rowsum, aggregate, subset, lapply, sapply, replicate
- Преобразование данных. Пакеты tidyr и plyr. tidyr.pdf
- Графические устройства (функции dev.*). Разбиение устройства на блоки. Понятие о графических параметрах
- Высокоуровневые графические функции: plot, curve, coplot, pairs, density
- Низкоуровневые графические функции: points, line, abline, axis, legend
- Высокоуровневые графические функции: barplot, hist, boxplot
- Пакет lattice. Введение. Изображение одномерных данных. Изображение двумерных данных: скаттерплоты, матрицы скаттерплотов, parallel plot'ы. Стили линий и т.п. intro.R}{{study:fall2009:intror:univariate.r.txt|univariate.R xyplot.R, splom.R, parallel.R
- Системы рисования. Пакет ggplot ggplot.zip.
Успехи
Условные обозначения: + - задание зачтено; # - задание получено; ! - задание получено, проверено, требует исправлений; @ - задание согласовано, * - штраф, % - прислано после дедлайна
Работа с данными | Рисование | Python 1 | Python 2 | |
---|---|---|---|---|
Арсланов Николай | + | + | + | + |
Гоголева Елена | + | + | + | + |
Гребенюк Алексей | +% | +% | + | + |
Ежов Федор | + | + | + | + |
Измайлов Шамиль | ! | ! | ||
Кононыхин Иван | + | + | + | + |
Костюченко Елена | Task 1 | Task 2 | ||
Кребс Алена | + | Task 2 | ||
Курбангалиев Руслан | + | Task 2 | ||
Ларин Евгений | + | + | + | + |
Леонович Роман | ! | + | + | + |
Макаров Григорий | ! | Task 2 | ||
Петушков Роман | ! | + | ||
Носов Евгений | +% | +% | % | % |
Внимание: Если напротив Вашей фамилии отсутствует назначенное задание, то для его получения Вам следует отправить запрос по почте.
Критерии оценивания
TL;DR: Претендующие на оценки A-C на экзамене кроме выполнения в срок самостоятельных работ должны сделать доклад на 5 минут, проанализировав те наборы данных, что у них есть. Слайды должны быть сделаны в markdown / jupyter.
Детально:
- Для оценки «отлично» (A по системе ECTS) необходимо выполнить все самостоятельные практические задания в указанный для них срок и выступить с докладом по анализу данных с полным объяснением используемого кода и полученных результатов.
- Для оценки «хорошо» (B по системе ECTS) необходимо выполнить не менее 3 заданий, выступить с докладом, где при объяснении используемого кода и полученных результатов могут быть использованы ответы на наводящие вопросы; все задания должны быть сданы в срок.
- Для оценки «хорошо» (C по системе ECTS) необходимо выполнить не менее 3 заданий, выступить с докладом, где при объяснении используемого кода и полученных результатов могут быть использованы ответы на наводящие вопросы; допускается сдача не более 2 заданий не в срок.
- Для оценки «удовлетворительно» (D по системе ECTS) необходимо выполнить не менее 3 самостоятельных заданий; все задания должны быть сданы вовремя.
- Для оценки «удовлетворительно» (E по системе ECTS) необходимо выполнить не менее 3 самостоятельных заданий; допускается сдача не более 2 заданий не в срок.
- Оценка «неудовлетворительно» (F по системе ECST) ставится, если выполнено менее 3 самостоятельных заданий, или более 2 заданий сдано не вовремя.
Пререквизиты
R
TeX
Дистрибутивы:
Редакторы и оболочки: