522 гр. по выбору «Программирование для анализа данных»

Место и время проведения: четверг, вторая пара (11:15-12:50), ауд. 4399
Преподаватель: Коробейников Антон Иванович
Преподаватель: Шпилев Петр Валерьевич


Темы состоявшихся занятий

  1. Введение. Краткий обзор. Базовые операции: понятие «workspace», присваивание, просмотр списка переменных, удаление переменных из workspace'а. Функции c() и seq(). Использование встроенной справки. Пакеты
  2. Воспроизводимые вычисления
  3. Объекты R. Общие свойства (mode, length). Основные типы объектов: vector, factor, matrix, data frame, list, ts (time series), expression. Конверсия объектов друг в друга.
  4. Основные операции (арифметика, логические операции). Проверка равенства (==, identical, all.equal). Индексирование «векторных» переменных (включая именованные индексы).
  5. Вызов функций. Правила передачи аргументов. Аргументы по умолчанию. Ellipsis (…) operator.
  6. Основные операторы (if, for, while, repeat)
  7. Средства отладки
  8. Элементы объектно-ориентированного программирования: система S3
  9. Чтение данных из файла и с клавиатуры: функции read.table, scan. Запись данных в файл: функции write, write.table.
  10. Группировка, категоризующие переменные, функции над блоками данных: rowsum, aggregate, subset, lapply, sapply, replicate
  11. Преобразование данных. Пакеты tidyr и plyr. tidyr.pdf
  12. Графические устройства (функции dev.*). Разбиение устройства на блоки. Понятие о графических параметрах
  13. Высокоуровневые графические функции: plot, curve, coplot, pairs, density
  14. Низкоуровневые графические функции: points, line, abline, axis, legend
  15. Высокоуровневые графические функции: barplot, hist, boxplot
  16. Пакет lattice. Введение. Изображение одномерных данных. Изображение двумерных данных: скаттерплоты, матрицы скаттерплотов, parallel plot'ы. Стили линий и т.п. intro.R}{{study:fall2009:intror:univariate.r.txt|univariate.R xyplot.R, splom.R, parallel.R
  17. Системы рисования. Пакет ggplot ggplot.zip.

Успехи

Условные обозначения: + - задание зачтено; # - задание получено; ! - задание получено, проверено, требует исправлений; @ - задание согласовано, * - штраф, % - прислано после дедлайна

Работа с данными Рисование Python 1 Python 2
Арсланов Николай + + + +
Гоголева Елена + + + +
Гребенюк Алексей +% +% + +
Ежов Федор + + + +
Измайлов Шамиль ! !
Кононыхин Иван + + + +
Костюченко Елена Task 1 Task 2
Кребс Алена + Task 2
Курбангалиев Руслан + Task 2
Ларин Евгений + + + +
Леонович Роман ! + + +
Макаров Григорий ! Task 2
Петушков Роман ! +
Носов Евгений !% !%

Внимание: Если напротив Вашей фамилии отсутствует назначенное задание, то для его получения Вам следует отправить запрос по почте.

Критерии оценивания

TL;DR: Претендующие на оценки A-C на экзамене кроме выполнения в срок самостоятельных работ должны сделать доклад на 5 минут, проанализировав те наборы данных, что у них есть. Слайды должны быть сделаны в markdown / jupyter.

Детально:

  1. Для оценки «отлично» (A по системе ECTS) необходимо выполнить все самостоятельные практические задания в указанный для них срок и выступить с докладом по анализу данных с полным объяснением используемого кода и полученных результатов.
  2. Для оценки «хорошо» (B по системе ECTS) необходимо выполнить не менее 3 заданий, выступить с докладом, где при объяснении используемого кода и полученных результатов могут быть использованы ответы на наводящие вопросы; все задания должны быть сданы в срок.
  3. Для оценки «хорошо» (C по системе ECTS) необходимо выполнить не менее 3 заданий, выступить с докладом, где при объяснении используемого кода и полученных результатов могут быть использованы ответы на наводящие вопросы; допускается сдача не более 2 заданий не в срок.
  4. Для оценки «удовлетворительно» (D по системе ECTS) необходимо выполнить не менее 3 самостоятельных заданий; все задания должны быть сданы вовремя.
  5. Для оценки «удовлетворительно» (E по системе ECTS) необходимо выполнить не менее 3 самостоятельных заданий; допускается сдача не более 2 заданий не в срок.
  6. Оценка «неудовлетворительно» (F по системе ECST) ставится, если выполнено менее 3 самостоятельных заданий, или более 2 заданий сдано не вовремя.

Пререквизиты

R

Дистрибутив R:

Редакторы и оболочки:

TeX

Jupyter

study/fall2020/dataprog.txt · Последнее изменение: 2021/01/13 10:07 — asl
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0