Кружок «Интеллектуальный анализ данных» (1, 2, 3... курс)

Место и время проведения: среда, пятая пара (17:10-18:45), ауд. 4399 группа vk
Преподаватель: Шлемов Александр Юрьевич
Преподаватель: Коробейников Антон Иванович


Темы

  1. Распознавание 0 и 1. Сами MNIST и материалы к занятию. Исходно MNIST выложены в довольно странном формате, но я его уже почитал и пересохранил данные в формате RDA (внутренний формат R). Файл лежит в архиве

Задание:

  • Установить R, запустить пример. Может потребоваться установка дополнительных пакетов (latticeExtra), установите его с помощью `install.packages(«latticeExtra»)`
  • Придумать 3 собственных признака, потенциально отличающих 0 от 1. Реализовать их (добавить в код) и проверить, как хорошо они разделяют данные
  • (*) Попробовать каким-то образом совместить несколько признаков и улучшить результат

Язык R

Дистрибутивы

Литература

Основная

  1. Hadley Wickham: "Advanced R" — Достаточно краткое, но исчерпывающее руководство от очень известного R-гуру, автора множества пакетов

Дополнительная

  1. Joseph Adler: "R in a nutshell" — Большая книга по языку R, среднего уровня для среднего читателя. Я больше рекомендую Hadley.
  2. Patrick Burns: "The R Inferno" — «Ад R», потенциальные ошибки при программировании на R и способы их избежать. Рекомендуется к чтению после некоторого опыта в R
  3. Patrick Burns: "The S Poetry" — Книга от автора «The R Inferno», еще про S. Немного устарела, но неплохо написана
  4. Sarkar, Deepayan: "Lattice. Multivariate Data Visualization with R" — Исчерпывающий обзор графической системы «lattice» с примерами использования. Я в своих примерах использую именно lattice для рисования графиков
  5. latticeExtra — Пакет, расширяющий возможности стандартного lattice, я его много использую и крайне рекомендую
  6. lattice — Сайт графической системы lattice
  7. ggplot2 — Сайт графической системы ggplot2, альтернатива lattice
  8. Winston Chang: "R Graphics Cookbook" — Введение в ggplot и рецепты

Еще ресурсы

  1. Peter Dalgaard. Introductory Statistics with R. Springer, 2002.
  2. John Maindonald and John Braun. Data Analysis and Graphics Using R. Cambridge University Press, Cambridge, 2003.
  3. John Verzani. Using R for Introductory Statistics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  4. Paul Murrell. R Graphics. Chapman & Hall/CRC, Boca Raton, FL, 2005.
  5. John Maindonald. Using R for Data Analysis and Graphics - Introduction, Examples and Commentary. PDF
  6. John Verzani. Simple R. PDF
  7. Petra Kuhnert and Bill Venables. An Introduction to R: Software for Statistical Modelling & Computing. ZIP
  8. David Rossiter. Introduction to the R Project for Statistical Computing for Use at the ITC. PDF
  9. Е.М. Балдин, А.И. Коробейников, А.Б. Шипунов Анализ данных с R www
study/idata.txt · Последнее изменение: 2016/08/10 22:30 — nina
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0