Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

Предыдущая версия справа и слева Предыдущая версия
Следующая версия
Предыдущая версия
study:fall2020:5stat_practice [2020/11/04 22:59]
nina
study:fall2020:5stat_practice [2020/11/26 21:12] (текущий)
nina
Строка 6: Строка 6:
 ---- ----
 \\ \\
-05.11.2020 - Две оставшиеся команды показывают результаты третьего задания (О мерах зависимостей) для выбранного набора данных.  Все заранее присылают мне первые три задания. Расскажу что-нибудь про регрессию (loess?). {{ :study:fall2020:intro_mag:lm_ex.zip |Пример}} на R с линейной регрессией.+03.12.2020 - Каждый на своих (по выбору) данных готовит начало задания по классификации (От всех жду работ по регрессии и АГК.) 
 +{{ :study:fall2020:5stat_lecture:da_iris.zip |Пример}} классификации на R. Cделайте для своих данных что-то аналогичное до того момента, до которого сможете разобраться (предполагается, до ROC/AUC сможете сделать). 
 + 
 +Классификация включает в себя lda, qda, cross-validation, визуализацию. 
 +(Можете посмотреть на другие методы классификации, которые частично будут в след. семестре, 
 +здесь https://github.com/kabacoff/RiA2/blob/master/Ch17%20Classification.R) 
 + 
 +Кросс-проверка (leave-one-out CV) делается так: по очереди каждый индивид удаляется из данных, строится правило классификации без него, а потом это правило применяется к удаленному индивиду. Получаем классификацию для каждого индивида, но результат честный, без переподгонки. Для случая небольших выборок этот способ спасает, так как разбиение на тренировочную и тестовую выборки дает очень неустойчивый результат.  
 + 
 +''#LDA\\ 
 +library(MASS)\\ 
 +iris.train <- iris\\ 
 +iris.lda <- lda(iris.train[,1:4], iris.train[,5])\\ 
 +iris.ldap <- predict(iris.lda, iris.train[,1:4])$class\\ 
 +table(iris.ldap, iris.train[,5]) #classification quality\\ 
 +ris.lda <- lda(iris.train[,1:4], iris.train[,5], CV = TRUE)\\ 
 +table(iris.lda$class, iris.train[,5]) #leave-one-out cross-validation\\ 
 + 
 +#LDA, out-of-sample\\ 
 +iris.train <- iris[seq(1,nrow(iris),5),]\\ 
 +iris.unknown <-  iris[-seq(1,nrow(iris),5),]\\ 
 +iris.lda <- lda(iris.train[,1:4], iris.train[,5])\\ 
 +iris.ldap <- predict(iris.lda, iris.unknown[,1:4])$class\\ 
 +ct <- table(iris.ldap, iris.unknown[,5])\\ 
 +diag(prop.table(ct, 1))\\ 
 + 
 +# Exploratory Graph for LDA or QDA for each pair of variables\\ 
 +library(klaR) \\ 
 +partimat(Sp ~ ., Iris, method="lda"
 +'' 
 + 
 +26.11.2020 - По-прежнему, все команды делают (переделывают) и показывают задание по АГК (по своим данным), а каждый отдельно делает по данным, выданным в рамках курса по МАД и присылает. (От всех жду работ по регрессии.) 
 + 
 +19.11.2020 - Все команды делают и показывают задание по АГК (по своим данным), а каждый отдельно делает по данным, выданным в рамках курса по МАД и присылает.  
 + 
 +12.11.2020 - Все команды делают и показывают задание по регрессии (см. пример ниже). 
 + 
 +05.11.2020 - Две оставшиеся команды показывают результаты третьего задания (О мерах зависимостей) для выбранного набора данных.  Все заранее присылают мне первые три задания. {{ :study:fall2020:intro_mag:lm_ex.zip |Пример}} на R с линейной регрессией.
  
 29.10.2020 - Все (4 команды) показывают результаты третьего задания (О мерах зависимостей) для выбранного набора данных.  Нужно прислать доделанной второе задание (и первое команде 4).  29.10.2020 - Все (4 команды) показывают результаты третьего задания (О мерах зависимостей) для выбранного набора данных.  Нужно прислать доделанной второе задание (и первое команде 4). 
study/fall2020/5stat_practice.1604519973.txt.gz · Последнее изменение: 2020/11/04 22:59 — nina
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0