Различия

Показаны различия между двумя версиями страницы.

Ссылка на это сравнение

Предыдущая версия справа и слева Предыдущая версия
Следующая версия
Предыдущая версия
study:fall2020:5stat_practice [2020/11/06 01:08]
nina
study:fall2020:5stat_practice [2020/11/26 21:12] (текущий)
nina
Строка 6: Строка 6:
 ---- ----
 \\ \\
 +03.12.2020 - Каждый на своих (по выбору) данных готовит начало задания по классификации (От всех жду работ по регрессии и АГК.)
 +{{ :study:fall2020:5stat_lecture:da_iris.zip |Пример}} классификации на R. Cделайте для своих данных что-то аналогичное до того момента, до которого сможете разобраться (предполагается, до ROC/AUC сможете сделать).
 +
 +Классификация включает в себя lda, qda, cross-validation, визуализацию.
 +(Можете посмотреть на другие методы классификации, которые частично будут в след. семестре,
 +здесь https://github.com/kabacoff/RiA2/blob/master/Ch17%20Classification.R)
 +
 +Кросс-проверка (leave-one-out CV) делается так: по очереди каждый индивид удаляется из данных, строится правило классификации без него, а потом это правило применяется к удаленному индивиду. Получаем классификацию для каждого индивида, но результат честный, без переподгонки. Для случая небольших выборок этот способ спасает, так как разбиение на тренировочную и тестовую выборки дает очень неустойчивый результат. 
 +
 +''#LDA\\
 +library(MASS)\\
 +iris.train <- iris\\
 +iris.lda <- lda(iris.train[,1:4], iris.train[,5])\\
 +iris.ldap <- predict(iris.lda, iris.train[,1:4])$class\\
 +table(iris.ldap, iris.train[,5]) #classification quality\\
 +ris.lda <- lda(iris.train[,1:4], iris.train[,5], CV = TRUE)\\
 +table(iris.lda$class, iris.train[,5]) #leave-one-out cross-validation\\
 +
 +#LDA, out-of-sample\\
 +iris.train <- iris[seq(1,nrow(iris),5),]\\
 +iris.unknown <-  iris[-seq(1,nrow(iris),5),]\\
 +iris.lda <- lda(iris.train[,1:4], iris.train[,5])\\
 +iris.ldap <- predict(iris.lda, iris.unknown[,1:4])$class\\
 +ct <- table(iris.ldap, iris.unknown[,5])\\
 +diag(prop.table(ct, 1))\\
 +
 +# Exploratory Graph for LDA or QDA for each pair of variables\\
 +library(klaR) \\
 +partimat(Sp ~ ., Iris, method="lda")
 +''
 +
 +26.11.2020 - По-прежнему, все команды делают (переделывают) и показывают задание по АГК (по своим данным), а каждый отдельно делает по данным, выданным в рамках курса по МАД и присылает. (От всех жду работ по регрессии.)
 +
 +19.11.2020 - Все команды делают и показывают задание по АГК (по своим данным), а каждый отдельно делает по данным, выданным в рамках курса по МАД и присылает. 
 +
 12.11.2020 - Все команды делают и показывают задание по регрессии (см. пример ниже). 12.11.2020 - Все команды делают и показывают задание по регрессии (см. пример ниже).
  
-05.11.2020 - Две оставшиеся команды показывают результаты третьего задания (О мерах зависимостей) для выбранного набора данных.  Все заранее присылают мне первые три задания. Расскажу что-нибудь про регрессию (loess?). {{ :study:fall2020:intro_mag:lm_ex.zip |Пример}} на R с линейной регрессией.+05.11.2020 - Две оставшиеся команды показывают результаты третьего задания (О мерах зависимостей) для выбранного набора данных.  Все заранее присылают мне первые три задания. {{ :study:fall2020:intro_mag:lm_ex.zip |Пример}} на R с линейной регрессией.
  
 29.10.2020 - Все (4 команды) показывают результаты третьего задания (О мерах зависимостей) для выбранного набора данных.  Нужно прислать доделанной второе задание (и первое команде 4).  29.10.2020 - Все (4 команды) показывают результаты третьего задания (О мерах зависимостей) для выбранного набора данных.  Нужно прислать доделанной второе задание (и первое команде 4). 
study/fall2020/5stat_practice.1604614096.txt.gz · Последнее изменение: 2020/11/06 01:08 — nina
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0