Многомерный анализ данных, 522 гр., лекции

Место и время проведения: 3 пара четверга, ауд. 4526
Преподаватель: Голяндина Нина Эдуардовна



Тут будет появляться обновленная информация о экзамене.
Обновленные Распечатки с примерами (каждому достанется один пример на АГК/ФА и один на что-то другое).

Обновленный список вопросов (2 части). Готовиться надо по конспекту, где все последовательно изложено, а список вопросов нужен, чтобы вы могли себя проверить потом, что поняли, что не поняли.




21.12.2017, ауд. 4399. Примеры кластерного анализа Пример 1. Пример 2. Анализ соответствий. Примеры. pdf (все лекции с 23.11, включая эту; исправление в 3.1.1.)

14.12.2017, ауд. 4399. Канонические корреляции и пр. Пример.

07.12.2017, ауд. 4399. Окончание про классификацию. Пример про классификацию. Пропустили пока канонические корреляции. Дальше - кластерный анализ. pdf (включая предыдущие лекции и еще не рассказанный кусок про канонические корреляции - можете почитать его заранее, чтобы было проще на следующем занятии).

30.11.2017, ауд. 4399. Окончание про канонический дискриминантный анализ. Пошаговый дискриминантный анализ. Пример Переход к классификации. pdf (включая предыдущую лекцию)

23.11.2017, ауд. 4399. MANOVA (не забудьте о заданиях) и дискриминантный анализ. pdf

16.11.2017, ауд. 4526. Гипотезы о многомерных сравнениях. Если кто-то еще не прислал мне решение задач из материал для одномерного случая, присылайте, но свое личное творчество.
Переход к MANOVA. Для подготовки к теме про MANOVA обязательно нужно разобраться в Материал к лекции, также мне нужно прислать ответы на вопросы к каждой части оттуда (обращаю внимание - в первой части я поменяла Z на U, чтобы было ближе к нашим обозначениям; в первом задании обратите внимание, что то, что максимизируется - это норма Z, нового признака, т.е. получается первая главная компонента).

09.11.2017, ауд. 4526. Многомерные распределения. Гипотезы о многомерных сравнениях. Для подготовки к этим темам нужно разобрать аналогичный материал для одномерного случая.

То, что нужно для коллоквиума, уже рассказано. Список вопросов от прошлого года. Просьба проверить, что было и чего не было, по своим конспектам. Коллоквиум намечен на 2 декабря.

02.11.2017, ауд. 4526. Окончание рассказа о факторном анализе. Переход к многомерным распределениям и гипотезам о сравнении. Для подготовки к занятию нужно разобрать аналогичный материал для одномерного случая. (!) Мне нужно прислать сделанные задания, очень желательно, до воскресенья.

26.10.2017, ауд. 4526. Факторный анализ. Пример.

19.10.2017, ауд. 4526. Еще немного про АГК (выбор числа ГК, модификации, …), примеры.

12.10.2017, ауд. 4526. Анализ главных компонент + пример АГК реальных данных.

05.10.2017, ауд. 4526. Сингулярное разложение (единственность, свойства оптимальности). Разложение Шмидта. Его частные случаи. Анализ главных компонент. Для подготовки к занятию нужно разобраться в тексте про разложение Шмидта и прислать мне до среды ответы на мини-задания внутри.

28.09.2017, ауд. 4526. Матричные разложения. Сингулярное разложение (самое лучшее разложение). Можно о нем почитать в приложении к уч. пособию http://www.gistatgroup.com/gus/ssa_an.pdf, начиная со страницы 56.

21.09.2017, ауд. 4526. Вступительная часть и переход к сингулярному разложению.




Примерная программа

  1. Обзор того, что нужно уже знать.
  2. Факты из линейной алгебры. Разложения матриц. Сингулярное разложение.
  3. Анализ главных компонент. Оптимизационная задача. Интерпретация главных компонент. Факторный анализ, модель, оптимизационная задача, интерпретация. Сравнение АГК и факторного анализа.
  4. Многомерные распределения. Расстояние Махаланобиса. Доверительные области.
  5. Параметрические многомерные гипотезы. Гипотеза о значении многомерного среднего (статистика Хотеллинга). Доверительные области для параметров с использование нормально-распределенных несмещенных оценок на основе расстояния Махаланобиса, поиск outliers. Гипотеза о равенстве многомерных средних (независимые выборки). Гипотеза о равенстве средних зависимых признаков (repeated measures), контрасты. Гипотеза о равенстве ковариационных матриц, M-статистика Бокса
  6. Многомерный дисперсионный анализ (MANOVA). Критерии лямбда Уилкса, Пиллая, обобщенный Хотеллинга, критерий максимального корня Роя.
  7. Дискриминантный анализ. Общий подход к решению задачи классификации. Классифицирующие функции, априорные и апостериорные вероятности. Матрица классификации, cross-validation. Нормальная модель, одинаковые и различные ковариационные матрицы. Линейный дискриминантный анализ. Значимость дискриминации, связь с MANOVA. Канонические переменные. Значимость канонических переменных. Факторные веса. Пошаговый дискриминантный анализ.
  8. Канонические корреляции. Canonical roots. Извлеченная дисперсия.
  9. Разложение дисперсии (ковариационной матрицы). Связь между дискриминантным анализом, многомерной множественной регрессией, корреляционным анализом и MANOVA.
  10. Кластерный анализ. Расстояния. Меры связи. Иерархическое дерево. Метод K-средних

Литература к теоретической части

По многомерному анализу:
Rencher A., Methods of multivariate analysis. A Wiley-Interscience publication, 2002.
Доп. сведения про Generalized eigenvalue problem.
Про распределения Уилкса и Хотеллинга.
Про анализ соответствий (дипломная работа студента ВШЭ, связь с SVD - стр.37), а также доп.теория здесь.

study/fall2017/5stat_lecture.txt · Последнее изменение: 2018/01/14 00:41 — nina
Наверх
CC Attribution-Noncommercial-Share Alike 4.0 International
Driven by DokuWiki Recent changes RSS feed Valid CSS Valid XHTML 1.0