Это старая версия документа!
Статистический анализ временных рядов, 522 гр.
Место и время проведения: четверг, третья (ауд. 4399) пара.
(лекции по вторникам, 4 пара)
Преподаватель: Голяндина Нина Эдуардовна
«Those who have knowledge, don't predict. Those who predict, don't have knowledge.»
– Lao Tzu, 6th Century BC Chinese philosopher
Вот спрашивают - а с чего это китайская цитата на английском. А нет ответа.
Здесь будут накапливаться вопросы по теории-практике семинара.
На 23.03.2016
Следующее занятие - четверг 5 мая, 13:40
Задание: все делают прогноз своих данных по SSA, с оценкой параметров.
Следующее занятие - четверг 28 апреля, 13:40
Рассказ про ARIMA
Следующее занятие - четверг, 7,14,21,28 апреля, 13:40
Уже нужно смотреть, как делается прогноз SSA и оценка параметров
Следующее занятие - четверг, 31 марта, 13:40
Задание для всех: построить для своих данных разложение на тренд, периодику, шум
методами SSA, обычным seasonal decomposition и STL (http://www.wessa.net/download/stl.pdf)
Следующее занятие - четверг, 24 марта, 13:40
Уже всем нужно научиться применять SSA (пакет Rssa) и с помощью него
выделять тренд. Будьте готовыми начать рассказ 24-го.
Следующее занятие - четверг, 17 марта, 13:40
Следующее занятие - четверг, 10 марта, 13:40
Следующие занятия - среда, 24 февраля, начиная с 11:00, и 25 февраля, 13:40.
Задание: Провести анализ ряда - выделить тренд, исследовать частотные характеристики ряда и остатка после выделения тренда.
Ряды можно найти самостоятельно, например, на таком ресурсе https://research.stlouisfed.org/fred2/categories/32447, а можно использовать ряды из этого архива (в одном файле несколько рядов). Для демонстрации каких-то эффектов можно дополнительно промоделировать ряд.
Вопросы (нужно их распределить между собой) на 24 (25) февраля.
- Сглаживание временного ряда и выделение тренда. Использование фильтров для частотной фильтрации.
- Выделение тренда и подавление шума. Использование фильтра (скользящего среднего). Зависимость результата от длины окна.
- Скользящее среднее, запаздывание, перерисовка. Продемонстрировать, как одно переходит в другое.
- Определение поведения дисперсии шума. Оценить \sigma(n) и нанести на шум.
- Разные методы стабилизации дисперсии.
- Выделение тренда у ряда с сезонностью (выбор длины окна в скользящем среднем).
- Частотный анализ ряда с помощью периодограммы; анализ остатка после того, как выделили тренд.
- Переход к разностям – плюсы и минусы.
- Скользящее среднее и скользящая медиана.
- Амплитудно-частотная характеристика фильтра (АЧХ) - могу дать код, который ее вычисляет. Взять несколько фильтров, разность соседних точек, сумма соседних точек, …. Построить АЧХ, проинтерпретировать, показать, как действует, на конкретном временном ряде.
- Растекание частоты в периодограмме. Подправка длины ряда для ее устранения.
- Выделение тренда с помощью параметрической регрессии.
Литература и ссылки
- Программа CaterpillarSSA (Windows).
Для получения рег.ключа к студенческой версии мне нужно прислать запрос.
- Ссылка на R-пакет Rssa,
версия R будет нужна не меньше 3.2
- Статьи-tutorial для Rssa:
- Базовый метод:
N.Golyandina, A.Korobeynikov
Basic Singular Spectrum Analysis and Forecasting with R. Computational Statistics and Data Analysis. Volume 71, March 2014, pp.934-954.
Версия в Arxiv
- Многомерные обобщения метода и общая схема:
N.Golyandina, A.Korobeynikov, A.Shlemov, K.Usevich.
Multivariate and 2D Extensions of Singular Spectrum Analysis with the Rssa Package. Journal of Statistical Software, v.67, Issue 2, 2015, pp.1-78.
Открытый доступ к статье с кодом примеров: J.Stat.Soft.
C прошлых лет:
Темы занятий:
- Метод «Гусеница»: разделимость, выбор параметров, варианты метода (с центрированием, теплицев, последовательный SSA), ЛРФ и корни характеристического полинома, прогноз. Разложение ряда на тренд, периодические компоненты и шум.
- Разложение Фурье, периодограммы, оценка спектральной плотности для стационарных рядов.
- Выделение тренда с помощью скользящего среднего, скользящей медианы, оконного сглаживания, экспоненциального сглаживания.
- Разложение ряда на тренд, периодику и шум с помощью сезонной декомпозиции (seasonal decomposition)
- ARIMA, определение порядка авторегресии/скользящего суммирования, переход к разностям, …
Задания
- На модельном примере определить, сколько в ряде периодик, с помощью метода «Гусеница»
- На модельном примере применить ARIMA
- Большое задание:
- Провести анализ главных компонент для индивидуальных данных с прошлого семестра.
- Провести анализ временного ряда с помощью метода «Гусеница» (построить разложение на тренд, периодики и шум, а также вид аналитической аппроксимации сигнала на основе корней х.п.) и с помощью пакета STATISTICA (модули Transformation, Spectral (Fourier) analysis, Seasonal Decomposition (Census I), Exponential Smoothing and forecasting, ARIMA).
Данные для заданий
Комментарий: файл stud2005.xls из архива - для д.з. на 23 октября 2014.
Данные для д.з. на 4 ноября 2014 в папке ARIMA: