Это старая версия документа!
Статистический анализ временных рядов, 522 гр.
Место и время проведения: четверг, третья (ауд. 4399) пара.
(лекции по вторникам, 4 пара)
Преподаватель: Голяндина Нина Эдуардовна
«Those who have knowledge, don't predict. Those who predict, don't have knowledge.»
– Lao Tzu, 6th Century BC Chinese philosopher
Вот спрашивают - а с чего это китайская цитата на английском. А нет ответа.
Следующие занятия - среда, 24 февраля, начиная с 11:00, и 25 февраля, 15:25.
Задание: Провести анализ ряда - выделить тренд, исследовать частотные характеристики ряда и остатка после выделения
тренда.
Ряды можно найти самостоятельно, например, на таком ресурсе https://research.stlouisfed.org/fred2/categories/32447,
а можно использовать ряды из этого архива (в одном файле несколько рядов). Для демонстрации каких-то эффектов можно дополнительно промоделировать ряд.
Вопросы (нужно их распределить между собой) на 24 (25) февраля.
1. Сглаживание временного ряда и выделение тренда. Использование фильтров для частотной фильтрации.
2. Выделение тренда и подавление шума. Использование фильтра (скользящего среднего). Зависимость результата от длины окна.
3. Скользящее среднее, запаздывание, перерисовка. Продемонстрировать, как одно переходит в другое.
4. Определение поведения дисперсии шума. Оценить \sigma(n) и нанести на шум.
5. Разные методы стабилизации дисперсии.
6. Выделение тренда у ряда с сезонностью (выбор длины окна в скользящем среднем).
7. Частотный анализ ряда с помощью периодограммы; анализ остатка после того, как выделили тренд.
8. Переход к разностям – плюсы и минусы.
9. Скользящее среднее и скользящая медиана.
10. Амплитудно-частотная характеристика фильтра (АЧХ) - могу дать код, который ее вычисляет. Взять несколько фильтров, разность соседних точек, сумма соседних точек, …. Построить АЧХ, проинтерпретировать, показать, как действует, на конкретном временном ряде.
11. Растекание частоты в периодограмме. Подправка длины ряда для ее устранения.
12. Выделение тренда с помощью параметрической регрессии.
Литература и ссылки
- Программа CaterpillarSSA (Windows).
Для получения рег.ключа к студенческой версии мне нужно прислать запрос.
- Ссылка на R-пакет Rssa,
версия R будет нужна не меньше 3.2
- Статьи-tutorial для Rssa:
1. Базовый метод
N.Golyandina, A.Korobeynikov
Basic Singular Spectrum Analysis and Forecasting with R.
Computational Statistics and Data Analysis. Volume 71, March 2014, pp.934-954.
Версия в Arxiv
2. Многомерные обобщения метода и общая схема
N.Golyandina, A.Korobeynikov, A.Shlemov, K.Usevich.
Multivariate and 2D Extensions of Singular Spectrum Analysis with the Rssa Package.
Journal of Statistical Software, v.67, Issue 2, 2015, pp.1-78.
Открытый доступ к статье с кодом примеров: J.Stat.Soft.
C прошлых лет:
Темы занятий:
- Метод «Гусеница»: разделимость, выбор параметров, варианты метода (с центрированием, теплицев, последовательный SSA), ЛРФ и корни характеристического полинома, прогноз. Разложение ряда на тренд, периодические компоненты и шум.
- Разложение Фурье, периодограммы, оценка спектральной плотности для стационарных рядов.
- Выделение тренда с помощью скользящего среднего, скользящей медианы, оконного сглаживания, экспоненциального сглаживания.
- Разложение ряда на тренд, периодику и шум с помощью сезонной декомпозиции (seasonal decomposition)
- ARIMA, определение порядка авторегресии/скользящего суммирования, переход к разностям, …
Задания
- На модельном примере определить, сколько в ряде периодик, с помощью метода «Гусеница»
- На модельном примере применить ARIMA
- Большое задание:
- Провести анализ главных компонент для индивидуальных данных с прошлого семестра.
- Провести анализ временного ряда с помощью метода «Гусеница» (построить разложение на тренд, периодики и шум, а также вид аналитической аппроксимации сигнала на основе корней х.п.) и с помощью пакета STATISTICA (модули Transformation, Spectral (Fourier) analysis, Seasonal Decomposition (Census I), Exponential Smoothing and forecasting, ARIMA).
Данные для заданий
Комментарий: файл stud2005.xls из архива - для д.з. на 23 октября 2014.
Данные для д.з. на 4 ноября 2014 в папке ARIMA: