F-тест (критерий Фишера)

Published in Journal 1, 2009

Рассматривается применение \(F\)-теста (критерия Фишера) в задаче регрессии. \(F\)-тест также широко используется для проверки равенства дисперсий двух или более выборок.

Предположим, что мы аппроксимируем данные полиномиальной функцией. Степень полинома, а следовательно, и количество параметров модели, можно увеличивать сколь угодно. Однако, следуя принципу бритвы Оккама, следует избегать чрезмерного усложнения модели. В противном случае возникает проблема переобучения: модель хорошо описывает обучающую выборку, но оказывается непригодной для предсказания новых данных. В связи с этим возникает задача проверки целесообразности усложнения модели.

Рассмотрим две модели, где модель 1 является вложенной в модель 2. Это означает, что модель 1 содержит \(p_1\) параметров, а модель 2 содержит \(p_2\) параметров, причём \(p_1 < p_2\). Модель с большим числом параметров всегда может описать данные не хуже, чем модель с меньшим числом параметров. Следовательно, модель 2, как правило, обеспечивает лучшее (то есть с меньшей ошибкой) соответствие данным. Чтобы определить, является ли это улучшение статистически значимым, используется \(F\)-тест.

Пусть имеется \(n\) наблюдений. Тогда \(F\)-статистика вычисляется по формуле:

\[ F = \frac{(\chi^2_1 - \chi^2_2) / (p_2 - p_1)}{\chi^2_2 / (n - p_2)} = \frac{\chi^2_1 - \chi^2_2}{\chi^2_2} \cdot \frac{n - p_2}{p_2 - p_1}, \]

где \(\chi^2\) — взвешенная сумма квадратов остатков, в которой веса равны обратным дисперсиям ошибок измерений.

При нулевой гипотезе \(H_0\): “модель 2 не обеспечивает статистически значимо лучшего соответствия данным по сравнению с моделью 1” - статистика \(F\) имеет \(F\)-распределение с \((p_2 - p_1,\, n - p_2)\) степенями свободы. Нулевая гипотеза отвергается, если наблюдаемое значение \(F\) превышает критическое значение при заданном уровне значимости.

В моей работе по изучению спектральных и временных характеристик гамма-всплексков \(F\)-тест применялся для аппроксимации фона в кривых блеска, зарегистрированных прибором Fermi/GBM. Телескоп находится на околоземной орбите, что приводит к нестабильности фона во времени. В большинстве случаев достаточно аппроксимации нулевой или первой степени, однако иногда требуются модели более высокого порядка. Ниже приводятся несколько кривых блеска, которые имеют различные поведения фона, \(F\)-тест хорошо справляется с задачей определения оптимальной степени полинома без переусложнения модели:

1 степень
Рис. 1: Аппроксимация полиномом 1-й степени
2 степень
Рис. 2: Аппроксимация полиномом 2-й степени
4 степень
Рис. 3: Аппроксимация полиномом 4-й степени

Recommended citation:
Download Paper | Download Slides | Download Bibtex