для чего используют критерий фишера
Критерий Фишера и Стьюдента
С помощью критерия Фишера оценивают качество регрессионной модели в целом и по параметрам.
Для этого выполняется сравнение полученного значения F и табличного F значения. F-критерия Фишера. F фактический определяется из отношения значений факторной и остаточной дисперсий, рассчитанных на одну степень свободы:
где n — число наблюдений;
m — число параметров при факторе х.
F табличный — это максимальное значение критерия под влиянием случайных факторов при текущих степенях свободы и уровне значимости а.
Уровень значимости а — вероятность не принять гипотезу при условии, что она верна. Как правило а принимается равной 0,05 или 0,01.
Если Fтабл > Fфакт то признается статистическая незначимость модели, ненадежность уравнения регрессии.
Таблицы по нахождению критерия Фишера и Стьюдента
Таблицы значений F-критерия Фишера и t-критерия Стьюдента Вы можете посмотреть здесь.
Табличное значение критерия Фишера вычисляют следующим образом:
Для нахождения табличного значения критерия Стьюдента определяют число степеней свободы, которое определяется по формуле n — m — 1 и находят его значение при определенном уровне значимости (0,10, 0,05, 0,01).
Критерии Стьюдента
Для оценки статистической значимости модели по параметрам рассчитывают t-критерии Стьюдента.
Оценка значимости модели с помощью критерия Стьюдента проводится путем сравнения их значений с величиной случайной ошибки:
Случайные ошибки коэффициентов линейной регрессии и коэффициента корреляции определяются по формулам:
Сравнивая фактическое и табличное значения t-статистики и принимается или отвергается гипотеза о значимости модели по параметрам.
Зависимость между критерием Фишера и значением t-статистики Стьюдента определяется так
Как и в случае с оценкой значимости уравнения модели в целом, модель считается ненадежной если tтабл > tфакт
Видео лекциий по расчету критериев Фишера и Стьюдента
Для более подробного изучения расчетов критериев Фишера и Стьюдента советуем посмотреть это видео
Лекция 1. Критерии и Гипотезы
Лекция 2. Критерии и Гипотезы
Лекция 3. Критерии и Гипотезы
Определение доверительных интервалов
Для построения доверительного интервала определяется предельная ошибка А для обоих показателей:
Формулы для нахождения доверительных интервалов выглядят так
Прогнозное значение у определяется с помощью подстановки в
уравнение регрессии прогнозного значения х. Вычисляется средняя стандартная ошибка прогноза
и находится доверительный интервал
Задача регрессионного анализа в предмете эконометрика состоит в анализе дисперсии изучаемого показателя y:
общая сумма квадратов отклонений (TSS)
сумма квадратов отклонений, обусловленная регрессией (RSS)
остаточная сумма квадратов отклонений (ESS)
Долю дисперсии, обусловленную регрессией, в общей дисперсии показателя у характеризует коэффициент детерминации R, который должен превышать 50% (R 2 > 0,5). В контрольных по эконометрике в ВУЗах этот показатель рассчитывается всегда.
Любые задачи по эконометрике решаются здесь
Критерий Фишера
Критерий Фишера используют в качестве проверке равенства (однородности) дисперсий двух выборок, в том числе проверки значимости модели регрессии.
Критерий Фишера находится по формуле:
σ1 – большая дисперсия выборки;
σ2 – меньшая дисперсия выборки.
Формула критерий Фишера для оценки значимости уравнения регрессии:
Число степеней свободы исправленных дисперсий находятся по формулам:
для первой выборки
для второй выборки
Пример
Дана выборка успеваемости по двум группам.
№ п/п | X | Y |
1 | 34 | 45 |
2 | 44 | 68 |
3 | 97 | 76 |
4 | 62 | 56 |
5 | 39 | 78 |
6 | 73 | 64 |
7 | 42 | 84 |
8 | 95 | 54 |
9 | 35 | 81 |
10 | 37 | 79 |
11 | 45 | 41 |
12 | 43 | 47 |
13 | 73 | 79 |
14 | 53 | 32 |
15 | 32 | 44 |
Требуется определить различия в оценках между двумя группами при α = 0.05.
Решение
Вычислим дисперсию по X и по Y
№ п/п | X | Y | D(X) | D(Y) |
1 | 34 | 45 | 42,684 | 31,609 |
2 | 44 | 68 | 10,24 | 4,1798 |
3 | 97 | 76 | 209,28 | 22,195 |
4 | 62 | 56 | 7,84 | 3,8242 |
5 | 39 | 78 | 23,684 | 28,92 |
6 | 73 | 64 | 41,818 | 0,5057 |
7 | 42 | 84 | 14,951 | 54,432 |
8 | 95 | 54 | 190,44 | 6,876 |
9 | 35 | 81 | 38,44 | 40,676 |
10 | 37 | 79 | 30,618 | 32,617 |
11 | 45 | 41 | 8,2178 | 48,38 |
12 | 43 | 47 | 12,484 | 24,558 |
13 | 73 | 79 | 41,818 | 32,617 |
14 | 53 | 32 | 0,04 | 99,113 |
15 | 32 | 44 | 51,84 | 35,469 |
Сумма | 804 | 928 | 724,4 | 465,97 |
Среднее | 53,6 | 61,867 |
По критерию Фишера находим Fэмп.
k1=15 — 1 = 14,
k2=15 — 1 = 14
По таблице критерия Фишера находим критическое значение
Fкрит=2.49, следовательно, 2.49>1.55, Fкрит>Fэмп
Отсюда, различия в оценках между двумя выборками групп присутствует, принимаем гипотезу.
Использование критерия Фишера для проверки значимости регрессионной модели
Критерий Фишера для регрессионной модели отражает, насколько хорошо эта модель объясняет общую дисперсию зависимой переменной. Расчет критерия выполняется по уравнению:
Первая дробь в уравнении равна отношению объясненной дисперсии к необъясненной. Каждая из этих дисперсий делится на свою степень свободы (вторая дробь в выражении). Число степеней свободы объясненной дисперсии f1 равно количеству объясняющих переменных (например, для линейной модели вида Y=A*X+B получаем f1=1). Число степеней свободы необъясненной дисперсии f2 = N—k-1, где N-количество экспериментальных точек, k-количество объясняющих переменных (например, для модели Y=A*X+B подставляем k=1).
Для проверки значимости уравнения регрессии вычисленное значение критерия Фишера сравнивают с табличным, взятым для числа степеней свободы f1 (бóльшая дисперсия) и f2 (меньшая дисперсия) на выбранном уровне значимости (обычно 0.05). Если рассчитанный критерий Фишера выше, чем табличный, то объясненная дисперсия существенно больше, чем необъясненная, и модель является значимой.
Коэффициент корреляции и F-критерий, наряду с параметрами регрессионной модели, как правило, вычисляются в алгоритмах, реализующих метод наименьших квадратов.
Библиотека постов MEDSTATISTIC об анализе медицинских данных
Ещё больше полезной информации в нашем блоге в Инстаграм @medstatistic
Критерии и методы
t-КРИТЕРИЙ СТЬЮДЕНТА ДЛЯ НЕЗАВИСИМЫХ СОВОКУПНОСТЕЙ
– общее название для класса методов статистической проверки гипотез (статистических критериев), основанных на распределении Стьюдента. Наиболее частые случаи применения t-критерия связаны с проверкой равенства средних значений в двух выборках.
Уильям Госсет
1. История разработки t-критерия
Данный критерий был разработан Уильямом Сили Госсетом для оценки качества пива в компании Гиннесс. В связи с обязательствами перед компанией по неразглашению коммерческой тайны, статья Госсета вышла в 1908 году в журнале «Биометрика» под псевдонимом «Student» (Студент).
2. Для чего используется t-критерий Стьюдента?
t-критерий Стьюдента используется для определения статистической значимости различий средних величин. Может применяться как в случаях сравнения независимых выборок (например, группы больных сахарным диабетом и группы здоровых), так и при сравнении связанных совокупностей (например, средняя частота пульса у одних и тех же пациентов до и после приема антиаритмического препарата). В последнем случае рассчитывается парный t-критерий Стьюдента
3. В каких случаях можно использовать t-критерий Стьюдента?
Для применения t-критерия Стьюдента необходимо, чтобы исходные данные имели нормальное распределение. Также имеет значение равенство дисперсий (распределения) сравниваемых групп (гомоскедастичность). При неравных дисперсиях применяется t-критерий в модификации Уэлча (Welch’s t).
При отсутствии нормального распределения сравниваемых выборок вместо t-критерия Стьюдента используются аналогичные методы непараметрической статистики, среди которых наиболее известными является U-критерий Манна — Уитни.
4. Как рассчитать t-критерий Стьюдента?
Для сравнения средних величин t-критерий Стьюдента рассчитывается по следующей формуле:
5. Как интерпретировать значение t-критерия Стьюдента?
Полученное значение t-критерия Стьюдента необходимо правильно интерпретировать. Для этого нам необходимо знать количество исследуемых в каждой группе (n1 и n2). Находим число степеней свободы f по следующей формуле:
После этого определяем критическое значение t-критерия Стьюдента для требуемого уровня значимости (например, p=0,05) и при данном числе степеней свободы f по таблице (см. ниже).
Сравниваем критическое и рассчитанное значения критерия:
6. Пример расчета t-критерия Стьюдента
Решение: Для оценки значимости различий используем t-критерий Стьюдента, рассчитываемый как разность средних значений, поделенная на сумму квадратов ошибок:
Для чего используют критерий фишера
Критерий Фишера позволяет сравнивать величины выборочных дисперсий двух рядов наблюдений. Для вычисления нужно найти отношение дисперсий двух выборок, причем так, чтобы большая по величине дисперсия находилась бы в числителе, а меньшая знаменателе. Формула вычисления по критерию Фишера F такова:
Для критерия Фишера необходимо сравнить дисперсии тестовых оценок в обоих классах. Результаты тестирования представлены в табл. 11.
№ учащихся | Первый класс X | Второй класс Y |
1 | 90 | 41 |
2 | 29 | 49 |
3 | 39 | 56 |
4 | 79 | 64 |
5 | 88 | 72 |
6 | 53 | 65 |
7 | 34 | 63 |
8 | 40 | 87 |
9 | 75 | 77 |
10 | 79 | 62 |
Суммы | 606 | 636 |
Среднее | 60,6 | 63,6 |
Рассчитав дисперсии для переменных X и Y, получаем
Строим «ось значимости»:
Для применения критерия F Фишера необходимо соблюдать следующие условия:
1. Измерение может быть проведено в шкале интервалов и отношений.
2. Сравниваемые выборки должны быть распределены по нормальному закону.