Орлов А.И. Математика случая: Вероятность и статистика – основные факты: Основные понятия, используемые при проверке гипотез

А.И. Орлов
Математика случая
Вероятность и статистика – основные факты

Учебное пособие. М.: МЗ-Пресс, 2004.

5. Основные проблемы прикладной статистики - описание данных, оценивание и проверка гипотез

Основные понятия, используемые при проверке гипотез

Статистическая гипотеза – любое предположение, касающееся неизвестного распределения случайных величин (элементов). Приведем формулировки нескольких статистических гипотез:

1. Результаты наблюдений имеют нормальное распределение с нулевым математическим ожиданием.
2. Результаты наблюдений имеют функцию распределения N(0,1).
3. Результаты наблюдений имеют нормальное распределение.
4. Результаты наблюдений в двух независимых выборках имеют одно и то же нормальное распределение.
5. Результаты наблюдений в двух независимых выборках имеют одно и то же распределение.

Различают нулевую и альтернативную гипотезы. Нулевая гипотеза – гипотеза, подлежащая проверке. Альтернативная гипотеза – каждая допустимая гипотеза, отличная от нулевой. Нулевую гипотезу обозначают Н₀, альтернативную – Н₁ (от Hypothesis – «гипотеза» (англ.)).

Выбор тех или иных нулевых или альтернативных гипотез определяется стоящими перед менеджером, экономистом, инженером, исследователем прикладными задачами. Рассмотрим примеры.

Пример 11. Пусть нулевая гипотеза – гипотеза 2 из приведенного выше списка, а альтернативная – гипотеза 1. Сказанное означает, то реальная ситуация описывается вероятностной моделью, согласно которой результаты наблюдений рассматриваются как реализации независимых одинаково распределенных случайных величин с функцией распределения N(0,σ), где параметр σ неизвестен статистику. В рамках этой модели нулевую гипотезу записывают так:

Н₀: σ = 1,

а альтернативную так:

Н₁: σ ≠ 1.

Пример 12. Пусть нулевая гипотеза – по-прежнему гипотеза 2 из приведенного выше списка, а альтернативная – гипотеза 3 из того же списка. Тогда в вероятностной модели управленческой, экономической или производственной ситуации предполагается, что результаты наблюдений образуют выборку из нормального распределения N(m, σ) при некоторых значениях m и σ. Гипотезы записываются так:

Н₀: m = 0, σ = 1

(оба параметра принимают фиксированные значения);

Н₁: m ≠ 0 и/или σ ≠ 1

(т.е. либо m ≠ 0, либо σ ≠ 1, либо и m ≠ 0, и σ ≠ 1).

Пример 13. Пусть Н₀ – гипотеза 1 из приведенного выше списка, а Н₁ – гипотеза 3 из того же списка. Тогда вероятностная модель – та же, что в примере 12,

Н₀: m = 0, σ произвольно;

Н₁: m ≠ 0, σ произвольно.

Пример 14. Пусть Н₀ – гипотеза 2 из приведенного выше списка, а согласно Н₁ результаты наблюдений имеют функцию распределения F(x), не совпадающую с функцией стандартного нормального распределения Ф(х). Тогда

Н₀: F(х) = Ф(х) при всех х (записывается как F(х) ≡ Ф(х));

Н₁: F(х₀) ≠ Ф(х₀) при некотором х₀ (т.е. неверно, что F(х) ≡ Ф(х)).

Примечание. Здесь ≡ - знак тождественного совпадения функций (т.е. совпадения при всех возможных значениях аргумента х).

Пример 15. Пусть Н₀ – гипотеза 3 из приведенного выше списка, а согласно Н₁ результаты наблюдений имеют функцию распределения F(x), не являющуюся нормальной. Тогда

при некоторых m, σ;

Н₁: для любых m, σ найдется х₀ = х₀(m, σ) такое, что .

Пример 16. Пусть Н₀ – гипотеза 4 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения F(x) и G(x), являющихся нормальными с параметрами m₁, σ₁ и m₂, σ₂ соответственно, а Н₁ – отрицание Н₀. Тогда

Н₀: m₁= m₂, σ₁ = σ₂, причем m₁и σ₁ произвольны;

Н₁: m₁≠ m₂ и/или σ₁ ≠ σ₂.

Пример 17. Пусть в условиях примера 16 дополнительно известно, что σ₁ = σ₂. Тогда

Н₀: m₁= m₂, σ > 0, причем m₁и σ произвольны;

Н₁: m₁≠ m₂, σ > 0.

Пример 18. Пусть Н₀ – гипотеза 5 из приведенного выше списка, согласно вероятностной модели две выборки извлечены из совокупностей с функциями распределения F(x) и G(x) соответственно, а Н₁ – отрицание Н₀. Тогда

Н₀: F(x) ≡ G(x), где F(x) – произвольная функция распределения;

Н₁: F(x) и G(x) - произвольные функции распределения, причем

F(x) ≠ G(x) при некоторых х.

Пример 19. Пусть в условиях примера 17 дополнительно предполагается, что функции распределения F(x) и G(x) отличаются только сдвигом, т.е. G(x) = F(x - а) при некотором а. Тогда

Н₀: F(x) ≡ G(x),

где F(x) – произвольная функция распределения;

Н₁: G(x) = F(x - а), а ≠ 0,

где F(x) – произвольная функция распределения.

Пример 20. Пусть в условиях примера 14 дополнительно известно, что согласно вероятностной модели ситуации F(x) - функция нормального распределения с единичной дисперсией, т.е. имеет вид N(m, 1). Тогда

Н₀: m = 0 (т.е. F(х) = Ф(х)

при всех х );(записывается как F(х) ≡ Ф(х));

Н₁: m ≠ 0

(т.е. неверно, что F(х) ≡ Ф(х)).

Пример 21. При статистическом регулировании технологических, экономических, управленческих или иных процессов [2] рассматривают выборку, извлеченную из совокупности с нормальным распределением и известной дисперсией, и гипотезы

Н₀: m = m₀,

Н₁: m = m₁,

где значение параметра m = m₀ соответствует налаженному ходу процесса, а переход к m = m₁ свидетельствует о разладке.

Пример 22. При статистическом приемочном контроле [2] число дефектных единиц продукции в выборке подчиняется гипергеометрическому распределению, неизвестным параметром является p = D/N – уровень дефектности, где N – объем партии продукции, D – общее число дефектных единиц продукции в партии. Используемые в нормативно-технической и коммерческой документации (стандартах, договорах на поставку и др.) планы контроля часто нацелены на проверку гипотезы

Н₀: p < AQL

против альтернативной гипотезы

Н₁: p > LQ,

где AQL – приемочный уровень дефектности, LQ – браковочный уровень дефектности (очевидно, что AQL < LQ).

Пример 23. В качестве показателей стабильности технологического, экономического, управленческого или иного процесса используют ряд характеристик распределений контролируемых показателей, в частности, коэффициент вариации v = σ/M(X). Требуется проверить нулевую гипотезу

Н₀: v < v₀

при альтернативной гипотезе

Н₁: v > v₀,

где v₀ – некоторое заранее заданное граничное значение.

Пример 24. Пусть вероятностная модель двух выборок – та же, что в примере 18, математические ожидания результатов наблюдений в первой и второй выборках обозначим М(Х) и М(У) соответственно. В ряде ситуаций проверяют нулевую гипотезу

Н₀: М(Х) = М(У)

против альтернативной гипотезы

Н₁: М(Х) ≠ М(У).

Пример 25. Выше отмечалось большое значение в математической статистике функций распределения, симметричных относительно 0, При проверке симметричности

Н₀: F(-x) = 1 – F(x) при всех x, в остальном F произвольна;

Н₁: F(-x₀) ≠ 1 – F(x₀) при некотором x₀, в остальном F произвольна.

В вероятностно-статистических методах принятия решений используются и многие другие постановки задач проверки статистических гипотез. Некоторые из них рассматриваются ниже.

Конкретная задача проверки статистической гипотезы полностью описана, если заданы нулевая и альтернативная гипотезы. Выбор метода проверки статистической гипотезы, свойства и характеристики методов определяются как нулевой, так и альтернативной гипотезами. Для проверки одной и той же нулевой гипотезы при различных альтернативных гипотезах следует использовать, вообще говоря, различные методы. Так, в примерах 14 и 20 нулевая гипотеза одна и та же, а альтернативные – различны. Поэтому в условиях примера 14 следует применять методы, основанные на критериях согласия с параметрическим семейством (типа Колмогорова или типа омега-квадрат), а в условиях примера 20 – методы на основе критерия Стьюдента или критерия Крамера-Уэлча [2,11]. Если в условиях примера 14 использовать критерий Стьюдента, то он не будет решать поставленных задач. Если в условиях примера 20 использовать критерий согласия типа Колмогорова, то он, напротив, будет решать поставленные задачи, хотя, возможно, и хуже, чем специально приспособленный для этого случая критерий Стьюдента.

При обработке реальных данных большое значение имеет правильный выбор гипотез Н₀ и Н₁. Принимаемые предположения, например, нормальность распределения, должны быть тщательно обоснованы, в частности, статистическими методами. Отметим, что в подавляющем большинстве конкретных прикладных постановок распределение результатов наблюдений отлично от нормального [2].

Часто возникает ситуация, когда вид нулевой гипотезы вытекает из постановки прикладной задачи, а вид альтернативной гипотезы не ясен. В таких случаях следует рассматривать альтернативную гипотезу наиболее общего вида и использовать методы, решающие поставленную задачу при всех возможных Н₁. В частности при проверке гипотезы 2 (из приведенного выше списка) как нулевой следует в качестве альтернативной гипотезы использовать Н₁ из примера 14, а не из примера 20, если нет специальных обоснований нормальности распределения результатов наблюдений при альтернативной гипотезе.

Оглавление