Орлов А.И.
Прикладная статистика
М.: Издательство «Экзамен», 2004.
Предыдущая |
Часть 1. Фундамент прикладной статистики
1.4. Теоретическая база прикладной статистики
1.4.3. Теоремы о наследовании сходимости
Суть проблемы наследования сходимости. Пусть распределения случайных величин Xn при n → ∞ стремятся к распределению случайной величины Х. При каких функциях f можно утверждать, что распределения случайных величин f(Xn) сходятся к распределению f(X), т.е. наследуется сходимость?
Хорошо известно, что для непрерывных функций f сходимость наследуется [3]. Однако в прикладной статистике используются различные обобщения этого утверждения. Необходимость обобщений связана с тремя обстоятельствами.
1) Статистические данные могут моделироваться не только случайными величинами, но и случайными векторами, случайными множествами, случайными элементами произвольной природы (т.е. функциями на вероятностном пространстве со значениями в произвольном множестве).
2) Переход к пределу должен рассматриваться не только для случая безграничного возрастания объема выборки, но и в более общих случаях. Например, если в постановке статистической задачи участвуют несколько выборок объемов n(1), n(2), … , n(k), то вполне обычным является предположение о безграничном росте всех этих объемов (что можно описать и как min {n(1), n(2), … , n(k)} → ∞).
3) Функция f не обязательно является непрерывной. Она может иметь разрывы. Кроме того, она может зависеть от параметров, по которым происходит переход к пределу. Например, может зависеть от объемов выборок. Например, в главе 3.1 понадобится рассмотреть функцию f = f(n(1), n(2), … , n(k)).
Расстояние Прохорова и сходимость по направленному множеству. Введем необходимые для дальнейшего изложения понятия.
Расстояние (метрика) Прохорова. Пусть С – некоторое пространство, А – его подмножество, d – метрика в С. Введем понятие ε-окрестности множества А в метрике d:
S(A,ε) = {x С: d(A,x) < ε}.
Таким образом, ε-окрестность множества А – это совокупность всех точек пространства С, отстоящих от А не более чем на положительное число ε. При этом расстояние от точки х до множества А – это точная нижняя грань расстояний от х до точек множества А, т.е.
d(A,x) = inf{d(x,y): yA}.
Пусть P1 и P2 – две вероятностные меры на С (т.е. распределения двух случайных элементов со значениями в С). Пусть D12 – множество чисел ε > 0 таких, что
P1(A) < P2(S(A,ε)+ε
для любого замкнутого подмножества А пространства С. Пусть D21 – множество чисел ε > 0 таких, что
P2(A) < P1(S(A,ε)+ε
для любого замкнутого подмножества А пространства С. Расстояние Прохорова L(P1,P2) между вероятностными мерами (его можно рассматривать и как расстояние между случайными элементами с распределениями P1 и P2 соответственно) вводится формулой
L(P1,P2) = max (inf D12, inf D21).
С помощью метрики Прохорова формализуется понятие сходимости распределений случайных элементов в произвольном пространстве.
Расстояние L(P1,P2) введено академиком РАН Юрием Васильевичем Прохоровым в середине ХХ в. и широко используется в современной теории вероятностей.
Сходимость по направленному множеству [4, с.95-96]. Бинарное отношение > (упорядочение), заданное на множестве В, называется направлением на нем, если В не пусто и
(а) если m, n и p – такие элементы множества В, что m > n и n > p, то m > p;
(б) m > m для любого m из B;
(в) если m и n принадлежат B, то найдется элемент p из B такой, что p > m и p > n.
Направленное множество – это пара (В, >), где > - направление на множестве В. Направленностью (или «последовательностью по направленному множеству») называется пара (f, >), где f – функция, > - направление на ее области определения. Пусть f: B → Y, где Y – топологическое пространство. Направленность (f, >) сходится в топологическом пространстве Y к точке y0, если для любой окрестности U точки y0 найдется p из B такое, что f(q)U при любом q > p. В таком случае говорят также о сходимости по направленному множеству.
Пусть В = {(n(1), n(2), … , n(k))} – совокупность векторов, каждый из которых составлен из объемов k выборок. Пусть
(n(1), n(2), … , n(k)) > (n1(1), n1(2), … , n1(k))
тогда и только тогда, когда n(i) > n1(i) при всех i = 1, 2, …, k. Тогда (В, >) – направленное множество, сходимость по которому эквивалентна сходимости при min {n(1), n(2), … , n(k)} → ∞.
Чтобы охватить различные частные случаи, целесообразно предельные теоремы формулировать в терминах сходимости по направленному множеству. Будем писать B = {α}. Пусть запись α→∞ обозначает переход к пределу по направленному множеству.
Формулировка проблемы наследования сходимости. Пусть случайные элементы Xα со значениями в пространстве С сходятся при α→∞ к случайному элементу Х, где через α→∞ обозначен переход к пределу по направленному множеству. Сходимость случайных элементов означает, что L(Xα, X) → 0 при α→∞, где L – метрика Прохорова в пространстве С.
Пусть fα: C → Y – некоторые функции. Какие условия надо на них наложить, чтобы из L(Xα, X) → 0 вытекало, что L1(fα(Xα), fα(X)) → 0 при α→∞, где L1 – метрика Прохорова в пространстве Y? Другими словами, какие условия на функции fα: C → Y гарантируют наследование сходимости?
В работах [5, 6] найдены необходимые и достаточные условия на функции fα: C → Y, гарантирующие наследование сходимости. Описанию этих условий посвящена оставшаяся часть подраздела.
Приведем для полноты изложения строгие формулировки математических предположений (в дальнейшем никому, кроме профессиональных математиков, не понадобятся)
Математические предположения. Пусть С и У – полные сепарабельные метрические пространства, Пусть выполнены обычные предположения измеримости: Хα и Х – случайные элементы С, fα(Хα) и fα(Х) – случайные элементы в У, рассматриваемые ниже подмножества пространств С и У лежат в соответствующих σ–алгебрах измеримых подмножеств, и т.д.
Понадобятся некоторые определения. Разбиение Тn = {C1n, C2n, … , Cnn} пространства С – это такой набор подмножеств Cj, j = 1, 2, … , n, этого пространства, что пересечение любых двух из них пусто, а объединение совпадает с С. Диаметром diam(A) подмножества А множества С называется точная верхняя грань расстояний между элементами А, т.е.
diam(A) = sup {d(x,y), xA, yA},
где d(x,y) – метрика в пространстве С. Обозначим ∂А границу множества А, т.е. совокупность точек х таких, что любая их окрестность U(x) имеет непустое пересечение как с А, так и с C\А. Колебанием δ(f, B) функции f на множестве B называется δ(f, B) = sup {|f(x) – f(y)|, xB, yB}.
Достаточное условие для наследования сходимости. Пусть L(Xα,X) → 0 при α → ∞. Пусть существует последовательность Тn разбиений пространства С такая, что Р(Х∂А) = 0 для любого А из Тn и, основное условие, для любого ε > 0
(1)
при n →∞ и α→∞, где сумма берется по всем тем А из Тn, для которых колебание функции fα на А больше ε, т.е. δ(fα, А) > ε. Тогда L1(fα(Xα), fα(X)) → 0 при α→∞.
Необходимое условие для наследования сходимости. Пусть У – конечномерное линейное пространство, У = Rk. Пусть случайные элементы fα(X) асимптотически ограничены по вероятности при α→∞, т.е. для любого ε > 0 существуют число S(ε) и элемент направленного множества α(ε) такие, что Р(||fα(X)||> S(ε))<ε при α > α(ε), где ||fα(X)|| - норма (длина) вектора fα(X). Пусть существует последовательность Тn разбиений пространства С такая, что
,
т.е. последовательность Тn является безгранично измельчающейся. Самое существенное – пусть условие (1) не выполнено для последовательности Тn. Тогда существует последовательность случайных элементов Xα такая, что L(Xα,X) → 0 при α → ∞, но L1(fα(Xα), fα(X)) не сходится к 0 при α → ∞.
Несколько огрубляя, можно сказать, что условие (1) является необходимым и достаточным для наследования сходимости.
Пример 1. Пусть С и У – конечномерные линейные пространства, функции fα не зависят от α, т.е. fα ≡ f, причем функция f ограничена. Тогда условие (1) эквивалентно требованию интегрируемости по Риману-Стилтьесу функции f по мере G(A) = P(XA). В частности, условие (1) выполнено для непрерывной функции f.
В конечномерных пространствах С вместо сходимости L(Xα,X) → 0 при α → ∞ можно говорить о слабой сходимости функций распределения случайных векторов Xα к функции распределения случайного вектора X. Речь идет о «сходимости по распределению», т.е. о сходимости во всех точках непрерывности функции распределения случайного вектора X. В этом случае разбиения могут состоять из многомерных параллелепипедов [5, гл.2].
Пример 2. Полученные выше результаты дают обоснование для рассуждений типа следующего (ср., например, утверждения в главе 3.1 ниже). Пусть по двум независимым выборкам объемов m и n соответственно построены статистики Xm и Yn. Пусть известно, что распределения этих статистик сходятся при безграничном росте объемов выборок к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1. Пусть a(m, n) и b(m, n) – некоторые коэффициенты. Тогда согласно результатам примера 1 распределение случайной величины Z(m, n) = a(m, n)Xm + b(m, n)Yn сближается с распределением нормально распределенной случайной величины с математическим ожиданием 0 и дисперсией a2(m, n) + b2(m, n). Если же a2(m, n) + b2(m, n) = 1, например,
,
то распределение Z(m, n) сходится при безграничном росте объемов выборок к стандартному нормальному распределению с математическим ожиданием 0 и дисперсией 1.
Предыдущая |