Asymptotyczne właściwości symetrii opartej na charakterystyce i testów dobroci dopasowania. Asymptotyczne kierunki

W nowoczesnych warunkach stale i intensywnie rośnie zainteresowanie analizą danych w zupełnie innych dziedzinach, takich jak biologia, językoznawstwo, ekonomia i oczywiście informatyka. Analiza ta opiera się na metodach statystycznych i każdy szanujący się specjalista w dziedzinie eksploracji danych musi je zrozumieć.

Niestety, naprawdę dobra literatura, która mogłaby dostarczyć zarówno matematycznie rygorystycznych dowodów, jak i zrozumiałych intuicyjnych wyjaśnień, nie jest zbyt powszechna. A te wykłady, moim zdaniem, są niezwykle dobre dla matematyków, którzy właśnie z tego powodu rozumieją teorię prawdopodobieństwa. Są one wykorzystywane do nauczania magisterskich na niemieckim Uniwersytecie Christiana-Albrechta na kierunkach „Matematyka” i „Matematyka finansowa”. A dla tych, którzy są zainteresowani tym, jak ten przedmiot jest nauczany za granicą, przetłumaczyłem te wykłady. Tłumaczenie zajęło mi kilka miesięcy, wykłady rozcieńczyłem ilustracjami, ćwiczeniami i przypisami do niektórych twierdzeń. Zauważ, że nie jestem zawodowym tłumaczem, ale po prostu altruistą i amatorem w tej dziedzinie, więc przyjmę każdą krytykę, jeśli jest konstruktywna.

W skrócie, wykłady dotyczą:


Warunkowe oczekiwanie

Ten rozdział nie jest bezpośrednio związany ze statystyką, jednak najlepiej zacząć go studiować. Oczekiwanie warunkowe jest najlepszym wyborem do przewidywania losowego wyniku na podstawie już dostępnych informacji. I to też jest zmienna losowa. Tutaj rozważamy jego różne właściwości, takie jak liniowość, monotoniczność, zbieżność monotoniczna i inne.

Podstawy estymacji punktowej

Jak oszacować parametr rozkładu? Jakie kryterium do tego wybrać? Jakie metody należy zastosować w tym przypadku? Ten rozdział pozwoli ci odpowiedzieć na wszystkie te pytania. Wprowadza to koncepcje nieobciążonego oszacowania i jednolicie nieobciążonego oszacowania z minimalną wariancją. Wyjaśnia, skąd pochodzi rozkład chi-kwadrat i rozkład Studenta oraz dlaczego są one ważne przy szacowaniu parametrów rozkładu normalnego. Mówi, czym jest nierówność Rao-Cramera i informacje Fishera. Wprowadzono również pojęcie rodziny wykładniczej, co znacznie ułatwia uzyskanie dobrego oszacowania.

Estymacja parametrów bayesowskich i minimaksowych

Tutaj opisano inne filozoficzne podejście do wyceny. W tym przypadku parametr jest uważany za nieznany, ponieważ jest realizacją pewnej zmiennej losowej o znanym (a priori) rozkładzie. Obserwując wynik eksperymentu, obliczamy tzw. rozkład a posteriori parametru. Na tej podstawie możemy uzyskać oszacowanie bayesowskie, gdzie kryterium jest średnia minimalna strata lub oszacowanie minimaksowe, które minimalizuje maksymalną możliwą stratę.

Wystarczalność i kompletność

Ten rozdział ma poważne znaczenie praktyczne. Wystarczająca statystyka jest funkcją próbki, tak że wystarczy przechowywać tylko wynik tej funkcji w celu oszacowania parametru. Takich funkcji jest wiele, a wśród nich wyróżnia się tak zwane minimalne statystyki wystarczające. Na przykład, aby oszacować medianę rozkładu normalnego, wystarczy zapisać tylko jedną liczbę - średnią arytmetyczną z całej próby. Czy to działa również w przypadku innych dystrybucji, takich jak dystrybucja Cauchy'ego? W jaki sposób wystarczające statystyki pomagają w wyborze szacunków? Odpowiedzi na te pytania znajdziesz tutaj.

Asymptotyczne właściwości oszacowań

Być może najważniejszą i niezbędną właściwością oceny jest jej spójność, czyli pragnienie uzyskania prawdziwego parametru przy wzroście wielkości próby. Rozdział ten opisuje jakie właściwości są nam znane oszacowania uzyskane metodami statystycznymi opisanymi w poprzednich rozdziałach. Wprowadzono pojęcia asymptotycznej bezstronności, asymptotycznej efektywności i odległości Kullbacka-Leiblera.

Podstawy testowania

Oprócz pytania, jak ocenić nieznany parametr, musimy jakoś sprawdzić, czy spełnia on wymagane właściwości. Na przykład przeprowadzany jest eksperyment, w którym testowany jest nowy lek. Skąd wiesz, czy masz większe szanse na wyzdrowienie z nim niż ze starymi lekami? W tym rozdziale wyjaśniono, jak skonstruowane są takie testy. Dowiesz się, czym jest jednolicie najpotężniejszy test, test Neumanna-Pearsona, poziom istotności, przedział ufności oraz skąd pochodzą osławiony test Gaussa i test t.

Asymptotyczne właściwości testów

Podobnie jak szacunki, kryteria muszą spełniać pewne asymptotyczne właściwości. Czasami mogą wystąpić sytuacje, w których nie można skonstruować wymaganego kryterium, jednak korzystając z dobrze znanego centralnego twierdzenia granicznego, konstruujemy kryterium, które asymptotycznie dąży do wymaganego. Tutaj dowiesz się, czym jest poziom istotności asymptotycznej, metoda ilorazu wiarygodności oraz jak skonstruowany jest test Bartletta i test niezależności chi-kwadrat.

Model liniowy

Rozdział ten można traktować jako uzupełnienie, a mianowicie zastosowanie statystyki w przypadku regresji liniowej. Dowiesz się, które oceny są dobre i na jakich warunkach. Dowiesz się, skąd wzięła się metoda najmniejszych kwadratów, jak budować kryteria i dlaczego potrzebujesz rozkładu F.

KRYTERIUM ASYMPTOTYCZNE EFEKTYWNOŚCI

Koncepcja, która umożliwia przeprowadzenie, w przypadku dużych prób, ilościowego przeprowadzenia dwóch różnych statystyk. kryteria stosowane do testowania fałszywych i tych samych statystyk. hipotezy. Konieczność pomiaru skuteczności kryteriów pojawiła się w latach 30-40, kiedy obliczeniowo proste, ale nieskuteczne

Encyklopedia Matematyki. - M.: radziecka encyklopedia... I.M. Winogradow. 1977-1985.

Zobacz, co „KRYTERIUM ASYMPTOTYCZNE EFEKTYWNOŚCI” znajduje się w innych słownikach:

    Współczynnik korelacji- (Współczynnik korelacji) Współczynnik korelacji jest wskaźnikiem statystycznym zależności dwóch zmiennych losowych.Wyznaczanie współczynnika korelacji, rodzaje współczynników korelacji, właściwości współczynnika korelacji, obliczenia i zastosowanie ... ... Encyklopedia inwestorów

    Metody matematyczne. statystyki, które nie implikują znajomości funkcjonalnej postaci rozkładów ogólnych. Nazwa metody nieparametryczne podkreśla ich odmienność od klasycznych metod parametrycznych, w których zakłada się, że ogólne ... ... Encyklopedia matematyki

    Proces prezentowania informacji w określonej standardowej formie i odwrotny proces odzyskiwania informacji z takiej reprezentacji. W matematyce. literatura nazywa się kodowaniem. odwzorowanie dowolnego zbioru AB jest zbiorem skończonych ... ... Encyklopedia matematyki

Jak zauważono w poprzednim podrozdziale, badanie klasycznych algorytmów w wielu przypadkach może być prowadzone przy użyciu asymptotycznych metod statystyki matematycznej, w szczególności przy użyciu CLT i metod dziedziczenia zbieżności. Oddzielenie klasycznej statystyki matematycznej od potrzeb badań stosowanych przejawiało się w szczególności brakiem w rozpowszechnionych monografiach aparatu matematycznego niezbędnego w szczególności do badania statystyki dwupróbkowej. Najważniejsze jest to, że musisz zejść do granicy nie o jeden parametr, ale o dwa - objętości dwóch próbek. Musiałem opracować odpowiednią teorię - teorię dziedziczenia zbieżności, przedstawioną w naszej monografii.

Jednak wyniki takiego badania będą musiały być zastosowane przy skończonej wielkości próby. Z takim przejściem wiąże się cała masa problemów. Część z nich została omówiona w związku z badaniem właściwości statystyk skonstruowanych z próbek z określonych rozkładów.

Jednak przy omawianiu wpływu odchyleń od początkowych założeń na właściwości procedur statystycznych pojawiają się dodatkowe problemy. Jakie odchylenia są uważane za typowe? Czy powinniśmy skupić się na najbardziej „szkodliwych” odchyleniach, które w największym stopniu zniekształcają właściwości algorytmów, czy raczej na „typowych” odchyleniach?

Przy pierwszym podejściu otrzymujemy gwarantowany wynik, ale „cena” tego wyniku może być niepotrzebnie wysoka. Jako przykład wskażmy uniwersalną nierówność Berry'ego-Esseena dla błędu w CLT. AA całkiem słusznie podkreśla Borowkow, że „stopa zbieżności w rzeczywistych problemach z reguły okazuje się lepsza”.

Drugie podejście rodzi pytanie, jakie odchylenia są uważane za „typowe”. Możesz spróbować odpowiedzieć na to pytanie, analizując duże tablice rzeczywistych danych. To naturalne, że odpowiedzi różnych grup badawczych będą się różnić, co widać chociażby w przedstawionych w artykule wynikach.

Jednym z fałszywych pomysłów jest użycie w analizie możliwych odchyleń tylko określonej rodziny parametrycznej - rozkładów Weibulla-Gnedenko, trójparametrowej rodziny rozkładów gamma itp. W 1927 r. Acad. Akademia Nauk ZSRR S.N. Bernstein omówił błąd metodologiczny sprowadzania wszystkich rozkładów empirycznych do czteroparametrowej rodziny Pearsona. Jednak parametryczne metody statystyki są nadal bardzo popularne, zwłaszcza wśród specjalistów stosowanych, a winę za to złudzenie ponoszą przede wszystkim nauczyciele metod statystycznych (patrz niżej, a także artykuł).

15. Wybór jednego z wielu kryteriów do sprawdzenia konkretnej hipotezy

W wielu przypadkach opracowano wiele metod rozwiązywania konkretnego problemu praktycznego, a specjalista od matematycznych metod badawczych staje przed problemem: którą z nich należy zaproponować specjaliście stosowanemu do analizy określonych danych?

Jako przykład rozważ problem sprawdzenia jednorodności dwóch niezależnych próbek. Jak wiesz, aby go rozwiązać, możesz zaoferować wiele kryteriów: Student, Cramer-Welch, Lord, chi-kwadrat, Wilcoxon (Mann-Whitney), Van der Waerden, Savage, N.V. Smirnov, typ omega-kwadrat (Lehman - Rosenblatt), GV Martynov i inni. Który wybrać?

Naturalnie przychodzi na myśl idea „głosowania”: sprawdzić według wielu kryteriów, a następnie podjąć decyzję „większością głosów”. Z punktu widzenia teorii statystycznej taka procedura prowadzi po prostu do skonstruowania innego kryterium, które a priori nie jest lepsze od poprzednich, ale trudniejsze do zbadania. Z drugiej strony, jeśli rozwiązania dla wszystkich rozważanych kryteriów statystycznych, oparte na różnych zasadach, są zbieżne, to zgodnie z koncepcją trwałości zwiększa to zaufanie do otrzymanego rozwiązania całościowego.

Panuje powszechna, zwłaszcza wśród matematyków, fałszywa i krzywdząca opinia o potrzebie znalezienia optymalnych metod, rozwiązań itp. Chodzi o to, że optymalność zwykle zanika, gdy odchodzimy od początkowych założeń. Tak więc średnia arytmetyczna jako oszacowanie matematycznego oczekiwania jest optymalna tylko wtedy, gdy początkowy rozkład jest normalny, podczas gdy spójne oszacowanie jest zawsze, jeśli istnieje tylko matematyczne oczekiwanie. Z drugiej strony, dla dowolnej dowolnej metody estymacji lub testowania hipotez, zwykle możliwe jest sformułowanie pojęcia optymalności w taki sposób, aby rozważana metoda stała się optymalna - z tego specjalnie wybranego punktu widzenia. Weźmy na przykład medianę próby jako oszacowanie wartości oczekiwanej. Jest oczywiście optymalna, choć w innym sensie niż średnia arytmetyczna (optymalna dla rozkładu normalnego). Mianowicie dla rozkładu Laplace'a mediana próby jest oszacowaniem największego prawdopodobieństwa, a więc optymalnym (w sensie określonym w monografii).

W monografii przeanalizowano kryteria jednorodności. Istnieje kilka naturalnych podejść do porównywania kryteriów – opartych na asymptotycznej sprawności względnej według Bahadur, Hodges-Lehman, Pitman. I okazało się, że każde kryterium jest optymalne z odpowiednią alternatywą lub odpowiednim rozkładem w zestawie alternatyw. Jednocześnie w obliczeniach matematycznych zwykle stosuje się alternatywę przesunięcia, która jest stosunkowo rzadka w praktyce analizowania rzeczywistych danych statystycznych (w związku z kryterium Wilcoxona alternatywa ta była przez nas dyskutowana i krytykowana). Konkluzja jest smutna - genialna technika matematyczna zademonstrowana w nie pozwala nam dać zaleceń dotyczących wyboru kryterium sprawdzania jednorodności podczas analizy danych rzeczywistych. Innymi słowy, z punktu widzenia pracy osoby aplikującej, tj. analiza konkretnych danych, monografia jest bezużyteczna. Błyskotliwa znajomość matematyki i ogromna pracowitość autora tej monografii niestety nie wniosły niczego do praktyki.

Oczywiście każdy praktycznie pracujący statystyk w taki czy inny sposób rozwiązuje dla siebie problem wyboru kryterium statystycznego. W oparciu o szereg rozważań metodologicznych, zdecydowaliśmy się na kryterium kwadratu omega (Lehmann-Rosenblatt), które było spójne z jakąkolwiek alternatywą. Pozostaje jednak poczucie niezadowolenia z niedostatecznego uzasadnienia tego wyboru.

Zachowanie asymptotyczne (lub zachowanie asymptotyczne) funkcji w sąsiedztwie pewnego punktu a (skończonego lub nieskończonego) jest rozumiane jako natura zmiany funkcji, ponieważ jej argument x dąży do tego punktu. Zwykle starają się przedstawić to zachowanie za pomocą innej, prostszej i lepiej zbadanej funkcji, która w sąsiedztwie punktu a z wystarczającą dokładnością opisuje zmianę interesującej nas funkcji lub ocenia jej zachowanie z jednej lub drugiej strony. W związku z tym pojawia się problem porównania charakteru zmiany dwóch funkcji w sąsiedztwie punktu a, związanego z uwzględnieniem ich konkretu. Szczególnie interesujące są przypadki, gdy dla x a obie funkcje są albo nieskończenie małe (nieskończenie małe), albo nieskończenie duże (nieskończenie duże). 10.1. Porównanie funkcji nieskończenie małych Głównym celem porównania jest nieskończenie małe. Funkcje polegają na porównaniu charakteru ich zbliżania się do zera przy xa lub szybkości ich dążenia do zera. Niech b.m. dla x a funkcje a(x) i P(x) są niezerowe w jakimś przebitym sąsiedztwie (a) punktu a, aw punkcie a są równe zero lub nieokreślone. Definicja 10.1. Funkcje a (x) i 0 (x) nazywane są nieskończenie małymi. tej samej kolejności dla a i napisz og (a:) = w O (/? (")) (symbol O brzmi "duże O"), jeśli dla xa istnieje niezerowa skończona granica stosunku a (x) //?( i), czyli jest oczywiste, że wtedy, zgodnie z (7.24), ZIT € R \ (0), i można napisać X ^ a0 [a (x)).Symbol O posiada własność przechodniości, to znaczy, jeśli - w rzeczywistości, biorąc pod uwagę definicję 10.1 i własność iloczynu funkcji (patrz (7.23)) o skończonych (w tym przypadku nie równych zeru) granicach, otrzymujemy ZACHOWANIE ASYMPTOTYCZNE FUNKCJI Porównanie funkcji nieskończenie małych Definicja 10.2 Funkcja a (x) jest nazywana nieskończenie małą o wyższym rzędzie małości w porównaniu z (3 (x) (lub w stosunku do / 3 (x)) dla xa i napisz ) mówi się, że funkcja jest nieskończenie mała niższego rzędu małości w porównaniu z (x) dla xa, a słowo małości jest zwykle pomijane (jak w przypadku wyższego rzędu w definicji 10.2). Oznacza to, że jeśli lim (wtedy funk /) (x) jest, zgodnie z definicją 10.2, b.m. wyższy rząd w porównaniu z a (x) dla x a i a (z) to b.m. niższego rzędu niż / 3 (x) dla x a, ponieważ w tym przypadku lijTi (fi (x) / ot (x)). Możemy więc napisać Zgodnie z Twierdzeniem 7.3 o relacji funkcji, jej granicy i nieskończenie małej. funkcja z (10.3) wynika, że ​​ot) jest funkcją nieskończenie małą. w. Stąd (x), tj. wartości | a (h) | dla x blisko a, znacznie mniej niż wartości \ 0 (x) \. Innymi słowy, funkcja a(x) dąży do zera szybciej niż funkcja f(x). Twierdzenie 10.1. Produkt dowolnego b.m. dla x a funkcje a(x) i P(x)) są niezerowe w jakimś przebitym sąsiedztwie punktu a, są dla x- ¥ a bm. funkcja wyższego rzędu w porównaniu z każdym z czynników. Rzeczywiście, zgodnie z definicją 10,2 bm. wyższego rzędu (biorąc pod uwagę definicję funkcji nieskończenie małych z 7.10), równości oznaczają ważność twierdzenia. Równości zawierające symbole 0 i 0 są czasami nazywane asymptotycznymi oszacowaniami. Definicja 10.3. Funkcje ot (x) i / 3 (x) nazywane są nieporównywalnymi nieskończenie małymi. dla x - ¥ a, jeśli nie ma ani skończonej ani nieskończonej granicy ich stosunku, tj. if $lim a (x) / 0 (x) (p £ na zewnątrz jako $ lim 0 (x) / a (x)). Przykład 10.1. a. Funkcje a(x) = x i /?(X) = sin2ar na mocy definicji 10.1 - b.m. tego samego rzędu przy x 0, ponieważ biorąc pod uwagę (b. Funkcja a(x) = 1 -coss, z definicji 10.2, jest nieskończenie małym wyższym rzędem w porównaniu z 0 (x) = x przy x 0, ponieważ z biorąc pod uwagę c. Funkcja a (s) = \ / x jest nieskończenie małą liczbą niższego rzędu w porównaniu z fl (x) = x przy x 0, ponieważ r. Funkcje a (s) = x zgodnie z definicją 10.3 są nieporównywalna nieskończenie mała przy x 0, ponieważ granica jest ASYMPTOTYCZNE ZACHOWANIE FUNKCJI Porównanie nieskończenie małych funkcji nie istnieje (ani skończonej, ani nieskończonej - patrz przykład 7.5) Funkcja potęgowa x11 z wykładnikiem n 6 N, n> 1, jest dla xa bm wyższego rzędu w porównaniu z xn ~ 1) ie yap = ao (a: n "* 1), ponieważ lim (xL / xn" 1) = W razie potrzeby dokładniejsze charakterystyki porównawcze zachowania bm. funkcje na x - a jeden z nich jest wybrany jako rodzaj standardu i jest nazywany głównym. Oczywiście wybór głównego bm. do pewnego stopnia arbitralne (wybierają prostsze: x dla x - * 0; x-1 dla x -41; 1 / x dla x -> oo itd.). Spośród stopni 0k (x) główny b.m. funkcje f) (x) z różnymi wykładnikami k> 0 (dla k> 0, k (x) nie jest nieskończenie małą) tworzą podkład porównawczy do oceny bardziej złożonej nieskończenie małej. funkcja a(z). Definicja 10.4. Funkcja a (z) nazywana jest nieskończenie małą. k-tego rzędu małości względem (3 (x) dla x a, a liczba k jest rzędem małości, jeśli funkcje a (z) i / 3k (x) są nieskończenie małe tego samego rzędu dla x a), tj. jeśli słowo "mały" jest zwykle pomijane również w tym przypadku. Uwaga: 1) kolejność jednej funkcji nieskończenie małej względem innej może być dowolną liczbą dodatnią; 2) jeśli kolejność funkcji a (x) względem f3 (x) jest równe k, to rząd funkcji P (x) względem a (x) wynosi 1 / k; 3) nie zawsze dla nieskończenie małej funkcji a (x), nawet porównywalnej ze wszystkimi potęgami /? * (x), można określić konkretne zamówienie do Przykład 10.2. a. Funkcja cosx, zgodnie z definicją 10.4, to b.m. rzędu k = 2 w odniesieniu do 0 (x) = x przy x 0, ponieważ biorąc pod uwagę b. Przyjrzyjmy się funkcjom. Pokażmy to dla każdego Rzeczywiście, zgodnie z (7.32). Tak więc b.m. dla x - * + 0 funkcja a1 / 1 jest porównywalna z xk dla dowolnego k > 0, ale nie jest możliwe wskazanie dla tej funkcji rzędu małości względem x. # Ustal kolejność jednego bm. funkcje względem innych nie zawsze są proste. Możemy polecić następującą procedurę: 1) wpisać pod znakiem limitu stosunek a (x) / 0k (x) \ 2) przeanalizować zarejestrowany stosunek i spróbować go uprościć; 3) na podstawie znanych wyników postawić założenie o możliwej wartości k), przy której będzie granica skończona, która nie jest równa zeru; 4) sprawdzić założenie obliczając limit. Przykład 10.3. Określmy kolejność b.m. funkcje tgx - sin x względem x jako x - »0, tj. znajdź liczbę k> 0 tak, że mamy ASYMPTOTYCZNE ZACHOWANIE FUNKCJI. Porównanie funkcji nieskończenie małych. Na tym etapie, wiedząc, że przy x 0, zgodnie z (7.35) i (7.36), (sinx) / x 1 i cosx -> 1 oraz biorąc pod uwagę (7.23) i (7.33), możemy określić ten warunek ( 10.7) zostanie przeprowadzone dla k = 3. Rzeczywiście, bezpośrednie obliczenie granicy dla k = 3 daje wartość A = 1/2: Zauważ, że dla k> 3 otrzymujemy nieskończoną granicę, a dla granicy będzie równe do zera.

1 Entropia i odległość informacyjna

1.1 Podstawowe definicje i notacja.

1.2 Entropia rozkładów dyskretnych z ograniczonymi oczekiwaniami matematycznymi.

1.3 Logarytmiczna metryka uogólniona na zbiorze rozkładów dyskretnych.

1.4 Zwartość funkcji przeliczalnego zbioru argumentów

1.5 Ciągłość odległości informacyjnej Kullback - Leibler - Sanov

1.6 Wnioski.

2 Prawdopodobieństwo dużych odchyleń

2.1 Prawdopodobieństwo dużych odchyleń funkcji od liczby komórek przy danym wypełnieniu.

2.1.1 Twierdzenie o granicy lokalnej.

2.1.2 Twierdzenie o granicach całkowych.

2.1.3 Odległość informacyjna i prawdopodobieństwa dużych odchyleń statystyk separowalnych

2.2 Prawdopodobieństwo dużych odchyleń statystyk separowalnych, które nie spełniają warunku Cramera.

2.3 Wnioski.

3 Asymptotyczne właściwości testów dobroci dopasowania

3.1 Kryteria konsensusu dla systemu wyboru bez powrotu

3.2 Asymptotyczna efektywność względna testów dobroci dopasowania.

3.3 Kryteria oparte na liczbie komórek w układach uogólnionych.

3.4 Wnioski.

Zalecana lista prac dyplomowych

  • Skuteczność asymptotyczna testów dobroci dopasowania na podstawie właściwości charakteryzacyjnych rozkładów 2011, kandydat nauk fizycznych i matematycznych Volkova, Ksenia Yurievna

  • Duże odchylenia i twierdzenia graniczne dla niektórych funkcjonałów błądzenia losowego 2011, kandydat nauk fizycznych i matematycznych Shklyaev, Alexander Viktorovich

  • Twierdzenia graniczne i duże odchylenia dla przyrostów błądzeń losowych 2004, kandydat nauk fizycznych i matematycznych Kozłow, Andrey Mikhailovich

  • O szybkości zbieżności statystyk testów dobroci dopasowania z wykładniczymi miarami rozbieżności do rozkładu chi-kwadrat 2010, kandydat nauk fizycznych i matematycznych Zubow, Wasilij Nikołajewicz

  • Duże prawdopodobieństwa odchylenia asymptotycznie jednorodnych w przestrzeni ergodycznych łańcuchów Markowa 2004, doktor nauk fizycznych i matematycznych Korshunov, Dmitrij Aleksiejewicz

Wprowadzenie do rozprawy (część streszczenia) na temat „Asymptotyczne właściwości kryteriów dobroci dopasowania do testowania hipotez w schemacie selekcji bez zwracania, oparte na wypełnianiu komórek w uogólnionym schemacie alokacji”

Przedmiot badań i aktualność tematu. W teorii statystycznej analizy ciągów dyskretnych szczególne miejsce zajmują kryteria dobroci dopasowania do testowania możliwie złożonej hipotezy zerowej, czyli dla ciągu losowego takiego,

Xi е hi, i = 1,, n, gdzie hi = (0,1,., M), dla dowolnego i = 1,., N i dla dowolnego k £ 1m prawdopodobieństwo zdarzenia

Xi = k) nie zależy od r. Oznacza to, że ciąg jest w pewnym sensie stacjonarny.

W szeregu zastosowanych problemów, jako ciąg (Xr-) ™ = 1, kolejność kolorów kulek jest brana pod uwagę przy wyborze bez powrotu do wyczerpania z urny zawierającej ni - 1> 0 kulek koloru k, k € 1m. 1,., Pm - 1). Niech urna zawiera n - 1 kulek, m k = 0

Oznaczamy przez r (k) (fc) Jk) rw - Г! ,. ... ... , ciąg liczb kulek koloru A; w próbce. Rozważ sekwencję, w której k)

Kk-p-GPk1.

Sekwencja h ^ jest określona odległościami pomiędzy miejscami sąsiednich kulek koloru k w taki sposób, że

Pk Kf = p. 1> = 1

Zbiór ciągów h (fc) dla wszystkich k £ 1m jednoznacznie określa ciąg.Sekwencje hk dla różnych k są od siebie zależne. W szczególności każdy z nich jest jednoznacznie określony przez wszystkie pozostałe. Jeżeli liczność zbioru 1m jest równa 2, to kolejność kolorów kulek jest jednoznacznie określona przez sekwencję odległości pomiędzy miejscami sąsiednich kulek o tym samym stałym kolorze. Niech urna zawierająca n - 1 kulek w dwóch różnych kolorach zawiera N - 1 kulek o kolorze 0. Można ustalić zależność jeden do jednego między zbiorem ffl (N- l, n - N) a zbiorem 9 \ n , N wektorów h (n, N ) = (hi,., hjf) z dodatnimi składowymi całkowitymi takimi, że K = A. (0,1)

Zbiór 9NP) dz odpowiada zbiorowi wszystkich różnych podziałów dodatniej liczby całkowitej n na N uporządkowanych terminów.

Ustalając pewien rozkład prawdopodobieństwa na zbiorze wektorów ξ Hn, qz, otrzymujemy odpowiedni rozkład prawdopodobieństwa na zbiorze Wl (N - 1, n - N). Zbiór jest podzbiorem zbioru wektorów o nieujemnych składnikach całkowitych spełniających (0,1). Dystrybucje formy

P (%, N) = (n,., RN)) = P (£ „= ru, v = l,., N \ jr ^ = n), (0,2) gdzie. , £ dr są niezależnymi, nieujemnymi, całkowitymi zmiennymi losowymi.

Rozkłady postaci (0,2) w / 24 / nazywane są uogólnionymi schematami dystrybucji cząstek n w komórkach N. W szczególności, jeśli zmienne losowe to £b. , £ лг w (0,2) rozkładają się zgodnie z prawami Poissona z parametrami odpowiednio Ai,., Лдг, to wektor h (n, N) ma rozkład wielomianowy z prawdopodobieństwami wyników

Ri =. , Л ", V = \,., N.

L \ +. ... ... + AN

Jeśli zmienne losowe £ b> & v w (0-2) są równomiernie rozłożone zgodnie z prawem geometrycznym, gdzie p jest dowolnym w przedziale 0< р < 1, то, как отмечено в /25/,/26/, получающаяся обобщенная схема размещения соответствует равномерному распределению на множестве В силу взаимнооднозначного соответствия между множеством dft(N - 1 ,п - N) и множеством tRn,N получаем равномерное распределение на множестве выборов без возвращения. При этом, вектору расстояний между местами шаров одного цвета взаимно однозначно соответствует вектор частот в обобщенной схеме размещения, и, соответственно, числу расстояний длины г - число ячеек, содержащих ровно г частиц. Для проверки по единственной последовательности гипотезы о том, что она получена как результат выбора без возвращения, и каждая такая выборка имеет одну и ту же вероятность можно проверить гипотезу о том, что вектор расстояний между местами шаров цвета 0 распределен как вектор частот в соответствующей обобщенной схеме размещения п частиц по N ячейкам.

Jak zaznaczono w /14/,/38/, szczególne miejsce w testowaniu hipotez o rozkładzie wektorów częstości h (n, N) = (hi,. na podstawie statystyk postaci 1 m (N -l, nN) \ n

LN (h (n, N)) = Zfv (hv)

Fn = F (-T7, flQ Hi II-

0,4) gdzie fu, v = 1,2 ,. a φ to niektóre funkcje o wartościach rzeczywistych, N

Mr = E = r), r = 0,1 . 1 / = 1

Wartości w /27/ nazwano liczbą komórek zawierających dokładnie g cząstek.

Statystyka postaci (0,3) w /30/ nazywana jest statystyką rozdzielną (dodatkowo rozdzielną). Jeżeli funkcje /”in (0.3) nie zależą od u, to takie statystyki były wywoływane w /31/ symetryczne statystyki separowalne.

Dla dowolnego r statystyka / xr jest symetryczną, rozdzielną statystyką. Od równości

Е ДМ = Е ДФг (0,5) z tego wynika, że ​​klasa symetrycznych statystyk separowalnych hv pokrywa się z klasą funkcji liniowych jodły. Ponadto klasa funkcji postaci (0,4) jest szersza niż klasa symetrycznych statystyk separowalnych.

Ale = (#o (n, N)) jest ciągiem prostych hipotez zerowych, że rozkład wektora h (n, N) wynosi (0,2), gdzie zmienne losowe ,. w (0.2) są identycznie rozłożone i k) = pk, k = 0,1,2,., parametry n, N zmieniają się w obszarze centralnym.

Rozważ pewne P £ (0,1) i ciąg, ogólnie rzecz biorąc, złożonych alternatyw

H = (H (n, N)) taki, że istnieje - maksymalna liczba, dla której, dla dowolnej prostej hipotezy H \ e H (n, N), nierówność

РШ> an, N (P))> Р

Hipotezę Hq (ti, N) odrzucimy, jeśli fm> asm ((3). Jeśli istnieje granica

Rn ~ 1nP (0nr> an, N (P)) = u (p, H), gdzie prawdopodobieństwo dla każdego N oblicza się zgodnie z hipotezą Ht (n, N), to wartość ^ (/3, H) wynosi nazwany w / 38 / indeks kryterium φ w punkcie (j3, H). Ta ostatnia granica może, ogólnie rzecz biorąc, nie istnieć. Dlatego w pracy doktorskiej, oprócz wskaźnika kryterium, wartość

Ish (~ 1pR (fm> al (/?)))

JV->oo N-oo oznaczają odpowiednio dolną i górną granicę ciągu (odr) jako N -> oo,

Jeśli indeks kryterium istnieje, indeks dolny kryterium jest z nim zgodny. Indeks dolny kryterium zawsze istnieje. Im wyższa wartość wskaźnika kryterium (niższy wskaźnik kryterium), tym lepsze w rozważanym sensie kryterium statystyczne. W /38/ problem konstruowania kryteriów dobroci dopasowania dla układów uogólnionych o najwyższym indeksie kryterialnym w klasie kryteriów odrzucających hipotezę Ho(n,N) przy ^"gdzie m>0 jest pewną liczbą stałą, ciąg stałych er jest wybierany na podstawie podanej wartości potęgi kryterium dla ciągu alternatyw, ft jest funkcją rzeczywistą m + 1 argumentów.

Wskaźniki kryterialne wyznaczane są przez prawdopodobieństwa dużych odchyleń. Jak pokazano w / 38 /, przybliżona (aż do logarytmicznej równoważności) asymptotyka prawdopodobieństw dużych odchyleń statystyk separowalnych w warunku Cramera dla zmiennej losowej / (£) jest określona przez odpowiednią odległość informacyjną Kul-Baka - Leibler - Sanov (zmienna losowa rj spełnia warunek Cramer jeśli dla pewnego λ> 0 funkcja generująca momenty Metr] jest skończona w przedziale \ t \< Н /28/).

Otwarte pozostawało pytanie o prawdopodobieństwa dużych odchyleń statystyk od nieograniczonej liczby jodeł, a także o dowolne statystyki rozdzielne, które nie spełniają warunku Cramera. Nie pozwoliło nam to ostatecznie rozwiązać problemu konstruowania kryteriów testowania hipotez w uogólnionych schematach alokacji o najwyższym stopniu zbieżności do zera prawdopodobieństwa błędu typu I przy zbliżaniu alternatyw w klasie kryteriów na podstawie statystyki postaci (0,4). O trafności badań rozprawy decyduje potrzeba uzupełnienia rozwiązania postawionego problemu.

Celem pracy jest zbudowanie kryteriów dobroci dopasowania o najwyższym wskaźniku kryterium (niższy wskaźnik kryterium) do testowania hipotez w schemacie selekcji bez powrotu w klasie kryteriów odrzucających hipotezę U (n, N) po $ .<>,■ ■)><*. (0-7) где ф - функция от счетного количества аргументов, и параметры п, N изменяются в центральной области.

Zgodnie z celem badania postawiono następujące zadania:

Zbadaj własności entropii i odległości informacyjnej Kul-baka - Leiblera - Sanova dla rozkładów dyskretnych z policzalną liczbą wyników;

Zbadaj prawdopodobieństwa dużych odchyleń statystyk postaci (0,4);

Zbadaj prawdopodobieństwa dużych odchyleń symetrycznych statystyk separowalnych (0.3), które nie spełniają warunku Cramera;

Znajdź statystykę taką, że zbudowany na jej podstawie test dobroci dopasowania do testowania hipotez w uogólnionych schematach alokacji ma najwyższą wartość wskaźnika w klasie kryteriów postaci (0,7).

Nowość naukowa:

Wartość naukowa i praktyczna. W niniejszym artykule rozwiązano szereg pytań dotyczących zachowania prawdopodobieństw dużych odchyleń w uogólnionych schematach alokacji. Uzyskane wyniki mogą być wykorzystane w procesie dydaktycznym w specjalności statystyka matematyczna i teoria informacji, w badaniu procedur statystycznych do analizy ciągów dyskretnych i zostały wykorzystane w /3/,/21/ przy uzasadnianiu bezpieczeństwa jednej klasy systemów informatycznych. Postanowienia dotyczące obrony:

Zmniejszenie problemu testowania hipotezy o pojedynczą sekwencję kolorów kulek z tego, że sekwencja ta została uzyskana w wyniku wyboru bez powracania do wyczerpania kulek z urny zawierającej kulki dwóch kolorów, a każdy taki wybór ma to samo prawdopodobieństwo do konstrukcji testów dopasowania do testowania hipotez w odpowiednim uogólnionym schemacie układu;

Ciągłość funkcji entropii Kullbacka - Leiblera - Sanova i odległości informacyjnej na nieskończenie wymiarowym simpleksie z wprowadzoną metryką logarytmiczną uogólnioną;

Twierdzenie o zgrubnej (aż do logarytmicznej równoważności) asymptotyce prawdopodobieństw dużych odchyleń dla symetrycznych statystyk separowalnych, które nie spełniają warunku Cramera w uogólnionym schemacie alokacji w przypadku półosiowym;

Twierdzenie o zgrubnej (do równoważności logarytmicznej) asymptotykach prawdopodobieństw dużych odchyleń dla statystyki postaci (0,4);

Konstrukcja testu dobroci dopasowania do testowania hipotez w układach uogólnionych o najwyższej wartości wskaźnika w klasie kryteriów postaci (0,7).

Zatwierdzenie pracy. Wyniki przedstawiono na seminariach Katedry Matematyki Dyskretnej Instytutu Matematycznego. VA Steklova Rosyjskiej Akademii Nauk, Departament Bezpieczeństwa Informacji ITMiVT im. SA Lebedev RAS i na:

Piąte Ogólnorosyjskie Sympozjum Matematyki Stosowanej i Przemysłowej. Sesja wiosenna, Kisłowodzk, 2-8 maja 2004;

VI Międzynarodowa Konferencja Pietrozawodska "Metody probabilistyczne w matematyce dyskretnej" 10 - 16 czerwca 2004;

Druga międzynarodowa konferencja „Systemy i technologie informacyjne (IST” 2004)”, Mińsk, 8-10 listopada 2004;

Międzynarodowa konferencja "Współczesne problemy i nowe trendy w teorii prawdopodobieństwa", Czerniowce, Ukraina, 19 - 26 czerwca 2005.

Główne wyniki pracy wykorzystano w pracy badawczej „Apologia”, realizowanej przez ITMiHT RAS im. SA Lebiediew w interesie Federalnej Służby Kontroli Technicznej i Eksportu Federacji Rosyjskiej i zostały uwzględnione w sprawozdaniu z realizacji etapu B+R /21/. Niektóre wyniki rozprawy zostały zawarte w raporcie badawczym „Rozwój matematycznych problemów kryptografii” Akademii Kryptografii Federacji Rosyjskiej za rok 2004/22/.

Autor wyraża głęboką wdzięczność doradcy naukowemu, doktorowi fizyki i matematyki A.F. Ronzhinowi oraz doradcy naukowemu, doktorowi fizyki i matematyki, starszemu badaczowi A.V. cennych uwag.

Struktura i treść pracy.

Pierwszy rozdział bada własności entropii i odległości informacyjnej dla rozkładów na zbiorze nieujemnych liczb całkowitych.

W pierwszym akapicie pierwszego rozdziału wprowadza się notację i niezbędne definicje. W szczególności stosuje się następującą notację: x = (xq, x \,.) Jest nieskończenie wymiarowym wektorem o policzalnej liczbie składników;

H (x) - -Ex ^ oXvlnx, -, truncm (x) = (x0, x1,., Xm, 0,0 ,.)] f2 * = (x, xu> 0, zy = 0,1 ,. , Oh"< 1}; Q = {х, х, >0, u = 0,1,., О xv = 1); = (x G 0, £ L0 = 7);

Ml = o Ue> 1 | 5 € o< Ml - 7МГ1 < 00}. Понятно, что множество £1 соответствует семейству вероятностных распределений на множестве неотрицательных целых чисел, П7 - семейству вероятностных распределений на множестве неотрицательных целых чисел с математическим ожиданием 7.

Jeśli y e, to dla e> 0 przez Oe (y) oznaczymy zbiór

Oe (y) - (x ^< уие£ для всех v = 0,1,.}.

W drugiej części pierwszego rozdziału udowodniono twierdzenie o ograniczoności entropii rozkładów dyskretnych z ograniczonym oczekiwaniem.

Twierdzenie 1. O ograniczoności entropii rozkładów dyskretnych z ograniczonym oczekiwaniem.

Dla każdego w 6 P7

H (x)

Jeśli x € fly odpowiada rozkładowi geometrycznemu z matematyczną definicją 7, czyli 7 x „= (1-p) p \ v = 0,1,., gdzie p = -,

1 + 7 to równość

H (x) = F (<7).

Stwierdzenie twierdzenia można postrzegać jako wynik formalnego zastosowania metody mnożnika warunkowego Lagrange'a w przypadku nieskończonej liczby zmiennych. Twierdzenie, że jedynym rozkładem na zbiorze (k, k + 1, k + 2 ,.) o danym oczekiwaniu matematycznym i maksymalnej entropii jest rozkład geometryczny o danym oczekiwaniu matematycznym, jest podane (bez dowodu) w / 47 /. Autor przedstawił jednak rygorystyczny dowód.

W trzeciej części pierwszego rozdziału podana jest definicja metryki uogólnionej - metryki, która dopuszcza wartości nieskończone.

Dla x, y € Q, funkcję p (x, y) definiuje się jako minimalne e> 0 o własności yie ~ £<хи< уиее для всех и = 0,1,. Если такого е не существует, то полагается, что р(х,у) = оо.

Udowodniono, że funkcja p (x, y) jest metryką uogólnioną na rodzinę rozkładów na zbiorze nieujemnych liczb całkowitych, jak również na całym zbiorze Cl *. Zamiast e w definicji metryki p (x, y) można użyć dowolnej liczby dodatniej innej niż 1. Otrzymane metryki będą się różnić o stałą multiplikatywną. Przez J (x, y) oznaczamy odległość informacyjną

00 £ J (x, y) = Е In-.

Tu i poniżej zakłada się, że 0 In 0 = 0,0 In jj = 0. Odległość informacyjna jest zdefiniowana dla takich x, y, że xn = 0 dla wszystkich i takie, że yi = 0. Jeśli ten warunek nie jest spełniony, to postawimy J (x, ij) = oo. Niech L SP. Wtedy będziemy oznaczać

J (A Y) = | nf J (x, y).

W czwartej części pierwszego rozdziału definiujemy zwartość funkcji zdefiniowanych na zbiorze Q*. Zwartość funkcji o policzalnej liczbie argumentów oznacza, że ​​z dowolnym stopniem dokładności wartość funkcji może być aproksymowana wartościami tej funkcji w punktach, w których tylko skończona liczba argumentów jest niezerowa. Wykazano zwartość funkcji entropii i odległości informacyjnej.

1. Dla dowolnego 0< 7 < оо функция Н(х) компактна на

2. Jeśli dla niektórych 0< 70 < оо

R e wtedy dla dowolnego 0<7<оо,г>0 funkcja x) = J (x, p) jest zwarta na zbiorze 7] Og (p).

W piątej części pierwszego rozdziału rozważane są właściwości odległości informacyjnej określonej w przestrzeni nieskończenie wymiarowej. W porównaniu z przypadkiem skończenie wymiarowym sytuacja z ciągłością informacyjnej funkcji odległości zmienia się jakościowo. Wykazano, że funkcja odległości informacji nie jest ciągła na zbiorze w żadnej z metryk

Pl i V) = E \ Xi ~ Y \, u = 0

E (xv - Yi) 2 v = Q

P3 (x, y) = 8Up \ xu-yv \. v

Dla funkcji entropii H (x) i odległości informacyjnej J (x, p) udowodniono następujące nierówności:

1. Dla dowolnego x, x „€ fi

H (x) - H (x ") \< - 1){Н{х) + Н{х")).

2. Jeżeli dla jakiegoś x, p e istnieje e>0 takie, że x 6 0 £ (p), to dla dowolnego x "e Q J (x, p) - J (x", p) |< (е"М - 1){Н{х) + Н{х") + ееН(р)).

Biorąc pod uwagę Twierdzenie 1, nierówności te implikują jednorodną ciągłość funkcji entropii i odległości informacyjnej na odpowiednich podzbiorach Q w metryce p (x, y) t, a mianowicie:

1. Dla dowolnych 7 takich, że 0< 7 < оо, функция Н(х) равномерно непрерывна на Г2 в метрике р(ж,у);

2. Jeśli za jakieś 70, 0< 70 < оо

WTEDY dla dowolnego 0<7<оои£>0 funkcja

A p (x) = J (x, p) jest jednostajnie ciągła na zbiorze Oe (p) w metryce p (x, y).

Podano definicję nieskrajności funkcji. Warunek nieekstremalny oznacza, że ​​funkcja nie ma ekstremów lokalnych lub funkcja przyjmuje te same wartości na minimach lokalnych (maksymach lokalnych). Warunek braku ekstremów osłabia wymóg braku ekstremów lokalnych. Na przykład funkcja sin x na zbiorze liczb rzeczywistych ma ekstrema lokalne, ale spełnia warunek nieskrajności.

Niech dla jakiegoś 7> 0, obszar A jest określony przez warunek

A = (x € VLv4> (x)> a), (0,9) gdzie φ (x) jest funkcją o wartościach rzeczywistych, a jest pewną rzeczywistą stałą, inf φ (x)< а < inf ф(х).

Badano pytanie, w jakich warunkach na funkcji φ przy zmianie parametrów n, N w obszarze centralnym, ^ -; 7, dla wszystkich dostatecznie dużych ich wartości istnieją nieujemne liczby całkowite ko, k1,., Kn takie, że k0 + ki +. + kn = N, k \ + 2k2. + pkp - N i

Ф (ko k \ kn

- £, 0,0,.)> A.

Udowodniono, że do tego wystarczy, aby funkcja φ była nieekstremalna, zwarta i ciągła w metryce p (x, y), a także, że dla co najmniej jednego punktu x spełniającego (0,9) dla pewnego ε> 0 istnieje moment skończony stopnia 1 + e i x „> 0 dla dowolnego v = 0,1 ,.

W drugim rozdziale badane jest zgrubne (do równoważności logarytmicznej) asymptotyczne zachowanie prawdopodobieństwa dużych odchyleń funkcji od A = (^ 0) ■) C "n, 0,.) - liczba komórek o danej wypełnienie centralnego obszaru zmienności parametrów N, n. asymptotyki prawdopodobieństw dużych odchyleń jest wystarczające do badania wskaźników testów dobroci dopasowania.

Niech zmienne losowe ^ w (0,2) będą miały identyczny rozkład i

P (z), funkcja tworząca zmiennej losowej, zbiega się w okręgu o promieniu 1< R < оо. Следуя /38/, для 0 < z < R обозначим через £(z) случайную величину такую, что

Ml + £ = £ i1 + ex „< 00.

0,10) k] = Pk, k = 0,1 ,.

Oznaczamy

Jeżeli istnieje rozwiązanie równania m Z(z) = b, to jest ono jednoznaczne /38/. W dalszej części założymy, że pk> 0, A; = 0,1 ,.

W pierwszym akapicie pierwszej części rozdziału drugiego znajdujemy asymptotykę logarytmów prawdopodobieństw postaci

1nP (/ x0 = ko,., Cn = kn).

Udowodniono następujące twierdzenie.

Twierdzenie 2. Zgrubne lokalne twierdzenie o prawdopodobieństwach dużych odchyleń. Niech n, N - »oo tak, że jj -> 7,0<7 < оо, существует z7 - корень уравнения M£(z) = 7, с. в. £(г7) имеет положительную дисперсию. Тогда для любого k G Cl(n,N)

1nP (D = k) = JftpK)) + O (^ lniV).

Twierdzenie twierdzenia wynika bezpośrednio ze wzoru na łączny rozkład fii ,. fin w / 26 / i następujące oszacowanie: jeśli nieujemne wartości całkowite, Нп spełniają warunek

Cześć + 2d2 + + PNn = n, to liczba niezerowych wartości między nimi wynosi 0 (n / n). To przybliżone oszacowanie, które nie twierdzi, że jest nowe. Liczba niezerowych μg w uogólnionych schematach alokacji nie przekracza wartości maksymalnego wypełnienia komórek, która w regionie centralnym z prawdopodobieństwem dążącym do 1 nie przekracza wartości O(lnn)/25/,/27/. Niemniej jednak otrzymane oszacowanie 0 (y/n) jest spełnione z prawdopodobieństwem 1 i wystarcza do uzyskania przybliżonej asymptotyki.

W drugim akapicie pierwszego akapitu drugiego rozdziału, wartość limitu znajduje się, gdzie adr jest ciągiem liczb rzeczywistych zbieżnych do pewnego G R, φ (x) jest funkcją o wartościach rzeczywistych. Udowodniono następujące twierdzenie.

Twierdzenie 3. Zgrubne twierdzenie całkowe o prawdopodobieństwach dużych odchyleń. Niech warunki Twierdzenia 2 będą spełnione, dla pewnego r> 0, C> 0 funkcja rzeczywista φ (x) jest zwarta, jednostajnie ciągła w metryce p na zbiorze

A = 0 lub +<;(p(z7)) П Ц7+с] и удовлетворяет условию неэкстремальности на множестве fly. Если для некоторой константы а такой, что inf ф(х) < а < sup ф(х). xeily существует вектор ра € fi7 П 0r(p(z7)); такой, что

Ф (pa)> a i j (( (x)> a, xe 7), p (2; 7)) = 7 (pa, p (* y)) mo dla dowolnego ciągu a ^ zbieżnego do a,

Jim -vbPW %% ,.)> aN) = J (pa, p (2h)). (0,11)

Przy dodatkowych ograniczeniach funkcji φ (x), odległość informacyjna J (pa, p (z7)) w (2.3) może być obliczona bardziej szczegółowo. Mianowicie prawdziwe jest następujące twierdzenie. Twierdzenie 4. O dystansie informacyjnym. Niech na jakieś 0< 7 < оо для некоторвх г >0, C> 0, funkcja rzeczywista φ (x) i jej pochodne cząstkowe pierwszego rzędu są zwarte i jednostajnie ciągłe w metryce uogólnionej p (x, y) na zbiorze p G

A = O (p)% + c] istnieje T> 0, R> 0, takie, że dla wszystkich \ t \<Т,0 < z < R,x е А

E ^ exp ^ -ph (x))< оо,

0 (a;) exp (t-< со, i/=o oxv 0X1/ для некоторого е >0 °° Q pvv1 + £zu exp (t-φ (x))< оо, (0.13) и существует единственный вектор x(z,t), удовлетворяющий системе уравнений xv(z, t) = pvzv ехр {Ь-ф(х(г, t))}, v = 0,1,. функция ф(х) удовлетворяет на множестве А условию неэкстремальности, а - некоторая константа, ф(р) < а < sup ф(:x)(z,t),

0

00 vpv (za, ta) = 7, 1 / = 0

0 (p (* aL)) = a, gdzie

Wtedy p (za, ta) € i

J ((x e A, φ (x) = a), p) = J (p (za, ta), p)

00 d 00 d = l \ nza + taYl ir- (x (za, ta)) - W E ^ y / exp (ta-z- (p (zatta))). j / = 0 C ^ i / t ^ = 0

Jeśli funkcja φ (x) jest funkcją liniową, a funkcja f (x) jest zdefiniowana przy użyciu równości (0.5), to warunek (0.12) zamienia się w warunek Cramera dla zmiennej losowej f (£ (z)). Warunek (0.13) jest formą warunku (0.10) i służy do udowodnienia istnienia w dziedzinach postaci (x G φ (x)> a) co najmniej jeden punkt od 0 (n, N) dla wszystkich wystarczająco dużych n , N.

Niech ^) (n, N) = (hi,., / Rdr) będzie wektorem częstotliwości w uogólnionym schemacie alokacji (0.2). W konsekwencji Twierdzeń 3 i 4 sformułowano następujące twierdzenie.

Twierdzenie 5. Zgrubne twierdzenie całkowe o prawdopodobieństwach dużych odchyleń symetrycznej statystyki rozkładalnej w uogólnionym schemacie alokacji.

Niech n, N - »oo tak, że ^ - 7, 0< 7 < оо, существует z1 - корень уравнения М£(,г) = 7, с. в. £(27) имеет положительную дисперсию и максимальный шаг распределения 1, а - некоторая константа, f(x) - действительная функция, а < Mf(^(z1)), существуют Т >0, R> 0 takie, że dla wszystkich |t |<Т,0 < z < R,

00 oo, u = 0 istnieje ta \

E vVi / („01 ta) = b gdzie f (v) p” (za, ta) = a, 1 / = 0

Następnie dla dowolnej reklamy sekwencyjnej, zbieżnej do a,

Jim - - InF "(- £ f (h„)> aN) = J (p (za, ta), p (z7))

00 7 In 2a + taa - In £ p ^ / e ^ M i / = 0

Twierdzenie to po raz pierwszy udowodnił A.F. Ronzhin w /38/ przy użyciu metody siodła.

W drugiej części drugiego rozdziału badamy prawdopodobieństwa dużych odchyleń statystyk separowalnych w uogólnionej alokacji cxj^iax w przypadku niespełnienia warunku Cramera dla zmiennej losowej f(€(z)). Warunek Cramera dla zmiennej losowej f (£ (z)) nie jest spełniony, w szczególności jeśli £ (z) jest zmienną losową Poissona, a f (x) wynosi x2. Należy zauważyć, że warunek Cramera dotyczący samych statystyk separowalnych w uogólnionych schematach alokacji jest zawsze spełniony, ponieważ dla dowolnego ustalonego n, N liczba możliwych wyników w tych schematach jest skończona.

Jak zauważono w / 2 /, jeśli warunek Cramera nie jest spełniony, to aby znaleźć asymptotyczne zachowanie prawdopodobieństw dużych odchyleń sum identycznie rozłożonych zmiennych losowych, wymagane jest dodatkowe spełnienie. F

V i. ... I warunki prawidłowej zmiany rozkładu terminu. w pracy

О, 5 rozpatrujemy przypadek odpowiadający spełnieniu warunku (3) w / 2 /, czyli przypadek półwykładniczy. Niech P (£ i = k)> 0 dla wszystkich k = 0,1 ,. a funkcję p (k) = - \ nP (^ = k), można rozszerzyć do funkcji o ciągłym argumencie - regularnie zmieniającej się funkcji rzędu p, 0< р < со /45/, то есть положительной функции такой, что при t ->z oo p (tx) ul.

Niech funkcja f(x) dla wystarczająco dużych wartości argumentu będzie dodatnią, ściśle rosnącą, regularnie zmieniającą się funkcją porządku.Funkcję φ(x) definiujemy przez ustawienie dla wystarczająco dużej wartości x φ) = p (Γ \ x )).

Na pozostałej części osi liczbowej ip (x) można określić w dowolnie ograniczony mierzalny sposób.

Następnie s. v. F (ti) ma momenty dowolnego rzędu i nie spełnia warunku Craméra, p (x) = o (x) jako x -> oo, a następujące twierdzenie jest prawdziwe Twierdzenie 6. Załóżmy, że dla wystarczająco dużego x funkcja ip (x) nie maleje monotonicznie, Φг ^ akcja nie rośnie monotonicznie, n, N -> oo tak, że jj = A, 0< Л < оо; гд - единственный корень уравнения M^i(^) = Л, тогда для любого с >b (z \), gdzie b (z) = M / (£ i (.z)), istnieje granica CN) = - (c - b (z \)) 4.

Z Twierdzenia b wynika, że ​​jeśli warunek Cramera nie jest spełniony, granica lim 1 InP (LN (h (n, N))> cN) = 0, ^ ^ iv-too iv, co dowodzi słuszności postawionej hipotezy w / 39 /. Zatem wartość wskaźnika kryterium dobroci dopasowania w uogólnionych schematach alokacji, jeśli warunek Cramera nie jest spełniony, jest zawsze równa zeru. W tym przypadku w klasie kryteriów, gdy spełniony jest warunek Cramera, konstruowane są kryteria o niezerowej wartości indeksu. Można zatem stwierdzić, że asymptotycznie nieefektywne jest stosowanie kryteriów, których statystyki nie spełniają warunku Cramera, na przykład testu chi-kwadrat w schemacie wielomianowym, do konstruowania testów dobroci dopasowania do testowania hipotez dla braku zbieżności alternatywy w tym sensie. Podobny wniosek ^ wyciągnięto w /54/, porównując statystyki chi-kwadrat i maksymalny iloraz wiarygodności w schemacie wielomianowym.

Rozdział trzeci rozwiązuje problem konstrukcji kryteriów dobroci dopasowania o najwyższej wartości wskaźnika kryterium (najwyższej wartości indeksu dolnego kryterium) do testowania hipotez w uogólnionych schematach plasowania. Na podstawie wyników pierwszego i drugiego rozdziału dotyczącego właściwości funkcji entropii, odległości informacyjnej i prawdopodobieństw dużych odchyleń w trzecim rozdziale znajdujemy funkcję postaci (0,4) taką, że kryterium dobroci dopasowania zbudowany na jego podstawie ma najwyższą wartość dokładnego indeksu dolnego w rozpatrywanej klasie kryteriów. Udowodniono następujące twierdzenie.

Twierdzenie 7. O istnieniu indeksu. Niech warunki Twierdzenia 3 będą spełnione, 0< /3 < 1, Н = Hp(i),Hp(2>,. jest ciągiem rozkładów alternatywnych, a, φ ((3, N) to maksymalna liczba, dla której zgodnie z hipotezą Нр<ло выполнено неравенство существует предел lim^-оо о>f (P, N) - za. Wtedy w punkcie (/3, H) znajduje się indeks kryterium φ

Zff, H) = 3 ((φ (x)> a, x £

Szi)<ШН)>gdzie w / fo fh h v ^ l ^

Konkluzja przedstawia uzyskane wyniki w ich korelacji z celem ogólnym i zadaniami szczegółowymi określonymi w rozprawie, formułuje wnioski na temat wyników badań rozprawy, wskazuje na nowość naukową, wartość teoretyczną i praktyczną pracy, a także konkretną naukową zadania, które zostały zidentyfikowane przez autora i których rozwiązanie wydaje się być istotne...

Krótka recenzja literatura na temat badań. W pracy rozpatrzono problem konstruowania kryteriów dobroci dopasowania w uogólnionych schematach alokacji o największej wartości wskaźnika kryterium w klasie funkcji o postaci (0,4) z niezbiegającymi alternatywami.

Uogólnione schematy umieszczania wprowadził V.F.Kolchin w /24/. Ilości w schemacie wielomianowym nazwano liczbą komórek z peletkami r i zostały szczegółowo zbadane w monografii V. F. Kolchina, B. A. Sevastyanova, V. P. Chistyakova / 27 /. Wartości jodły w uogólnionych schematach alokacji zbadał V. F. Kolchin w /25/, /26/. Statystyka postaci (0,3) została po raz pierwszy uwzględniona przez J. I. Miedwiediewa w / 30 / i została nazwana statystyką rozdzielną (dodatkowo rozdzielną). Jeśli funkcje /”in (0.3) nie zależą od i, to takie statystyki zostały wywołane w /31/ symetryczne statystyki separowalne. Asymptotykę momentów rozdzielnych statystyk w uogólnionych schematach alokacji uzyskał G.I.Iwczenko w / 9 /. Twierdzenia graniczne dla uogólnionego schematu alokacji zostały również uwzględnione w /23/. Przeglądy wyników twierdzeń granicznych i testów zgodności w dyskretnych schematach probabilistycznych typu (0,2) podali W. A. ​​Iwanow, G. I. Iwczenko, J. I. Miedwiediew w / 8 / oraz G. I. Iwczenko, J. I. Miedwiediew , AF Ronzhin w /14/. Kryteria dopasowania uogólnionych układów zostały uwzględnione przez A. F. Ronzhina w /38/.

Porównanie właściwości testów statystycznych we wskazanych pracach przeprowadzono z punktu widzenia względnej skuteczności asymptotycznej. Rozpatrzyliśmy przypadek hipotez zbieżnych (ciągłych) – efektywność w sensie Pitmana oraz hipotez niezbieżnych – efektywność w sensie Bahadura, Hodgesa – Lehmana i Czernowa. Zależność między różnymi rodzajami względnej wydajności testów statystycznych omówiono np. w /49/. Jak wynika z wyników 10. I. Miedwiediewa w /31/ w sprawie rozkładu statystyk rozłącznych w schemacie wielomianowym, najwyższą moc asymptotyczną dla hipotez zbieżnych w klasie statystyk rozłącznych z częstości wyników w schemacie wielomianowym ma test oparty na statystykach chi-kwadrat. Wynik ten uogólnił A.F.Ronzhin na schematy typu (0,2) w /38/. II Viktorova i VP Chistyakov w / 4 / skonstruowali optymalne kryterium schematu wielomianowego w klasie funkcji liniowych / xr. AF Ronzhin w /38/ skonstruował kryterium, które dla ciągu alternatyw nie zbliżających się do hipotezy zerowej minimalizuje logarytmiczną stopę zbieżności prawdopodobieństwa błędu pierwszego rodzaju do zera w klasie statystyki postaci (0.6). Porównanie względnej skuteczności statystyki chi-kwadrat i maksymalnego ilorazu wiarygodności dla hipotez zbieżnych i niezbieżnych przeprowadzono w /54/.

W pracy uwzględniono przypadek hipotez nie zbieżnych. Badanie względnej skuteczności statystycznej kryteriów dla niezbieżnych hipotez wymaga zbadania prawdopodobieństw bardzo dużych odchyleń - rzędu 0 (i / n). Po raz pierwszy taki problem dla rozkładu wielomianowego ze stałą liczbą wyników rozwiązał I. N. Sanov w /40/. Asymptotyczna optymalność testów dobroci dopasowania do testowania prostych i złożonych hipotez dla rozkładu wielomianowego w przypadku skończonej liczby wyników z niezbieżnymi alternatywami została uwzględniona w / 48 /. Własności dystansu informacyjnego rozważali wcześniej Kullback, Leibler /29/, /53/ oraz I. II. Sanov / 40 /, a także Heffding / 48 /. W pracach tych rozważano ciągłość odległości informacyjnej na przestrzeniach skończonych w metryce euklidesowej. W pobliżu autor rozważał sekwencję przestrzeni o rosnącym wymiarze, na przykład w pracy Yu.V.Prokhorova / 37 / lub w pracy V.I.Bogacheva, A.V.Kolesnikova /1/. Zgrubne (aż do logarytmicznej równoważności) twierdzenia o prawdopodobieństwach dużych odchyleń statystyk separowalnych w uogólnionych schematach alokacji w warunku Cramera uzyskał A. F. Ronzhin w / 38 /. A.N. Timashev w / 42 /, / 43 / uzyskał dokładne (do równoważności) wielowymiarowe całki i lokalne twierdzenia graniczne dotyczące prawdopodobieństw dużych odchyleń wektora jodły ^ n, N)., Iir. (N, N), gdzie s, r \,., rs są stałymi liczbami całkowitymi,

O<П < .

Badanie prawdopodobieństw dużych odchyleń w przypadku niespełnienia warunku Cramera dla przypadku niezależnych zmiennych losowych przeprowadzono w pracach A. V. Nagaeva / 35 /. Metodę rozkładów sprzężonych opisuje Feller /45/.

Statystyczne problemy testowania hipotez i estymacji parametrów w schemacie wyboru bez powracania w nieco innym ustawieniu rozważali G.I. Ivchenko, VV Levin, E.E. liczba jego elementów jest wielkością nieznaną, udowodniono asymptotyczną normalność wielowymiarowej S - statystyki z s niezależnych próbek w schemacie doboru bez zwracania. Problem badania zmiennych losowych związanych z powtórzeniami w sekwencjach niezależnych testów badali A.M.Zubkov, VG.Michajłow, A.M.Shoitov w / 6 /, / 7 /, / 32 /, / 33 /, / 34 / ... Analizę głównych statystycznych problemów estymacji i testowania hipotez w ramach ogólnego modelu Markowa-Poyi przeprowadzili GI Iwczenko, J. I. Miedwiediew w /13/, których analizę probabilistyczną podali w / 11 /. Metodę określania niejednolicie prawdopodobnych miar na zbiorze obiektów kombinatorycznych, która nie daje się zredukować do uogólnionego schematu alokacji (0,2), została opisana w G.I.Ivchenko, Yu.I.Miedwiediew/12/. Na szereg problemów z teorii prawdopodobieństwa, na które odpowiedź można uzyskać w wyniku obliczeń i na powtarzających się wzorach, wskazał A. M. Zubkov w /5/.

Nierówności entropii rozkładów dyskretnych uzyskano w /50/ (cytat z abstraktu A.M. Zubkowa w RZhMat). Jeśli (pn) ^ Lo jest rozkładem prawdopodobieństwa, oo

Рп = Е Рк, к = тг

A = supp ^ Pn + i< оо (0.14) п>0 i

F (x) = (x + 1) In (x + 1) - x In x, to dla entropii R tego rozkładu prawdopodobieństwa

00 i = - 5Z Pk ^ Pk k = 0 nierówności -L 1 00 00 P

H + (In -f-) £ (Arn - Pn + 1)< F(А) < Я + £ (АРп - P„+i)(ln

Л D п = П -t pozycje 4-1 i nierówności zamieniają się w równości, jeśli

Pn = (xf1) n + vn> Q. (0,15)

Należy zauważyć, że rozkład ekstremalny (0,15) jest rozkładem geometrycznym z matematycznym oczekiwaniem A, a funkcja F (A) parametru (0,14) pokrywa się z funkcją matematycznego oczekiwania w Twierdzeniu 1.

Podobne rozprawy w specjalności „Teoria prawdopodobieństwa i statystyka matematyczna”, 01.01.05 kod VAK

  • Skuteczność asymptotyczna kryteriów wykładniczych bez parametru skali 2005, kandydat nauk fizycznych i matematycznych Chirina, Anna Vladimirovna

  • Wybrane problemy teorii prawdopodobieństwa i statystyki matematycznej związane z rozkładem Laplace'a 2010, kandydat nauk fizycznych i matematycznych Lyamin, Oleg Olegovich

  • Twierdzenia graniczne w problemach gęstych zanurzeń i gęstych szeregach w dyskretnych ciągach losowych 2009, kandydat nauk fizycznych i matematycznych, Mezhennaya, Natalia Michajłowna

  • Twierdzenia graniczne dotyczące liczby przecięć pasa przez trajektorie błądzenia losowego 2006, kandydatka nauk fizycznych i matematycznych Orłowa, Nina Gennadievna

  • Optymalizacja struktury estymat momentów dokładności przybliżenia normalnego dla rozkładów sum niezależnych zmiennych losowych 2013, doktor nauk fizycznych i matematycznych Shevtsova, Irina Gennadievna

Zakończenie pracy magisterskiej na temat „Teoria prawdopodobieństwa i statystyka matematyczna”, Kołodzey, Aleksander Władimirowicz

3.4. wnioski

W tym rozdziale, w oparciu o wyniki poprzednich rozdziałów, udało nam się skonstruować test zgodności do testowania hipotez w uogólnionych schematach alokacji o najwyższym logarytmicznym współczynniku zbieżności ^ zero prawdopodobieństw błędów pierwszego rodzaju przy stałe prawdopodobieństwo błędu pierwszego rodzaju i niezbieżnych alternatyw. ~ "

Wniosek

Celem pracy doktorskiej było zbudowanie kryteriów dopasowania do testowania hipotez w schemacie selekcji bez powrotu z urny zawierającej kule 2 kolorów. Autor postanowił zbadać statystyki na podstawie częstotliwości odległości między kulkami tego samego koloru. W tym układzie problem sprowadzał się do problemu testowania hipotez w odpowiednim uogólnionym układzie.

Praca doktorska obejmowała

Zbadano właściwości entropii i odległości informacyjnej rozkładów dyskretnych z nieograniczoną liczbą wyników z ograniczonymi oczekiwaniami matematycznymi;

Otrzymuje się przybliżoną (do równoważności logarytmicznej) asymptotykę prawdopodobieństw dużych odchyleń dla szerokiej klasy statystyk w uogólnionym schemacie alokacji;

Na podstawie uzyskanych wyników skonstruowano funkcję kryterium o najwyższym logarytmicznym tempie dążenia do zera prawdopodobieństwa błędu typu I przy stałym prawdopodobieństwie błędu typu II oraz alternatyw nie zbieżnych;

Udowodniono, że statystyki niespełniające warunku Cramera mają niższy współczynnik zbieżności do zera prawdopodobieństw dużych odchyleń w porównaniu ze statystykami spełniającymi ten warunek.

Nowość naukowa pracy jest następująca.

Podano pojęcie metryki uogólnionej - funkcji, która przyjmuje wartości nieskończone i spełnia aksjomaty tożsamości, symetrii i nierówności trójkątów. Znaleziono metrykę uogólnioną i wskazano zbiory, w których funkcje entropii i odległości informacyjnej, podane w rodzinie rozkładów dyskretnych o policzalnej liczbie wyników, są w tej metryce ciągłe;

W uogólnionym schemacie alokacji znajduje się przybliżona (do równoważności logarytmicznej) asymptotyka dla prawdopodobieństw dużych odchyleń statystyki postaci (0,4) spełniającej odpowiednią postać warunku Cramera;

W uogólnionym schemacie alokacji znajduje się przybliżona (do równoważności logarytmicznej) asymptotyka dla prawdopodobieństw dużych odchyleń symetrycznych statystyk separowalnych, które nie spełniają warunku Cramera;

W klasie kryteriów postaci (0,7) konstruowane jest kryterium o najwyższej wartości wskaźnika kryterium.

W niniejszym artykule rozwiązano szereg pytań dotyczących zachowania prawdopodobieństw dużych odchyleń w uogólnionych schematach alokacji. Uzyskane wyniki mogą być wykorzystane w procesie dydaktycznym w specjalności statystyka matematyczna i teoria informacji, w badaniu procedur statystycznych do analizy ciągów dyskretnych i zostały wykorzystane w /3/,/21/ przy uzasadnianiu bezpieczeństwa jednej klasy systemów informatycznych.

Jednak wiele pytań pozostaje otwartych. Autor ograniczył się do rozważenia centralnej strefy zmienności parametrów n, N uogólnionych schematów rozkładu cząstek n w komórkach N. Jeżeli nośnikiem rozkładu zmiennych losowych generujących uogólniony schemat alokacji (0,2) nie jest zbiór postaci r, r+1, r+2,., to przy dowodzeniu ciągłości informacyjnej funkcji odległości i badaniu prawdopodobieństw przy dużych odchyleniach konieczne jest uwzględnienie struktury arytmetycznej takiego nośnika, który nie został uwzględniony w pracy autora. W celu praktycznego zastosowania kryteriów zbudowanych na podstawie zaproponowanej funkcji z maksymalną wartością wskaźnika wymagane jest zbadanie jego rozkładu zarówno przy hipotezie zerowej, jak i przy alternatywach, w tym zbliżających się. Interesujące jest również przeniesienie opracowanych metod i uogólnienie uzyskanych wyników na inne schematy probabilistyczne, różniące się od uogólnionych schematów alokacji.

Jeżeli - częstości odległości między liczbami wyniku 0 w schemacie dwumianowym z prawdopodobieństwami wyników po> 1 - Po, to można wykazać, że w tym przypadku

PL = kh.t fin = kn) = I (± iki = n) (kl + -, (3.3) v = \ K \ \. Kn \ gdzie

O * = Po ~ 1 (1 ~ Po), v =

Z analizy wzoru na łączny rozkład wielkości μr w uogólnionym schemacie rozkładu, wykazanego w /26/, wynika, że ​​rozkład (3.3), ogólnie rzecz biorąc, nie może być przedstawiony w ogólnym przypadku jako łączny rozkład wielkości μr w dowolnym uogólnionym schemacie rozmieszczenia cząstek przez komórki. Dystrybucja ta jest szczególnym przypadkiem dystrybucji na zbiorze obiektów kombinatorycznych wprowadzonych w / 12 /. Pilnym zadaniem wydaje się przeniesienie na ten przypadek wyników pracy doktorskiej dla uogólnionych schematów układu, o czym była mowa w /52/.

Jeżeli liczba wyników w schemacie selekcji bez zwrotu lub w wielomianowym schemacie alokacji jest większa niż dwa, wówczas łączny rozkład częstotliwości odległości między sąsiadującymi identycznymi wynikami nie może być już reprezentowany w tak prosty sposób. Do tej pory można obliczyć jedynie matematyczne oczekiwanie i wariancję liczby takich odległości /51/.

Spis literatury naukowej rozprawy Kandydat nauk fizycznych i matematycznych Kołodzey, Aleksander Władimirowicz, 2006

1. Bogachev V. I., Kolesnikov A. V. Nieliniowe przekształcenia miar wypukłych i entropia gęstości Radona-Nikodyma // Doklady Akademii Nauk. - 2004 .-- T. 207 .-- 2. - S. 155 - 159.

2. Vidyakin VV, Kołodzei AV Statystyczne wykrywanie ukrytych kanałów w sieciach transmisji danych // Streszczenia. raport II wewn. por. "Systemy informacyjne i technologie IST" 2004 "(Mińsk, 8-10 października 2004 r.) Mińsk: BSU, 2004. - Część 1. - P. 116 - 117.

3. Viktorova II, Chistyakov VP Niektóre uogólnienia kryterium pustych pudeł // Teoria Probab. i jego zastosowanie. - 1966 .-- T. XI. - 2.S 306-313.

4. Zubkov AM Wzory rekurencyjne do obliczania funkcjonałów dyskretnych zmiennych losowych // Przegląd Prikla. i przemysł. mata. 1996. - T. 3. - 4. - S. 567 - 573.

5. G. Zubkov A. M., Mikhailov V. G. Rozkłady graniczne zmiennych losowych związanych z długimi powtórzeniami w sekwencji niezależnych testów // Teoria Probab. i jego zastosowanie. - 1974 .-- T. XIX. 1. - S. 173 - 181.

6. Zubkov AM i Mikhailov VG, „O powtórzeniach s - łańcuchów w sekwencji niezależnych zmiennych”, Teor. Veroyatnost. i jego zastosowanie - 1979. T. XXIV. - 2.- S. 267 - 273.

7. Iwanow VA, Iwczenko GI, Miedwiediew Yu I. Dyskretne problemy w rachunku prawdopodobieństwa // Itogi nauki i techniki. Ser. teoria prawdopodobna., mat. stat., teoria. cybern. T. 23. - M .: VINITI, 1984. S. 3-60.

8. GI Iwczenko, „O momentach rozdzielnych statystyk w uogólnionym schemacie alokacji”, Mat. notatki. 1986 .-- T. 39 .-- 2. - S. 284 - 293.

9. Iwczenko GI i Levin VV, „Asymptotyczna normalność w schemacie wyboru bez powrotu”, Teor Probab. i jego zastosowanie. - 1978.- T. XXIII. 1. - S. 97 - 108.

10. Iwczenko GI, Miedwiediew Yu I. O schemacie urny Markowa-Poya: od 1917 do dnia dzisiejszego // Recenzja Prikl. i przemysł. mata. - 1996.- T. 3. 4.- S. 484-511.

11. Iwczenko GI, Miedwiediew Yu I. Losowe obiekty kombinatoryczne // Raporty Akademii Nauk. 2004 .-- T. 396 .-- 2. - S. 151 - 154.

12. Iwczenko GI i Miedwiediew Yu I. Problemy statystyczne związane z organizacją kontroli nad generowaniem dyskretnych ciągów losowych // Disckretn. mata. - 2000. - T. 12. - 2.P. 3 - 24.

13. Iwczenko GI, Miedwiediew Yu I., Ronzhin AF Oddzielne statystyki i kryteria dobroci dopasowania dla próbek wielomianowych // Trudy Mat. Instytut Akademii Nauk ZSRR. 1986 .-- T. 177 .-- S. 60 - 74.

14. Iwczenko GI i Timonina EE, „O ocenie przy wyborze ze skończonej kolekcji”, Mat. notatki. - 1980 .-- T.28 .-- 4. - S. 623 - 633.

15. Kołodzei AV, „Twierdzenie o prawdopodobieństwach dużych odchyleń dla rozdzielnych statystyk, które nie spełniają warunku Cramera”, Diskretn. mata. 2005 .-- T. 17. - 2. - S. 87 - 94.

16. Kołodzei, AV, Entropia rozkładów dyskretnych i prawdopodobieństwa dużych odchyleń funkcji od wypełnienia komórek w uogólnionych schematach alokacji, Obozreniye Prikl. i przemysł. mata. - 2005. - T. 12. 2. - S. 248 - 252.

17. Kolodzei A. V. Kryteria statystyczne wykrywania tajnych kanałów na podstawie zmiany kolejności wiadomości // Prace badawcze „Przeprosiny”: Raport / FSTEC RF, kierownik A. V. Knyazev. Faktura 7 płyta wiórowa. - M., 2004 .-- S. 96 - 128.

18. Kolodzei A. V., Ronzhin A. F O niektórych statystykach związanych ze sprawdzaniem jednorodności losowych sekwencji dyskretnych // Praca badawcza „Rozwój matematycznych problemów kryptografii” N 4 2004 .: Raport / AK RF, - M., 2004 .. .

19. Kolchin AV, „Twierdzenia graniczne dla uogólnionego schematu alokacji”, Diskretn. mata. 2003. - T. 15. - 4. - S. 148 - 157.

20. Kolchin VF, „Jedna klasa twierdzeń granicznych dla rozkładów warunkowych”, Lit. mata. sob. - 1968. - T. 8. - 1. - S. 111 - 126.

21. Kolchin V. F. Wykresy losowe. 2. wyd. - M .: FIZMATLIT, 2004 .-- 256s.

22. Kolchin V. F. Losowe mapowania. - M.: Nauka, 1984.-- 208p.

23. Kolchin VF, Sevast'yanov BA, Chistyakov VP Przydziały losowe. Moskwa: Nauka, 1976 .-- 223p.

24. G. Kramer, Uspekhi Mat. Nauki. - 1944. - ty. 10. - S. 166 - 178.

25. Kulback S. Teoria informacji i statystyka. - M.: Nauka, 1967 .-- 408s.

26. Yu I. Miedwiediew, „Niektóre twierdzenia o asymptotycznym rozkładzie statystyki chi-kwadrat”, Dokl. Akademia Nauk ZSRR. - 1970 .-- T. 192,5 .-- S. 997 - 989.

27. Yu I Miedwiediew Statystyka podzielna w schemacie wielomianowym I; II. // Teoria prawdopodobna. i jej nrimen. - 1977. - T. 22. - 1. - S. 3 - 17; 1977.T. 22 .-- 3. - S. 623 - 631.

28. Michajłow VG Rozkłady graniczne zmiennych losowych związanych z wielokrotnymi długimi powtórzeniami w sekwencji niezależnych testów // Teoria Probab. i jego zastosowanie. - 1974.T 19. - 1. - S. 182 - 187.

29. Michajłow WG Centralne twierdzenie graniczne dotyczące liczby niekompletnych długich powtórzeń // Teoria Probab. i jego zastosowanie. - 1975. - T. 20. 4. - S. 880 - 884.

30. Michajłow, VG i Shoitov, AM, Strukturalna równoważność s - Łańcuchy w losowych sekwencjach dyskretnych, Disckretn. mata. 2003 .-- T. 15, - 4. - S. 7 - 34.

31. Nagaev A.V. Całkowe twierdzenia graniczne uwzględniające prawdopodobieństwa dużych odchyleń. I. // Teoria prawdopodobieństwa. i jego zastosowanie. -1969. T. 14. 1. - S. 51 - 63.

32. Petrov VV Sumy niezależnych zmiennych losowych. - M.: Nauka, 1972,416p.

33. Prochorow Yu V. Twierdzenia graniczne dla sum wektorów losowych, których wymiar dąży do nieskończoności // Teoria Probab. i jego zastosowanie. 1990 .-- T. 35 .-- 4. - S. 751 - 753.

34. Ronzhin A.F. Kryteria dla uogólnionych schematów rozmieszczania cząstek // Probab teoretyczny. i jego zastosowanie. - 1988 .-- T. 33 .-- 1. - S. 94 - 104.

35. Ronzhin A.F. Twierdzenie o prawdopodobieństwach dużych odchyleń dla statystyki separowalnej i jej statystyczne zastosowanie // Mat. notatki. 1984 .-- T. 36 .-- 4. - S. 610 - 615.

36. Sanov IN, „O prawdopodobieństwach dużych odchyleń zmiennych losowych”, Mat. sob. 1957 .-- T. 42 .-- 1 (84). - S. I - 44.

37. Seneta E. Poprawnie zmieniające się funkcje. Moskwa: Nauka, 1985 .-- 144p.

38. Timashev AN, „Wielowymiarowe integralne twierdzenie o dużych odchyleniach w równie prawdopodobnym schemacie alokacji”, Disckreta, Mat. - 1992. T. 4. - 4. - S. 74 - 81.

39. Timashev, AN, Wielowymiarowe lokalne twierdzenie o dużym odchyleniu w schemacie alokacji o porównywalnym prawdopodobieństwie, Diskretn. mata. - 1990.T. 2. - 2. - S. 143 - 149.

40. Fedoryuk M.V. Metoda podania. Moskwa: Nauka, 1977,368s.

41. Feller V. Wprowadzenie do rachunku prawdopodobieństwa i jego zastosowań. T. 2. - M .: Mir, 1984.738s.

42. Shannon K. Matematyczna teoria komunikacji // Prace nad teorią informacji i cybernetyką: Per. z angielskiego / M., IL, 1963, s. 243 - 332.

43. Conrad K. Rozkład prawdopodobieństwa i maksymalna entropia // http://www.math.uconn.edu/~kconrad/blurbs/entropypost.pdf

44. Hoeffding W. Asymptotycznie optymalne testy rozkładu wielomianowego // Ann. Matematyka. Statystyk. 1965. - T. 36. - C. 369 - 408.

45. Inglot T ,. Rallenberg W. C. M., Ledwina T. Zanikające wady i asymptotyczna względna efektywność // Ann. Statystyk. - 2000. - T. 28. - C. 215 238.

46. ​​​​Jurdas C., Pecaric J., Roki R., Sarapa N., O nierówności dla entropii rozkładu prawdopodobieństwa // Matematyka. Nierówne. i zał. - 2001. T. 4. - 2. - C. 209 - 214. (RZhMat. - 2005. - 05.07-13B.16).

47. Kolodzey A. V., Ronzhin A. F., Testy dobroci dopasowania dla losowych obiektów kombinatorycznych // Tez. raport wewn. por. Współczesne problemy i nowe trendy w teorii prawdopodobieństwa, (Czerniowce, 19 - 26 czerwca 2005) - Kijów: Instytut Matematyki, 2005. Część 1.P. 122.

48. Kullback S. i Leibler R. A. O informacji i wystarczalności // Ann. Matematyka. Statystyk. 1951. - T. 22. - S. 79 - 86.

49. Quine M. P., Robinson J. Efektywność testów chi-kwadrat i iloraz wiarygodności testów dopasowania // Ann. Statystyk. 1985. - T. 13. - 2. - C. 727 -742.

Informujemy, że powyższe teksty naukowe są zamieszczone w celach informacyjnych i uzyskane w drodze rozpoznania oryginalnych tekstów prac dyplomowych (OCR). W związku z tym mogą zawierać błędy związane z niedoskonałością algorytmów rozpoznawania. Takich błędów nie ma w dostarczanych przez nas plikach PDF rozpraw i abstraktów.

Odżywianie