legyen X valós értékű véletlen változó, és legyen legyen x független és azonos eloszlású példányainak végtelen sorozata. legyen ennek a sorozatnak az empirikus átlagai. A valószínűségelmélet alapvető tétele a nagy számok törvénye, amely mind gyenge, mind erős formában jön létre:
a nagy számok gyenge törvénye. Tegyük fel, hogy az első pillanat x véges. Akkor konvergál a valószínűsége, hogy , így minden .
a nagy számok erős törvénye. Tegyük fel, hogy az első pillanat x véges. Ezután a majdnem biztosan – re konvergál, így .
(ha valaki megerősíti az első pillanat feltételezését a második pillanat végességére , akkor természetesen pontosabb állításunk van, mint a nagy számok (gyenge) törvénye, nevezetesen a központi határ tétel, de ezt a tételt itt nem tárgyalom. Még több hipotézissel az X-en hasonlóan pontosabb változatai vannak a nagy számok erős törvényének, például a Chernoff-egyenlőtlenségnek, amelyet itt ismét nem fogok megvitatni.)
a gyenge törvényt könnyű bizonyítani, de az erős törvény (ami természetesen magában foglalja a gyenge törvényt, Egoroff tétele szerint) finomabb, és valójában ennek a törvénynek a bizonyítása (feltételezve az első pillanat végességét) általában csak a fejlett diplomás szövegekben jelenik meg. Ezért úgy gondoltam, hogy itt bemutatom mindkét törvény bizonyítékát, amely a moment módszer és a csonkolás szokásos technikáival folytatódik. A hangsúly ebben a kiállítás lesz a motiváció és módszerek helyett rövidsége és ereje eredmények; az irodalomban léteznek olyan erős törvények bizonyítékai, amelyeket egy oldal vagy annál kisebb méretre tömörítettek, de itt nem ez a célom.
— a moment módszer —
a moment módszer egy véletlen változó farok valószínűségének (azaz annak a valószínűségének, hogy az átlagától messze ingadozik) szabályozására törekszik pillanatok, különösen a nulladik, első vagy második pillanat segítségével. Ennek a módszernek az az oka, hogy az első néhány pillanat gyakran meglehetősen pontosan kiszámítható. Az első pillanat módszer általában Markov egyenlőtlenségét alkalmazza
(1)
(ami a pontonkénti egyenlőtlenség elvárásainak figyelembevételével következik ), míg a második moment módszer a Csebisev-egyenlőtlenség valamilyen változatát alkalmazza, például
(2)
(vegye figyelembe, hogy a (2) csak (1) alkalmazható a véletlen változóra küszöbérték ).
Általánosságban elmondható, hogy az első pillanat kiszámításához általában a várakozás linearitását alkalmazzák
,
míg a második pillanat kiszámításához meg kell érteni a kovarianciákat is (amelyek különösen egyszerűek, ha páros függetlenséget feltételezünk), az olyan identitásoknak köszönhetően, mint például
vagy a normalizált változat
. (3)
a magasabb pillanatok elvileg pontosabb információkat adhatnak, de gyakran erősebb feltételezéseket igényelnek a vizsgált tárgyakról, például a közös függetlenségről.
itt van az első pillanat módszer alapvető alkalmazása:
Borel-Cantelli lemma. Legyen olyan eseménysorozat, hogy véges. Akkor szinte biztosan, csak véges sok esemény igaz.
bizonyíték. Legyen jelöli az esemény indikátorfüggvényét . Feladatunk megmutatni, hogy szinte biztosan véges. De a várakozás linearitása alapján ennek a véletlen változónak az elvárása , ami hipotézis szerint véges. Markov egyenlőtlenségével (1) arra a következtetésre jutunk, hogy
.
bérbeadás megkapjuk a követelést.
visszatérve a nagy számok törvényéhez, az első pillanat módszer a következő farokkötést adja:
Lemma 1. Ha véges, akkor
.
bizonyíték. A háromszög egyenlőtlenség szerint . A várakozás linearitása alapján a várakozása . Az állítás most Markov egyenlőtlenségéből következik.
a Lemma 1 önmagában nem elég erős ahhoz, hogy a nagy számok törvényét gyenge vagy erős formában bizonyítsa – különösen nem mutat javulást, mivel n nagy lesz–, de hasznos lesz kezelni az egyik hibakifejezést ezekben a bizonyításokban.
erősebb határokat kaphatunk, mint a Lemma 1 – különösen azokat a határokat, amelyek az n – vel javulnak-az X-re vonatkozó erősebb feltételezések rovására.
Lemma 2. Ha véges, akkor
.
bizonyíték. A (3) és a páronkénti függetlenségének kihasználása azt mutatja, hogy a empirikus átlagok varianciája szorozva a az eredeti változó X. az állítás most következik Csebisev-egyenlőtlenség (2).
ellenkező irányban van a nulladik pillanat módszer, ismertebb nevén az Unió kötött
vagy ezzel egyenértékű (a “nulla pillanat ” terminológia magyarázata”)
bármely nem negatív véletlen változóra . Ezt alkalmazva az empirikus eszközökre, megkapjuk a nulladik pillanat farok becslését
. (4)
csakúgy, mint a második pillanatban kötött (Lemma 2) csak akkor hasznos, ha az egyik jól kontroll a második pillanatban (vagy variancia) X, a nulladik pillanatban farok becslés (3) csak akkor hasznos, ha van jó kontroll a nulladik pillanatban , azaz amikor X többnyire nulla.
— csonkolás —
a második pillanatban farok kötött (Lemma 2) már megadja a nagy számok gyenge törvényét abban az esetben, ha X véges második pillanattal rendelkezik (vagy ekvivalensen véges variancia). Általában, ha csak annyit tudunk X-ről, hogy véges az első pillanata, akkor nem vonhatjuk le azt a következtetést, hogy X-nek véges a második pillanata. Azonban el tudunk végezni egy csonkolást
(5)
bármely kívánt n küszöbértéknél, ahol és . Az első kifejezés véges második pillanattal rendelkezik; valóban egyértelműen van
ezért is van véges variancia
. (6)
a második kifejezésnek lehet végtelen második pillanata, de az első pillanata jól szabályozott. Valójában a monoton konvergencia tétel alapján van
. (7)
a háromszög egyenlőtlenség alapján arra a következtetésre jutunk, hogy az első kifejezés várakozása közel van :
. (8)
ezekre az eszközökre van szükségünk a nagy számok gyenge törvényének bizonyításához:
a gyenge törvény bizonyítása. Legyen . Elegendő megmutatni, hogy amikor n kellően nagy a függvényében, hogy valószínűséggel .
tól (7), (8), találunk egy n küszöbértéket (a – től függően) úgy, hogy és . Most az (5) – et használjuk a felosztáshoz
.
a farok megkötésének első pillanatától (Lemma 1) tudjuk, hogy valószínűséggel . A második pillanattól kezdve a farok kötött (Lemma 2) és (6), tudjuk, hogy valószínűséggel ha n kellően nagy az N és . Az állítás következik.
— az erős törvény –
az erős törvény bizonyítható a fenti módszerek egy kicsit tovább tolásával, néhány további trükkövel.
az első trükk az, hogy megfigyeljük, hogy az erős törvény bizonyításához elegendő ezt megtenni a nem negatív véletlen változók esetében. Valójában ez azonnal következik abból az egyszerű tényből,hogy bármely véletlen változó x véges első pillanattal kifejezhető két nem negatív véletlen változó különbségeként véges első pillanatban.
ha X nem negatív, látjuk, hogy az empirikus átlagok nem csökkenhetnek túl gyorsan n-ben. Különösen azt figyeljük meg, hogy
amikor . (9)
ennek a kvazimonotonitásnak köszönhetően meg tudjuk szórni az n halmazát, amelyre be kell bizonyítanunk az erős törvényt. Pontosabban, elegendő a
nagy számok erős törvénye, csökkentett változat megjelenítése. Legyen nem negatív véletlen változó , és legyen egész számok sorozata, amely hézagos abban az értelemben, hogy néhány és minden kellően nagy j. akkor konvergál szinte biztosan .
valóban, ha bizonyítani tudnánk a csökkentett verziót, akkor ezt a verziót a lacunary szekvenciára alkalmazva és a (9) használatával láthatjuk, hogy a empirikus átlaga szinte biztosan nem térhet el multiplikatív hibánál nagyobb mértékben az átlagtól. Beállítás esetén (és ha azt használjuk, hogy a szinte biztos események megszámlálható metszéspontja szinte biztos marad) megkapjuk a teljes erős törvényt.
most, hogy sparsifikáltuk a szekvenciát, gazdaságossá válik a Borel-Cantelli lemma alkalmazása. Valójában a lemma számos alkalmazásával látjuk, hogy elegendő ezt megmutatni
(10)
a véges első Momentum nem-negatív X-jére bármely lacunáris szekvencia és bármely .
ezen a ponton visszamegyünk, és alkalmazzuk azokat a módszereket, amelyek már működtek a gyenge törvény megadására. Nevezetesen az egyes farok valószínűségek becsléséhez , csonkolást hajtunk végre (5) valamilyen küszöbértéknél . Nem azonnal nyilvánvaló, hogy milyen csonkolást kell végrehajtani, ezért azt a szokásos stratégiát alkalmazzuk, hogy a – ot egyelőre nem határozzuk meg, majd ezt a paramétert később optimalizáljuk.
legalább a – ot elég nagyra kell választanunk, hogy . A második pillanattól kezdve a farok becslése (Lemma 2) arra a következtetésre jutunk, hogy egyenlő valószínűséggel . Megpróbálhatjuk egyszerűsíteni ezt a kifejezést a (6) használatával, de ez kissé pazarlónak bizonyul, ezért egyelőre tartsuk ezt. A (6) azonban határozottan azt sugallja, hogy a – t valami hasonlónak akarjuk venni , amit érdemes szem előtt tartani a következőkben.
most nézzük meg a hozzájárulását. Használhatjuk az első pillanat farokbecslését (Lemma 1), de kiderül, hogy az első pillanat túl lassan bomlik j-ben ahhoz, hogy sok haszna legyen (emlékezzünk arra, hogy azt várjuk, hogy olyan legyen, mint a lacunary szekvencia ); a gyökérprobléma itt az, hogy a monoton konvergencia tételből származó bomlás (7) hatástalan (ezt a véges konvergencia elv, de ez kiderül, hogy nagyon gyenge eredmények itt).
de van egy utolsó kártya játszani, amely a nulladik pillanatban módszer farok becslés (4). Mint korábban említettük, ez a kötés általában pocsék – de nagyon jó, ha X többnyire nulla, pontosan ez a helyzet esetén. különösen azt látjuk, hogy nulla valószínűséggel .
mindezt összerakva látjuk, hogy
Összefoglalva ezt a j, azt látjuk, hogy mi lesz tenni, amint kitaláljuk, hogyan kell kiválasztani úgy, hogy
(11)
és
(12)
mindkettő véges. (Mint általában, van egy kompromisszumunk: a nagyobbá tétele megkönnyíti a (12) létrehozását a (11) rovására, és fordítva, ha kisebb lesz.)
a korábbi vita alapján természetes, hogy megpróbálja beállítani a beállítást. Szerencsére ez a választás tisztán működik; a lacunáris jellege biztosítja (alapvetően a geometriai sorozatképletből), hogy pontszerű becslésekkel rendelkezünk
és
(ahol az implikált állandó itt a szekvenciától függ, különös tekintettel a C lacunaritási állandóra). Az állítások (10), (11) ezután a várakozás linearitásának egy utolsó alkalmazásából következnek, megadva a nagy számok erős törvényét.
1.Megjegyzés. A fenti bizonyíték valójában azt mutatja, hogy a nagy számok erős törvénye akkor is fennáll, ha csak a páros függetlenségét feltételezzük, nem pedig a közös függetlenséget.
Megjegyzés 2. Alapvető fontosságú,hogy a valószínűségi változókat “újrahasznosítsuk” az egyik empirikus átlagról a másikra, hogy megkapjuk a döntő quasimonotonicity tulajdonságot (9). Ha ehelyett teljesen független átlagokat vettünk , ahol a mind iid, akkor a nagy számok erős törvénye valójában csak egy első pillanatnyi feltételezéssel bomlik le. (Ellenpélda esetén Vegyünk egy véletlen változót X amely egyenlő valószínűséggel ; ennek a véletlen változónak (alig) van véges első pillanata, de esetén azt látjuk, hogy legalább abszolút állandóval eltér az átlagától, valószínűsége . Mivel az empirikus eszközök a most közösen függetlenek, annak valószínűsége, hogy egyikük jelentősen eltér, most rendkívül közel van az 1-hez (valójában szuper-exponenciálisan közel a – hez), ami az erős törvény teljes kudarcához vezet ebben a környezetben.) Természetesen, ha a figyelmet egy lacunáris szekvenciára korlátozzuk n akkor a fenti bizonyítás független esetben megy keresztül (mivel a Borel-Cantelli lemma érzéketlen erre a függetlenségre). A közös függetlenség további kihasználásával (pl. Chernoff-egyenlőtlenség felhasználásával) megkaphatjuk a független empirikus eszközök erős törvényét is a teljes szekvencia számára n A második pillanat határai alatt.
Megjegyzés 3. Az interpolációelmélet szempontjából a fenti érvet interpolációs érvként tekinthetjük meg, amely becslést (10) hoz létre a becslés (Lemma 2) és a becslés (4) közötti interpolációval.
4.Megjegyzés. A szekvenciát stacionárius folyamatként, és így egy intézkedésmegőrző rendszer speciális eseteként tekinthetjük meg a nagy számok gyenge és erős törvényét, mint az átlagos és a pontszerű ergodikus tételek speciális eseteit (lásd a 9.gyakorlatot a 254A 8. előadásból és a 2. tételt a 254a 9. előadásból).