Formula matematičkog očekivanja. Diskretne slučajne varijable

Formula matematičkog očekivanja.  Diskretne slučajne varijable
Formula matematičkog očekivanja. Diskretne slučajne varijable

- broj dječaka među 10 novorođenčadi.

Sasvim je jasno da se taj broj ne zna unaprijed, a u sljedećih deset rođene djece može biti:

Ili dečki - jedan i jedini od navedenih opcija.

I, kako biste ostali u formi, malo tjelesnog odgoja:

- daljina skoka u dalj (u nekim jedinicama).

Ni majstor sporta to ne može predvidjeti :)

Međutim, koje su vaše hipoteze?

2) Kontinuirana slučajna varijabla - uzima svi numeričke vrijednosti iz nekog konačnog ili beskonačnog raspona.

Bilješka : u obrazovnoj literaturi popularne su kratice DSV i NSV

Prvo, analizirajmo diskretnu slučajnu varijablu, a zatim - stalan.

Zakon distribucije diskretne slučajne varijable

- Ovo sukladnosti između mogućih vrijednosti ove veličine i njihovih vjerojatnosti. Najčešće je zakon napisan u tablici:

Pojam je prilično uobičajen red distribucija, ali u nekim situacijama zvuči dvosmisleno, pa ću se zato pridržavati "zakona".

A sada vrlo važna točka : budući da je slučajna varijabla nužno prihvatit će jedna od vrijednosti, zatim se oblikuju odgovarajući događaji puna grupa a zbroj vjerojatnosti njihovog pojavljivanja jednak je jedan:

ili, ako je napisano presavijeno:

Tako, na primjer, ima zakon raspodjele vjerojatnosti bodova bačenih na kockicu sljedeći pogled:

Bez komentara.

Možda ste pod dojmom da diskretna slučajna varijabla može poprimiti samo "dobre" cjelobrojne vrijednosti. Razbijmo iluziju - oni mogu biti bilo što:

Primjer 1

Neke igre imaju sljedeći zakon o raspodjeli isplata:

...vjerojatno već dugo sanjate o takvim zadacima :) Da vam otkrijem jednu tajnu - i ja. Pogotovo nakon završetka radova na teorija polja.

Odluka: budući da slučajna varijabla može uzeti samo jednu od tri vrijednosti, formiraju se odgovarajući događaji puna grupa , što znači da je zbroj njihovih vjerojatnosti jednak jedan:

Razotkrivamo "partizana":

– dakle, vjerojatnost dobitka konvencionalnih jedinica je 0,4.

Kontrola: što trebate biti sigurni.

Odgovor:

Nije rijetkost kada zakon o distribuciji treba samostalno sastaviti. Za ovu upotrebu klasična definicija vjerojatnosti, teoremi množenja / zbrajanja za vjerojatnosti događaja i drugi čips tervera:

Primjer 2

U kutiji se nalazi 50 srećki, od kojih je 12 dobitnih, a 2 od njih osvajaju po 1000 rubalja, a ostale - po 100 rubalja. Sastavite zakon o raspodjeli nasumična varijabla– iznos dobitka ako se jedan listić izvuče nasumično iz kutije.

Odluka: kao što ste primijetili, uobičajeno je postaviti vrijednosti slučajne varijable uzlaznim redoslijedom. Stoga počinjemo s najmanjim dobicima, odnosno rubalja.

Ukupno takvih ulaznica ima 50 - 12 = 38, a prema klasična definicija:
je vjerojatnost da slučajno izvučeni listić neće pobijediti.

Ostali slučajevi su jednostavni. Vjerojatnost dobitka rubalja je:

Provjera: - a ovo je posebno ugodan trenutak takvih zadataka!

Odgovor: zakon o potrebnoj raspodjeli isplata:

Sljedeći zadatak za neovisna odluka:

Primjer 3

Vjerojatnost da će strijelac pogoditi metu je . Napravite zakon raspodjele za slučajnu varijablu - broj pogodaka nakon 2 hica.

... znala sam da ti nedostaje :) Sjećamo se teoremi množenja i zbrajanja. Rješenje i odgovor na kraju lekcije.

Zakon distribucije u potpunosti opisuje slučajnu varijablu, no u praksi je korisno (a ponekad i korisnije) znati samo dio nje. numeričke karakteristike .

Matematičko očekivanje diskretne slučajne varijable

razgovarajući prostim jezikom, Ovo prosječna očekivana vrijednost s ponovljenim testiranjem. Neka slučajna varijabla uzima vrijednosti s vjerojatnostima odnosno. Tada je matematičko očekivanje ove slučajne varijable jednako zbroj proizvoda sve njegove vrijednosti prema odgovarajućim vjerojatnostima:

ili u presavijenom obliku:

Izračunajmo, na primjer, matematičko očekivanje slučajne varijable - broj bodova ispuštenih na kocki:

Sada se prisjetimo naše hipotetske igre:

Postavlja se pitanje: je li uopće isplativo igrati ovu igru? ... tko ima kakve dojmove? Dakle, ne možete reći "na ruku"! Ali na ovo se pitanje lako može odgovoriti izračunavanjem matematičkog očekivanja, u biti - prosječne težine vjerojatnosti pobjede:

Dakle, matematičko očekivanje ove igre gubljenje.

Ne vjerujte dojmovima – vjerujte brojevima!

Da, ovdje možete pobijediti 10 ili čak 20-30 puta zaredom, ali dugoročno ćemo neminovno biti upropašteni. I ne bih ti savjetovao da igraš takve igrice :) Pa, možda samo Za zabavu.

Iz svega navedenog proizlazi da matematičko očekivanje NIJE SLUČAJNA vrijednost.

Kreativni zadatak za neovisno istraživanje:

Primjer 4

G. X igra europski rulet prema sljedećem sustavu: stalno kladi 100 rubalja na crveno. Sastavite zakon raspodjele slučajne varijable – njezinu isplatu. Izračunajte matematičko očekivanje dobitaka i zaokružite ga na kopejke. Koliko prosjek gubi li igrač za svakih sto oklada?

Referenca : Europski rulet sadrži 18 crvenih, 18 crnih i 1 zeleni sektor ("nula"). U slučaju ispadanja "crvene" igraču se plaća dvostruka oklada, inače ide u prihod kasina

Postoje mnogi drugi sustavi ruleta za koje možete izraditi vlastite tablice vjerojatnosti. Ali to je slučaj kada nam ne trebaju nikakvi zakoni o raspodjeli i tablice, jer je sigurno utvrđeno da će matematička očekivanja igrača biti potpuno ista. Samo promjene od sustava do sustava

Sljedeće najvažnije svojstvo slučajne varijable nakon matematičkog očekivanja je njena varijanca, definirana kao srednji kvadrat odstupanja od srednje vrijednosti:

Ako se do tada označi, varijanca VX bit će očekivana vrijednost. Ovo je karakteristika "raspršenosti" X distribucije.

Kao jednostavan primjer računajući varijansu, pretpostavimo da smo upravo dobili ponudu koju ne možemo odbiti: netko nam je dao dva certifikata za sudjelovanje u istoj lutriji. Organizatori lutrije prodaju 100 listića svaki tjedan, sudjelujući u zasebnom izvlačenju. Jedna od tih ulaznica odabire se u izvlačenju kroz jedinstveni slučajni postupak - svaka karta ima jednake šanse da bude odabrana - a vlasnik te sretne karte dobiva sto milijuna dolara. Preostalih 99 vlasnika srećki ne osvajaju ništa.

Poklon možemo iskoristiti na dva načina: ili kupiti dva listića u istoj lutriji ili po jednu za sudjelovanje u dvije različite lutrije. Koja je najbolja strategija? Pokušajmo analizirati. Da bismo to učinili, označavamo slučajnim varijablama koje predstavljaju veličinu našeg dobitka na prvom i drugom listiću. Očekivana vrijednost u milijunima je

a isto vrijedi i za očekivane vrijednosti su aditivne, tako da će naša prosječna ukupna isplata biti

bez obzira na usvojenu strategiju.

Međutim, čini se da se te dvije strategije razlikuju. Idemo dalje od očekivanih vrijednosti i proučimo cjelokupnu distribuciju vjerojatnosti

Ako kupimo dva listića u istoj lutriji, imamo 98% šanse da ne dobijemo ništa i 2% šanse da dobijemo 100 milijuna. Ako kupimo ulaznice za različite izvlačenja, tada će brojke biti sljedeće: 98,01% - šansa da ništa ne osvojimo, što je nešto više nego prije; 0,01% - šansa za osvajanje 200 milijuna, također malo više nego što je bilo prije; a šansa za osvajanje 100 milijuna sada je 1,98%. Dakle, u drugom slučaju, raspodjela veličine je nešto više raspršena; prosjek, 100 milijuna dolara, nešto je manje vjerojatan, dok su ekstremi vjerojatniji.

Upravo je ovaj koncept raspršenosti slučajne varijable namijenjen da odražava varijancu. Širenje mjerimo kroz kvadrat odstupanja slučajne varijable od njezina matematičkog očekivanja. Dakle, u slučaju 1, varijanca će biti

u slučaju 2, varijanca je

Kao što smo očekivali, potonja vrijednost je nešto veća, budući da je distribucija u slučaju 2 nešto raspršenija.

Kada radimo s varijacijama, sve je na kvadrat, tako da rezultat mogu biti prilično veliki brojevi. (Množitelj je jedan bilijun, to bi trebalo biti impresivno

čak i igrači navikli na visoke uloge.) Korijen od disperzije. Rezultirajući broj naziva se standardna devijacija i obično se označava grčkim slovom a:

Standardne devijacije za naše dvije strategije lutrije su . Na neki način, druga je opcija rizičnija oko 71.247 dolara.

Kako varijanca pomaže u odabiru strategije? Nije čisto. Strategija s većom varijansom je rizičnija; ali što je bolje za naš novčanik - rizik ili sigurna igra? Dajte nam priliku kupiti ne dvije karte, već svih sto. Tada bismo mogli jamčiti dobitak u jednoj lutriji (a varijanca bi bila nula); ili možete igrati u stotinu različitih izvlačenja, ne dobivajući ništa s vjerojatnošću, ali s šansom koja nije jednaka nuli da dobijete do dolara. Odabir jedne od ovih alternativa izvan je okvira ove knjige; sve što ovdje možemo učiniti je objasniti kako napraviti izračune.

Zapravo, postoji lakši način za izračunavanje varijance nego izravno korištenje definicije (8.13). (Postoje svi razlozi za sumnju u neku skrivenu matematiku; inače, zašto bi se varijansa u primjerima lutrije pokazala kao cjelobrojni višestruk) Imamo

jer je konstanta; stoga,

"Disperzija je srednja vrijednost kvadrata minus kvadrat srednje vrijednosti"

Na primjer, u zadatku lutrije srednja vrijednost je ili Oduzimanje (kvadrata srednje vrijednosti) daje rezultate koje smo već ranije dobili na teži način.

Međutim, ima ih još više jednostavna formula, primjenjiv kada izračunavamo za nezavisne X i Y. Imamo

budući da, kao što znamo, za nezavisne slučajne varijable, dakle,

"Varijanca zbroja neovisnih slučajnih varijabli jednaka je zbroju njihovih varijanci" Tako je, na primjer, varijanca iznosa koji se može dobiti na jednoj lutriji jednaka

Stoga će varijanca ukupnog dobitka za dvije srećke u dvije različite (nezavisne) lutrije biti

Varijanca zbroja bodova bačenih na dvije kocke može se dobiti pomoću iste formule, budući da postoji zbroj dviju neovisnih slučajnih varijable. Imamo

za ispravnu kocku; dakle, u slučaju pomaknutog centra mase

dakle, ako je središte mase obje kocke pomaknuto. Imajte na umu da je u potonjem slučaju varijanca veća, iako je potrebno u prosjeku 7 češće nego u slučaju običnih kockica. Ako nam je cilj baciti više sretnih sedmica, onda varijanca nije najbolji pokazatelj uspjeha.

U redu, ustanovili smo kako izračunati varijancu. Ali još nismo dali odgovor na pitanje zašto je potrebno izračunati varijancu. Svi to rade, ali zašto? Glavni razlog je Čebiševljeva nejednakost koja kaže važno vlasništvo disperzija:

(Ova se nejednakost razlikuje od Čebiševljevih nejednakosti za zbrojeve, na koje smo se susreli u poglavlju 2.) Kvalitativno, (8.17) kaže da slučajna varijabla X rijetko uzima vrijednosti daleko od svoje srednje vrijednosti ako je njena varijanca VX mala. Dokaz

radnja je izuzetno jednostavna. Stvarno,

dijeljenje po dovršava dokaz.

Ako matematičko očekivanje označimo kroz a i standardnu ​​devijaciju - kroz a i zamijenimo u (8.17) s onda se uvjet pretvara u dakle, dobivamo iz (8.17)

Dakle, X će ležati unutar - puta standardne devijacije svoje srednje vrijednosti, osim u slučajevima gdje vjerojatnost ne prelazi Slučajna vrijednost će ležati unutar 2a od najmanje 75% pokušaja; u rasponu od do - najmanje za 99%. To su slučajevi Čebiševljeve nejednakosti.

Ako bacite nekoliko puta kockice, tada je ukupan rezultat u svim bacanjima gotovo uvijek, za velika će biti blizu. Razlog tome je sljedeći:

Stoga, iz Čebiševe nejednakosti dobivamo da će zbroj točaka ležati između

za najmanje 99% svih bacanja ispravnih kockica. Na primjer, ukupno milijun bacanja s vjerojatnošću većom od 99% bit će između 6,976 milijuna i 7,024 milijuna.

U općem slučaju, neka je X bilo koja slučajna varijabla na prostoru vjerojatnosti P koja ima konačno matematičko očekivanje i konačnu standardnu ​​devijaciju a. Tada možemo uvesti u razmatranje prostor vjerojatnosti Pp, čiji su elementarni događaji -sekvencije gdje je svaki , a vjerojatnost je definirana kao

Ako sada definiramo slučajne varijable formulom

zatim vrijednost

bit će zbroj neovisnih slučajnih varijabli, što odgovara procesu zbrajanja neovisnih realizacija veličine X na P. Matematičko očekivanje će biti jednako i standardna devijacija - ; dakle, srednja vrijednost realizacije,

nalazit će se u rasponu od do najmanje 99% vremenskog razdoblja. Drugim riječima, ako odaberemo dovoljno velik broj, tada će aritmetička sredina neovisnih pokušaja gotovo uvijek biti vrlo blizu očekivanoj vrijednosti (U udžbenicima teorije vjerojatnosti dokazuje se još jači teorem, koji se naziva jaki zakon velikih brojevi; ali također nam je potrebna jednostavna posljedica Čebiševljeve nejednakosti, koju smo upravo iznijeli.)

Ponekad ne poznajemo karakteristike prostora vjerojatnosti, ali moramo procijeniti matematičko očekivanje slučajne varijable X ponovnim promatranjem njezine vrijednosti. (Na primjer, mogli bismo htjeti srednju siječanjsku podnevnu temperaturu u San Franciscu; ili bismo mogli znati očekivani životni vijek na kojem bi agenti osiguranja trebali temeljiti svoje izračune.) Ako imamo na raspolaganju neovisna empirijska zapažanja, možemo pretpostaviti da pravo matematičko očekivanje približno je jednako

Također možete procijeniti odstupanje pomoću formule

Gledajući ovu formulu, moglo bi se pomisliti da u njoj postoji tipografska pogreška; čini se da bi trebalo biti kao u (8.19), budući da je prava vrijednost varijance određena u (8.15) kroz očekivane vrijednosti. Međutim, promjena ovdje do omogućuje nam bolju procjenu, budući da iz definicije (8.20) slijedi da

Evo dokaza:

(U ovom izračunu oslanjamo se na neovisnost opažanja kada zamijenimo s )

U praksi, za procjenu rezultata eksperimenta sa slučajnom varijablom X, obično se izračuna empirijska srednja vrijednost i empirijska standardna devijacija, a zatim se zapiše odgovor u obliku Ovdje su, na primjer, rezultati bacanja kockice, navodno ispravno.

Kao što je već poznato, zakon raspodjele u potpunosti karakterizira slučajnu varijablu. Međutim, zakon distribucije je često nepoznat i čovjek se mora ograničiti na manje informacije. Ponekad je još isplativije koristiti brojeve koji ukupno opisuju slučajnu varijablu; takvi brojevi se nazivaju numeričke karakteristike slučajne varijable. Matematičko očekivanje jedna je od važnih numeričkih karakteristika.

Matematičko očekivanje, kao što će biti prikazano u nastavku, približno je jednako prosječnoj vrijednosti slučajne varijable. Za rješavanje mnogih problema dovoljno je poznavati matematičko očekivanje. Na primjer, ako je poznato da je matematičko očekivanje broja poena koje je postigao prvi strijelac veće od onog drugog, tada prvi strijelac u prosjeku zabija više poena od drugog, pa stoga šutira bolje od drugi. Iako matematičko očekivanje daje mnogo manje informacija o slučajnoj varijabli od zakona njezine distribucije, ali za rješavanje problema poput ovog i mnogih drugih, dovoljno je poznavanje matematičkog očekivanja.

§ 2. Matematičko očekivanje diskretne slučajne varijable

matematičko očekivanje Diskretna slučajna varijabla naziva se zbroj proizvoda svih njezinih mogućih vrijednosti i njihovih vjerojatnosti.

Neka je slučajna varijabla x može uzeti samo vrijednosti x 1 , X 2 , ..., x P , čije su vjerojatnosti odnosno jednake R 1 , R 2 , . . ., R P . Zatim matematičko očekivanje M(x) nasumična varijabla x definirana je jednakošću

M(x) = x 1 R 1 + x 2 R 2 + … + x n str n .

Ako je diskretna slučajna varijabla x tada poprima prebrojiv skup mogućih vrijednosti

M(x)=

štoviše, matematičko očekivanje postoji ako se niz na desnoj strani jednakosti apsolutno konvergira.

Komentar. Iz definicije proizlazi da je matematičko očekivanje diskretne slučajne varijable neslučajna (konstantna) varijabla. Preporučujemo da zapamtite ovu izjavu jer se kasnije više puta koristi. Kasnije će se pokazati da je matematičko očekivanje kontinuirane slučajne varijable također konstantna vrijednost.

Primjer 1 Pronađite matematičko očekivanje slučajne varijable x, poznavajući zakon njegove raspodjele:

Odluka. Željeno matematičko očekivanje jednako je zbroju proizvoda svih mogućih vrijednosti slučajne varijable i njihovih vjerojatnosti:

M(x)= 3* 0, 1+ 5* 0, 6+ 2* 0, 3= 3, 9.

Primjer 2 Pronađite matematičko očekivanje broja pojavljivanja događaja ALI u jednom pokusu, ako je vjerojatnost događaja ALI jednako je R.

Odluka. Slučajna vrijednost x - broj pojavljivanja događaja ALI u jednom testu - može uzeti samo dvije vrijednosti: x 1 = 1 (događaj ALI dogodilo) s vjerojatnošću R i x 2 = 0 (događaj ALI nije došlo) s vjerojatnošću q= 1 -R.Željeno matematičko očekivanje

M(x)= 1* str+ 0* q= str

Tako, matematičko očekivanje broja pojavljivanja događaja u jednom pokusu jednako je vjerojatnosti tog događaja. Ovaj rezultat će se koristiti u nastavku.

§ 3. Vjerojatnostno značenje matematičkog očekivanja

Neka se proizvede P testovi u kojima je slučajna varijabla x prihvaćeno t 1 puta vrijednost x 1 , t 2 puta vrijednost x 2 ,...,m k puta vrijednost x k , i t 1 + t 2 + …+t do = str. Zatim zbroj svih uzetih vrijednosti x, jednako je

x 1 t 1 + x 2 t 2 + ... + x do t do .

Pronađite aritmetičku sredinu svih vrijednosti prihvaćenih kao slučajna varijabla, za koju pronađeni zbroj podijelimo s ukupnim brojem pokušaja:

= (x 1 t 1 + x 2 t 2 + ... + x do t do)/P,

= x 1 (m 1 / n) + x 2 (m 2 / n) + ... + x do (t do /P). (*)

Primjećujući da odnos m 1 / n- relativna frekvencija W 1 vrijednosti x 1 , m 2 / n - relativna frekvencija W 2 vrijednosti x 2 itd., relaciju (*) zapisujemo na sljedeći način:

=x 1 W 1 + x 2 W 2 + .. . + x do W k . (**)

Pretpostavimo da je broj pokusa dovoljno velik. Tada je relativna učestalost približno jednaka vjerojatnosti pojave događaja (to će se dokazati u poglavlju IX, § 6):

W 1 str 1 , W 2 str 2 , …, W k str k .

Zamjenom relativnih frekvencija u odnosu (**) s odgovarajućim vjerojatnostima, dobivamo

x 1 str 1 + x 2 R 2 + … + x do R do .

Desna strana ove približne jednakosti je M(x). Tako,

M(x).

Vjerojatnostno značenje dobivenog rezultata je sljedeće: matematičko očekivanje je približno jednako(što je točniji to je veći broj pokušaja) aritmetička sredina promatranih vrijednosti slučajne varijable.

Napomena 1. Lako je vidjeti da je matematičko očekivanje veće od najmanje i manje od najveće moguće vrijednosti. Drugim riječima, na brojevnoj osi moguće vrijednosti nalaze se lijevo i desno od očekivane vrijednosti. U tom smislu, očekivanje karakterizira mjesto distribucije i stoga se često naziva distribucijski centar.

Ovaj izraz je posuđen iz mehanike: ako mase R 1 , R 2 , ..., R P smještene u točkama s apscisama x 1 , x 2 , ..., x n, i
zatim apscisa težišta

x c =
.

S obzirom na to
=
M (x) i
dobivamo M(x)= x s .

Dakle, matematičko očekivanje je apscisa težišta sustava materijalne točke, čije su apscise jednake mogućim vrijednostima slučajne varijable, a mase jednake njihovim vjerojatnostima.

Napomena 2. Podrijetlo pojma "očekivanje" vezuje se za početno razdoblje nastanka teorije vjerojatnosti (XVI-XVII stoljeće), kada je njezin opseg bio ograničen na kockanje. Igrača je zanimala prosječna vrijednost očekivane isplate ili, drugim riječima, matematičko očekivanje isplate.

Očekivana vrijednost

Disperzija kontinuirana slučajna varijabla X, čije moguće vrijednosti pripadaju cijeloj osi Ox, određena je jednakošću:

Zadatak usluge. Online kalkulator dizajniran za rješavanje problema u kojima bilo gustoća raspodjele f(x) ili funkcija distribucije F(x) (vidi primjer). Obično je u takvim zadacima potrebno pronaći matematičko očekivanje, standardna devijacija, crtanje funkcija f(x) i F(x).

Uputa. Odaberite vrstu ulaznih podataka: distribucijska gustoća f(x) ili funkcija distribucije F(x) .

S obzirom na gustoću distribucije f(x) S obzirom na funkciju distribucije F(x)

Gustoća distribucije f(x) je data:

Zadana je funkcija distribucije F(x):

Kontinuirana slučajna varijabla definirana je gustoćom vjerojatnosti
(Rayleighov zakon distribucije – koristi se u radiotehnici). Pronađite M(x) , D(x) .

Slučajna varijabla X se zove stalan , ako je njegova funkcija distribucije F(X)=P(X< x) непрерывна и имеет производную.
Funkcija distribucije kontinuirane slučajne varijable koristi se za izračunavanje vjerojatnosti da slučajna varijable padne u zadani interval:
P(α< X < β)=F(β) - F(α)
štoviše, za kontinuiranu slučajnu varijablu nije važno jesu li njezine granice uključene u ovaj interval ili ne:
P(α< X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Gustoća distribucije kontinuirana slučajna varijabla naziva se funkcija
f(x)=F'(x) , derivacija funkcije distribucije.

Svojstva gustoće distribucije

1. Gustoća distribucije slučajne varijable nije negativna (f(x) ≥ 0) za sve vrijednosti x.
2. Uvjet normalizacije:

Geometrijsko značenje uvjeta normalizacije: površina ispod krivulje gustoće raspodjele jednaka je jedan.
3. Vjerojatnost pogađanja slučajne varijable X u intervalu od α do β može se izračunati po formuli

Geometrijski, vjerojatnost da kontinuirana slučajna varijabla X padne u interval (α, β) jednaka je površini krivolinijski trapez ispod krivulje gustoće distribucije na temelju ovog intervala.
4. Funkcija distribucije izražava se u smislu gustoće kako slijedi:

Vrijednost gustoće distribucije u točki x nije jednaka vjerojatnosti uzimanja ove vrijednosti; za kontinuiranu slučajnu varijablu možemo govoriti samo o vjerojatnosti pada u zadani interval. neka bude)