Obliczanie matematycznych oczekiwań i dyspersji. Dyskretne zmienne losowe

Obliczanie matematycznych oczekiwań i dyspersji.  Dyskretne zmienne losowe
Obliczanie matematycznych oczekiwań i dyspersji. Dyskretne zmienne losowe

Zmienne losowe, oprócz praw dystrybucji, można również opisać cechy liczbowe .

matematyczne oczekiwanie M(x) zmiennej losowej nazywamy jej wartością średnią.

Wartość oczekiwana dyskretna zmienna losowa jest obliczana według wzoru

gdzie wartości zmiennej losowej, p i- ich prawdopodobieństwa.

Rozważ właściwości oczekiwań matematycznych:

1. Matematyczne oczekiwanie co do stałej jest równe samej stałej

2. Jeżeli zmienna losowa zostanie pomnożona przez określoną liczbę k, to matematyczne oczekiwanie zostanie pomnożone przez tę samą liczbę

M (kx) = kM (x)

3. Matematyczne oczekiwanie sumy zmiennych losowych jest równe sumie ich matematycznych oczekiwań

M (x 1 + x 2 + ... + x n) \u003d M (x 1) + M (x 2) + ... + M (x n)

4. M (x 1 - x 2) \u003d M (x 1) - M (x 2)

5. Dla niezależnych zmiennych losowych x 1 , x 2 , … x n matematyczne oczekiwanie produktu jest równe iloczynowi ich matematycznych oczekiwań

M (x 1, x 2, ... x n) \u003d M (x 1) M (x 2) ... M (x n)

6. M (x - M (x)) \u003d M (x) - M (M (x)) \u003d M (x) - M (x) \u003d 0

Obliczmy matematyczne oczekiwanie dla zmiennej losowej z przykładu 11.

M(x) == .

Przykład 12. Niech zmienne losowe x 1 , x 2 dadzą odpowiednio prawa rozkładu:

x 1 Tabela 2

x 2 Tabela 3

Oblicz M (x 1) i M (x 2)

M (x 1) \u003d (- 0,1) 0,1 + (- 0,01) 0,2 + 0 0,4 + 0,01 0,2 + 0,1 0,1 \u003d 0

M (x 2) \u003d (- 20) 0,3 + (- 10) 0,1 + 0 0,2 + 10 0,1 + 20 0,3 \u003d 0

Oczekiwania matematyczne obu zmiennych losowych są takie same – są równe zeru. Jednak ich dystrybucja jest inna. Jeżeli wartości x 1 różnią się niewiele od ich matematycznych oczekiwań, to wartości x 2 różnią się w dużym stopniu od ich matematycznych oczekiwań, a prawdopodobieństwa takich odchyleń nie są małe. Przykłady te pokazują, że nie da się na podstawie wartości średniej określić, jakie odchylenia od niej mają miejsce zarówno w mniejszym, jak i w duża strona. A zatem przy tych samych średnich rocznych opadach w dwóch miejscowościach nie można powiedzieć, że są one równie korzystne dla prac rolniczych. Podobnie pod względem średniej wynagrodzenie nie można oceniać środek ciężkości wysoko i nisko opłacani pracownicy. W związku z tym wprowadzono charakterystykę liczbową - dyspersja D(x) , który charakteryzuje stopień odchylenia zmiennej losowej od jej wartości średniej:

D(x) = M(x - M(x)) 2 . (2)

Dyspersja to matematyczne oczekiwanie kwadratu odchylenia zmiennej losowej od oczekiwań matematycznych. Dla dyskretnej zmiennej losowej wariancję oblicza się według wzoru:

D(x)= = (3)

Z definicji wariancji wynika, że ​​D(x) 0.

Właściwości dyspersji:

1. Dyspersja stałej wynosi zero

2. Jeżeli zmienna losowa jest pomnożona przez pewną liczbę k, to wariancję mnoży się przez kwadrat tej liczby

D (kx) = k 2 D (x)

3. D (x) \u003d M (x 2) - M 2 (x)

4. Dla par niezależnych zmiennych losowych x 1 , x 2 , … x n wariancja sumy jest równa sumie wariancji.

D (x 1 + x 2 + ... + x n) = D (x 1) + D (x 2) + ... + D (x n)

Obliczmy wariancję dla zmiennej losowej z przykładu 11.

Oczekiwanie matematyczne M (x) = 1. Zatem zgodnie ze wzorem (3) mamy:

D (x) = (0 – 1) 2 1/4 + (1 – 1) 2 1/2 + (2 – 1) 2 1/4 =1 1/4 +1 1/4= 1/2

Zauważ, że łatwiej jest obliczyć wariancję, jeśli użyjemy właściwości 3:

D (x) \u003d M (x 2) - M 2 (x).

Obliczmy wariancje dla zmiennych losowych x 1 , x 2 z przykładu 12 za pomocą tego wzoru. Oczekiwania matematyczne obu zmiennych losowych są równe zeru.

D (x 1) \u003d 0,01 0,1 + 0,0001 0,2 + 0,0001 0,2 + 0,01 0,1 \u003d 0,001 + 0,00002 + 0,00002 + 0,001 \u003d 0,00204

D (x 2) \u003d (-20) 2 0,3 + (-10) 2 0,1 + 10 2 0,1 + 20 2 0,3 \u003d 240 +20 \u003d 260

Jak bliższe znaczenie wariancji do zera, tym mniejszy rozrzut zmiennej losowej w stosunku do wartości średniej.

Wartość nazywa się odchylenie standardowe. Losowa moda x typ dyskretny Md to wartość zmiennej losowej, która odpowiada największemu prawdopodobieństwu.

Losowa moda x ciągły typ Md, jest liczbą rzeczywistą, zdefiniowaną jako maksymalny punkt gęstości rozkładu prawdopodobieństwa f(x).

Mediana zmiennej losowej x typ ciągły Mn jest liczbą rzeczywistą spełniającą równanie

Zmienna losowa nazywa zmienny, który w wyniku każdego testu przyjmuje jedną nieznaną wcześniej wartość, w zależności od przyczyn losowych. Zmienne losowe są oznaczane dużymi literami łacińskimi: $X,\ Y,\ Z,\ \dots $ Według typu zmienne losowe mogą być oddzielny oraz ciągły.

Dyskretna zmienna losowa- jest to taka zmienna losowa, której wartości mogą być tylko policzalne, czyli albo skończone, albo policzalne. Policzalność oznacza, że ​​można wyliczyć wartości zmiennej losowej.

Przykład 1 . Podajmy przykłady dyskretnych zmiennych losowych:

a) liczba trafień w tarczę strzałami $n$, tutaj możliwe wartości to $0,\ 1,\ \kropki,\ n$.

b) liczba herbów, które wypadły podczas rzucania monetą, tutaj możliwe wartości to $0,\ 1,\ \kropki,\ n$.

c) liczba statków, które przybyły na pokład (policzalny zestaw wartości).

d) liczbę połączeń przychodzących do centrali (przeliczalny zbiór wartości).

1. Prawo rozkładu prawdopodobieństwa dyskretnej zmiennej losowej.

Dyskretna zmienna losowa $X$ może przyjmować wartości $x_1,\dots ,\ x_n$ z prawdopodobieństwami $p\left(x_1\right),\ \dots ,\ p\left(x_n\right)$. Korespondencja między tymi wartościami a ich prawdopodobieństwami nazywa się prawo rozkładu dyskretnej zmiennej losowej. Z reguły korespondencja ta jest określana za pomocą tabeli, w której pierwszym wierszu wskazane są wartości $x_1,\dots ,\x_n$, a w drugim wierszu prawdopodobieństwa odpowiadające tym wartościom to $ p_1,\kropki,\ p_n$.

$\begin(tablica)(|c|c|)
\hlinia
X_i & x_1 & x_2 & \kropki & x_n \\
\hlinia
p_i & p_1 & p_2 & \kropki & p_n \\
\hlinia
\end(tablica)$

Przykład 2 . Niech zmienna losowa $X$ będzie liczbą punktów wyrzuconych podczas rzutu kostką. Taka zmienna losowa $X$ może przyjmować następujące wartości 1,\ 2,\ 3,\ 4,\ 5,\ 6$. Prawdopodobieństwo wszystkich tych wartości wynosi 1 $/6 $. Następnie prawo rozkładu prawdopodobieństwa dla zmiennej losowej $X$:

$\begin(tablica)(|c|c|)
\hlinia
1 & 2 & 3 & 4 & 5 & 6 \\
\hlinia

\hlinia
\end(tablica)$

Komentarz. Ponieważ w prawie rozkładu dyskretnej zmiennej losowej $X$ zdarzenia $1,\ 2,\ \kropki ,\ 6$ mają postać pełna grupa zdarzeń, to suma prawdopodobieństw powinna być równa jeden, czyli $\sum(p_i)=1$.

2. Matematyczne oczekiwanie dyskretnej zmiennej losowej.

Matematyczne oczekiwanie zmiennej losowej określa jego „centralną” wartość. Dla dyskretnej zmiennej losowej oczekiwanie matematyczne oblicza się jako sumę iloczynów wartości $x_1,\dots ,\ x_n$ i prawdopodobieństw $p_1,\dots ,\ p_n$ odpowiadających tym wartościom, tj.: $M\left(X\right)=\suma ^n_(i=1)(p_ix_i)$. W literaturze angielskiej używana jest inna notacja $E\left(X\right)$.

Właściwości oczekiwań$M\lewo(X\prawo)$:

  1. $M\left(X\right)$ jest pomiędzy najmniejszym a najwyższe wartości zmienna losowa $X$.
  2. Matematyczne oczekiwanie stałej jest równe samej stałej, tj. $M\lewo(C\prawo)=C$.
  3. Stała może być wzięta ze znaku oczekiwania: $M\left(CX\right)=CM\left(X\right)$.
  4. Matematyczne oczekiwanie sumy zmiennych losowych jest równe sumie ich matematycznych oczekiwań: $M\left(X+Y\right)=M\left(X\right)+M\left(Y\right)$.
  5. Matematyczne oczekiwanie iloczynu niezależnych zmiennych losowych jest równe iloczynowi ich matematycznych oczekiwań: $M\left(XY\right)=M\left(X\right)M\left(Y\right)$.

Przykład 3 . Znajdźmy matematyczne oczekiwanie zmiennej losowej $X$ z przykładu $2$.

$$M\left(X\right)=\sum^n_(i=1)(p_ix_i)=1\cdot ((1)\over (6))+2\cdot ((1)\over (6) )+3\cdot ((1)\nad (6))+4\cdot ((1)\nad (6))+5\cdot ((1)\nad (6))+6\cdot ((1 )\ponad (6))=3.5.$$

Możemy zauważyć, że $M\left(X\right)$ znajduje się pomiędzy najmniejszą (1$) a największą (6$) wartością zmiennej losowej $X$.

Przykład 4 . Wiadomo, że matematyczne oczekiwanie zmiennej losowej $X$ jest równe $M\left(X\right)=2$. Znajdź matematyczne oczekiwanie zmiennej losowej $3X+5$.

Korzystając z powyższych właściwości, otrzymujemy $M\left(3X+5\right)=M\left(3X\right)+M\left(5\right)=3M\left(X\right)+5=3\ cdot 2 +5=11$.

Przykład 5 . Wiadomo, że matematyczne oczekiwanie zmiennej losowej $X$ jest równe $M\left(X\right)=4$. Znajdź matematyczne oczekiwanie zmiennej losowej $2X-9$.

Korzystając z powyższych właściwości, otrzymujemy $M\left(2X-9\right)=M\left(2X\right)-M\left(9\right)=2M\left(X\right)-9=2\ cdot 4 -9=-1$.

3. Dyspersja dyskretnej zmiennej losowej.

Ewentualne wartości zmiennych losowych o równych oczekiwaniach matematycznych mogą się różnie rozrzucać wokół swoich wartości średnich. Na przykład w dwóch grupach studenckich GPA dla egzaminu z rachunku prawdopodobieństwa wyszło 4, ale w jednej grupie wszyscy okazali się dobrymi uczniami, aw drugiej tylko 3 i znakomici. W związku z tym istnieje potrzeba takiej charakterystyki liczbowej zmiennej losowej, która pokazywałaby rozkład wartości zmiennej losowej wokół jej matematycznego oczekiwania. Ta cecha to dyspersja.

Dyspersja dyskretnej zmiennej losowej$X$ to:

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2).\ $$

W literaturze angielskiej używa się notacji $V\left(X\right),\ Var\left(X\right)$. Bardzo często wariancję $D\left(X\right)$ oblicza się ze wzoru $D\left(X\right)=\sum^n_(i=1)(p_ix^2_i)-(\left(M\ left(X \right)\right))^2$.

Właściwości dyspersji$D\lewo(X\prawo)$:

  1. Dyspersja jest zawsze większa lub równa zero, tj. $D\lewo(X\prawo)\ge 0$.
  2. Dyspersja od stałej jest równa zeru, tj. $D\lewo(C\prawo)=0$.
  3. Ze znaku dyspersji można wyprowadzić czynnik stały pod warunkiem, że jest on podniesiony do kwadratu, tj. $D\left(CX\right)=C^2D\left(X\right)$.
  4. Wariancja sumy niezależnych zmiennych losowych jest równa sumie ich wariancji, tj. $D\left(X+Y\right)=D\left(X\right)+D\left(Y\right)$.
  5. Wariancja różnicy niezależnych zmiennych losowych jest równa sumie ich wariancji, tj. $D\left(X-Y\right)=D\left(X\right)+D\left(Y\right)$.

Przykład 6 . Obliczmy wariancję zmiennej losowej $X$ z przykładu $2$.

$$D\left(X\right)=\sum^n_(i=1)(p_i(\left(x_i-M\left(X\right)\right))^2)=((1)\over (6))\cdot (\left(1-3,5\right))^2+((1)\over (6))\cdot (\left(2-3,5\right))^2+ \dots +((1)\over (6))\cdot (\left(6-3,5\right))^2=((35)\over (12))\ok 2.92.$$

Przykład 7 . Wiadomo, że wariancja zmiennej losowej $X$ jest równa $D\left(X\right)=2$. Znajdź wariancję zmiennej losowej $4X+1$.

Korzystając z powyższych właściwości, znajdujemy $D\left(4X+1\right)=D\left(4X\right)+D\left(1\right)=4^2D\left(X\right)+0= 16D\ left(X\right)=16\cdot 2=32$.

Przykład 8 . Wiadomo, że wariancja $X$ jest równa $D\left(X\right)=3$. Znajdź wariancję zmiennej losowej $3-2X$.

Korzystając z powyższych właściwości, znajdujemy $D\left(3-2X\right)=D\left(3\right)+D\left(2X\right)=0+2^2D\left(X\right)= 4D\ lewo(X\prawo)=4\cdot 3=12$.

4. Dystrybucja zmiennej losowej dyskretnej.

Sposób reprezentacji dyskretnej zmiennej losowej w postaci szeregu rozkładów nie jest jedyny, a co najważniejsze, nie jest uniwersalny, ponieważ ciągłej zmiennej losowej nie można określić za pomocą szeregu rozkładów. Istnieje inny sposób przedstawienia zmiennej losowej - funkcja dystrybucji.

funkcja dystrybucyjna zmienna losowa $X$ to funkcja $F\left(x\right)$, która określa prawdopodobieństwo, że zmienna losowa $X$ przyjmie wartość mniejszą niż pewna stała wartość $x$, czyli $F\left(x\ prawo)$ )=P\lewo(X< x\right)$

Właściwości funkcji dystrybucji:

  1. $0\le F\lewo(x\prawo)\le 1$.
  2. Prawdopodobieństwo, że zmienna losowa $X$ przyjmie wartości z przedziału $\left(\alpha ;\ \beta \right)$ jest równe różnicy między wartościami funkcji rozkładu na końcach tego przedziału : $P\lewo(\alfa< X < \beta \right)=F\left(\beta \right)-F\left(\alpha \right)$
  3. $F\left(x\right)$ - niemalejący.
  4. $(\mathop(lim)_(x\to -\infty ) F\left(x\right)=0\ ),\ (\mathop(lim)_(x\to +\infty ) F\left(x \prawo)=1\ )$.

Przykład 9 . Znajdźmy funkcję rozkładu $F\left(x\right)$ dla prawa rozkładu dyskretnej zmiennej losowej $X$ z przykładu $2$.

$\begin(tablica)(|c|c|)
\hlinia
1 & 2 & 3 & 4 & 5 & 6 \\
\hlinia
1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 \\
\hlinia
\end(tablica)$

Jeżeli $x\le 1$, to oczywiście $F\left(x\right)=0$ (w tym $x=1$ $F\left(1\right)=P\left(X< 1\right)=0$).

Jeśli $1< x\le 2$, то $F\left(x\right)=P\left(X=1\right)=1/6$.

Jeśli $2< x\le 3$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)=1/6+1/6=1/3$.

Jeśli $3< x\le 4$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)=1/6+1/6+1/6=1/2$.

Jeśli $4< x\le 5$, то $F\left(X\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)=1/6+1/6+1/6+1/6=2/3$.

Jeśli $5< x\le 6$, то $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right)+P\left(X=4\right)+P\left(X=5\right)=1/6+1/6+1/6+1/6+1/6=5/6$.

Jeśli $x > 6$ to $F\left(x\right)=P\left(X=1\right)+P\left(X=2\right)+P\left(X=3\right) + P\left(X=4\right)+P\left(X=5\right)+P\left(X=6\right)=1/6+1/6+1/6+1/6+ 1 /6+1/6=1$.

Więc $F(x)=\left\(\begin(macierz)
0,\ w\ x\le 1,\\
1/6, w \ 1< x\le 2,\\
1/3,\ w\ 2< x\le 3,\\
1/2, przy \ 3< x\le 4,\\
2/3,\ w\ 4< x\le 5,\\
5/6, \ w \ 4< x\le 5,\\
1,\ dla \ x > 6.
\end(macierz)\right.$

Oczekiwanie matematyczne to definicja…

Mata czeka jedno z najważniejszych pojęć w statystyce matematycznej i rachunku prawdopodobieństwa, charakteryzujące rozkład wartości lub prawdopodobieństwa zmienna losowa. Zwykle wyrażany jako średnia ważona wszystkich możliwych parametrów zmiennej losowej. Szeroko stosowany w wykonywaniu analiza techniczna, Badania seria liczb, badanie procesów ciągłych i długich. To ma znaczenie przy ocenie ryzyka, prognozowaniu wskaźników cen podczas handlu rynki finansowe, służy do opracowywania strategii i metod taktyki gry w teoria hazardu.

Szach mat czeka- Tenśrednia wartość zmiennej losowej, rozkład prawdopodobieństwa zmienna losowa jest rozważana w teorii prawdopodobieństwa.

Mata czeka miara średniej wartości zmiennej losowej w teorii prawdopodobieństwa. Matematyczne oczekiwanie zmiennej losowej x oznaczone M(x).

Oczekiwania matematyczne (średnia populacji) to

Mata czeka

Mata czeka w teorii prawdopodobieństwa średnia ważona wszystkich możliwych wartości, jakie może przyjąć ta zmienna losowa.

Mata czeka suma iloczynów wszystkich możliwych wartości zmiennej losowej przez prawdopodobieństwa tych wartości.

Oczekiwania matematyczne (średnia populacji) to

Mata czekaśrednia korzyść z danej decyzji, pod warunkiem, że taką decyzję można rozpatrywać w ramach teorii wielkich liczb i dużej odległości.

Mata czeka w teorii hazardu jest to kwota wygranych, które spekulant może średnio zarobić lub stracić za każdy zakład. W języku hazardu spekulanci jest to czasami nazywane „korzyścią” spekulant” (jeśli jest dodatnia dla spekulanta) lub „przewaga kasyna” (jeśli jest ujemna dla spekulanta).

Oczekiwania matematyczne (średnia populacji) to


Wir verwenden Cookies für die beste Präsentation unserer Website. Wenn Sie diese Strona internetowa weiterhin nutzen, stimmen Sie dem zu. OK

Każda pojedyncza wartość jest całkowicie określona przez jej funkcję dystrybucji. Również do rozwiązania praktycznych problemów wystarczy znajomość kilku charakterystyk liczbowych, dzięki którym możliwe jest przedstawienie w zwięzłej formie głównych cech zmiennej losowej.

Te ilości są przede wszystkim wartość oczekiwana oraz dyspersja .

Wartość oczekiwana- średnia wartość zmiennej losowej w teorii prawdopodobieństwa. Oznaczony jako .

przez większość w prosty sposób matematyczne oczekiwanie zmiennej losowej X(w), znajdują się jako całkaLebesgue w odniesieniu do miary prawdopodobieństwa R Inicjał przestrzeń prawdopodobieństwa

Możesz również znaleźć matematyczne oczekiwanie wartości jako Całka Lebesgue'a od X przez rozkład prawdopodobieństwa R X wielkie ilości X:

gdzie jest zbiór wszystkich możliwych wartości X.

Matematyczne oczekiwanie funkcji od zmiennej losowej X jest poprzez dystrybucję R X. na przykład, jeśli X- zmienna losowa z wartościami w i f(x)- jednoznaczny Borelfunkcjonować X , następnie:

Jeśli F(x)- funkcja dystrybucyjna X, wtedy można przedstawić matematyczne oczekiwanie całkaLebesgue - Stieltjes (lub Riemann - Stieltjes):

podczas gdy integrowalność X w jakim sensie ( * ) odpowiada skończoności całki

W konkretne przypadki, jeśli X ma rozkład dyskretny o prawdopodobnych wartościach x k, k=1, 2,. , a prawdopodobieństwa , to

jeśli X ma rozkład absolutnie ciągły z gęstością prawdopodobieństwa p(x), następnie

w tym przypadku istnienie matematycznego oczekiwania jest równoważne absolutnej zbieżności odpowiedniego szeregu lub całki.

Własności matematycznego oczekiwania zmiennej losowej.

  • Matematyczne oczekiwanie stałej wartości jest równe tej wartości:

C- stała;

  • M=CM[X]
  • Matematyczne oczekiwanie sumy losowo wybranych wartości jest równe sumie ich matematycznych oczekiwań:

  • Matematyczne oczekiwanie iloczynu niezależnych zmiennych losowych = iloczyn ich matematycznych oczekiwań:

M=M[X]+M[R]

jeśli X oraz Y niezależny.

jeśli szereg jest zbieżny:

Algorytm obliczania oczekiwań matematycznych.

Własności dyskretnych zmiennych losowych: wszystkie ich wartości można przenumerować liczby naturalne; przyrównaj każdą wartość z niezerowym prawdopodobieństwem.

1. Pomnóż kolejno pary: x ja na Liczba Pi.

2. Dodaj produkt z każdej pary x ja p ja.

Na przykład, dla n = 4 :

Rozkład funkcji dyskretnej zmiennej losowej stopniowo wzrasta gwałtownie w tych punktach, których prawdopodobieństwo ma znak dodatni.

Przykład: Znajdź oczekiwanie matematyczne według wzoru.

Matematyczne oczekiwanie zmiennej losowej X jest wartością średnią.

1. M(C) = C

2. M(KX) = CM(X), gdzie C= const

3. M(X ± Y) = M(X) ± M(Y)

4. Jeśli zmienne losowe X oraz Y niezależny, więc M(XY) = M(X) M(Y)

Dyspersja

Wariancję zmiennej losowej X nazywamy

D(X) = S(x – M(X)) 2 p = M(X 2 ) - M 2 (X).

Dyspersja jest miarą odchylenia wartości zmiennej losowej od jej wartości średniej.

1. D(C) = 0

2. D(X + C) = D(X)

3. D(CX) = C 2 D(X), gdzie C= const

4. Dla niezależnych zmiennych losowych

D(X ± Y) = D(X) + D(Y)

5. D(X ± Y) = D(X) + D(Y) ± 2Cov(x, y)

Pierwiastek kwadratowy od wariancji zmiennej losowej X nazywamy odchyleniem standardowym .

@Zadanie 3: Niech zmienna losowa X przyjmuje tylko dwie wartości (0 lub 1) z prawdopodobieństwami q, p, gdzie p + q = 1. Znajdź matematyczne oczekiwanie i wariancję.

Decyzja:

M(X) = 1 p + 0 q = p; D(X) = (1 – p) 2 p + (0 - p) 2 q = pq.

@Zadanie 4: Matematyczne oczekiwanie i wariancja zmiennej losowej X są równe 8. Znajdź matematyczne oczekiwanie i wariancję zmiennych losowych: a) X-4; b) 3X-4.

Rozwiązanie: M(X - 4) = M(X) - 4 = 8 - 4 = 4; D(X-4) = D(X) = 8; M(3X - 4) = 3M(X) - 4 = 20; D(3X - 4) = 9D(X) = 72.

@Zadanie 5: Zbiór rodzin ma następujący rozkład w zależności od liczby dzieci:

x ja x 1 x2
Liczba Pi 0,1 p2 0,4 0,35

Definiować x 1, x2 oraz p2 jeśli wiadomo, że M(X) = 2; D(X) = 0,9.

Rozwiązanie: Prawdopodobieństwo p 2 jest równe p 2 = 1 – 0,1 – 0,4 – 0,35 = 0,15. Nieznane x znajdują się z równań: M(X) = x 1 0,1 + x 2 0,15 + 2 0,4 + 3 0,35 = 2; D(X) = 0,1 + 0,15 + 4 0,4 ​​+ 9 0,35 – 4 = 0,9. x 1 = 0; x2 = 1.

Populacja ogólna i próba. Oszacowania parametrów

Selektywna obserwacja

Obserwację statystyczną można zorganizować w sposób ciągły, a nie ciągły. Obserwacja ciągła polega na badaniu wszystkich jednostek badanej populacji (populacji ogólnej). Populacja jest zbiorem fizycznych lub osoby prawne, którą badacz bada zgodnie ze swoim zadaniem. Często jest to nieopłacalne, a czasem wręcz niemożliwe. W związku z tym badana jest tylko część populacji ogólnej - operat losowania .

Wyniki uzyskane z populacji próby można rozszerzyć na populację ogólną, jeśli przestrzegane są następujące zasady:



1. Populację próby należy ustalić losowo.

2. Liczba jednostek pobierania próbek musi być wystarczająca.

3. Musi być dostarczony reprezentatywność ( reprezentatywność) próbki. Reprezentatywna próba to mniejszy, ale dokładny model populacji, którą ma reprezentować.

Typy próbek

W praktyce zastosuj następujące typy próbki:

a) właściwy losowy, b) mechaniczny, c) typowy, d) seryjny, e) kombinowany.

Próbkowanie losowe

Na właściwa próbka losowa jednostki losowania są wybierane losowo, na przykład przez losowanie lub generator liczb losowych.

Próbki są powtarzane i nie powtarzane. Podczas ponownego próbkowania próbkowana jednostka jest zwracana i przechowywana równe szanse ponownie włączyć do próbki. W niepowtarzającym się losowaniu jednostka populacji, która jest uwzględniona w próbie, nie będzie brać udziału w próbie w przyszłości.

Błędy nieodłącznie związane z obserwacją próbki, wynikające z faktu, że próbka nie odtwarza całkowicie populacji ogólnej, nazywa się błędy standardowe . Reprezentują one różnicę średniokwadratową między wartościami wskaźników uzyskanych z próby a odpowiadającymi im wartościami wskaźników populacji ogólnej.

Wzory obliczeniowe Standardowy błąd w przypadku losowego ponownego wyboru: , a w przypadku losowego, niepowtarzającego się wyboru: , gdzie S 2 jest wariancją populacji próby, n/N - udział próbki, n, N- liczba jednostek w próbie i populacji ogólnej. Na n = N błąd standardowy m = 0.

Próbkowanie mechaniczne

Na mechaniczne pobieranie próbek populacja ogólna jest podzielona na równe przedziały, a z każdego przedziału losowo wybierana jest jedna jednostka.

Na przykład przy częstotliwości próbkowania 2% co 50 jednostka jest wybierana z listy populacji.

Błąd standardowy próbkowania mechanicznego definiuje się jako błąd próbkowania losowego i niepowtarzającego się.

Typowa próbka

Na typowa próbka populacja ogólna jest podzielona na jednorodne typowe grupy, a następnie jednostki są losowo wybierane z każdej grupy.

W przypadku niejednorodnej populacji ogólnej stosuje się próbkę typową. Typowa próbka daje dokładniejsze wyniki, ponieważ zapewnia reprezentatywność.

Na przykład nauczyciele, jako populacja ogólna, są podzieleni na grupy według następujących cech: płeć, staż pracy, kwalifikacje, wykształcenie, miasto i szkoły wiejskie itp.

Typowe błędy standardowe próbkowania są definiowane jako samo-losowe błędy próbkowania, z tą tylko różnicą, że S2 zastępuje się średnią z wariancji wewnątrzgrupowych.

seryjne pobieranie próbek

Na seryjne pobieranie próbek populację ogólną dzieli się na odrębne grupy (serie), następnie losowo wybrane grupy poddaje się ciągłej obserwacji.

Standardowe błędy próbkowania seryjnego są definiowane jako błędy losowe próbkowania, z tą tylko różnicą, że S2 zastępuje się średnią wariancji międzygrupowych.

Próbkowanie łączone

Próbkowanie łączone jest kombinacją dwóch lub więcej typów próbek.

Oszacowanie punktowe

Ostateczny cel obserwacja próbkowania polega na znalezieniu cech populacji ogólnej. Ponieważ nie można tego zrobić bezpośrednio, charakterystyka populacji próby zostaje rozszerzona na populację ogólną.

Wykazano fundamentalną możliwość wyznaczenia średniej arytmetycznej populacji ogólnej z danych próby średniej Twierdzenie Czebyszewa. Z nieograniczonym powiększeniem n prawdopodobieństwo, że różnica między średnią z próby a średnią ogólną będzie arbitralnie mała, wynosi 1.

Oznacza to, że charakterystyka populacji ogólnej z dokładnością . Taka ocena nazywa się punkt .

Szacowanie interwału

Podstawą oszacowania przedziału jest centralne twierdzenie graniczne.

Szacowanie interwału pozwala odpowiedzieć na pytanie: w jakim przedziale iz jakim prawdopodobieństwem jest nieznana, pożądana wartość parametru populacji ogólnej?

Zwykle określany jako poziom ufności p = 1 a, który będzie w przedziale D< < + D, где D = t cr m > 0 błąd krańcowy próbki, a - poziom istotności (prawdopodobieństwo, że nierówność będzie fałszywa), t cr - Krytyczna wartość, który zależy od wartości n i Z małą próbką n< 30 t cr jest podawana przy użyciu krytycznej wartości rozkładu t-Studenta dla testu dwustronnego z n– 1 stopień swobody o poziomie istotności a ( t cr(n- 1, a) znajduje się w tabeli „Wartości krytyczne rozkładu t-Studenta”, załącznik 2). Dla n > 30, t cr jest kwantylem rozkładu normalnego ( t cr znajduje się z tabeli wartości funkcji Laplace'a F(t) = (1 a)/2 jako argument). Przy p = 0,954 wartość krytyczna t cr= 2 przy p = 0,997 wartość krytyczna t cr= 3. Oznacza to, że błąd krańcowy jest zwykle 2-3 razy większy niż błąd standardowy.

Istota metody doboru próby polega więc na tym, że na podstawie danych statystycznych pewnej niewielkiej części populacji ogólnej można znaleźć przedział, w którym z prawdopodobieństwem ufności p znaleziono pożądaną cechę populacji ogólnej (średnia liczba pracowników, średni wynik, średni plon, odchylenie standardowe itp.).

@ Zadanie 1. Aby określić szybkość rozliczeń z wierzycielami przedsiębiorstw korporacyjnych w Bank komercyjny przeprowadzono losową próbę 100 dokumentów płatniczych, według której średni termin przekazywanie i odbieranie pieniędzy wyniosło 22 dni (=22) przy odchyleniu standardowym 6 dni (S=6). Z prawdopodobieństwem p= 0,954 określić błąd krańcowy średniej próby i przedział ufności średni czas trwania rozliczenia przedsiębiorstw tej korporacji.

Rozwiązanie: Błąd krańcowy średniej próbki według(1)jest równe D= 2· 0,6 = 1,2, a przedział ufności jest zdefiniowany jako (22 - 1,2; 22 + 1,2), tj. (20,8; 23,2).

§6.5 Korelacja i regresja