Formule d'espérance mathématique. Variables aléatoires discrètes

Formule d'espérance mathématique.  Variables aléatoires discrètes
Formule d'espérance mathématique. Variables aléatoires discrètes

– le nombre de garçons sur 10 nouveau-nés.

Il est tout à fait clair que ce nombre n'est pas connu à l'avance, et les dix prochains enfants nés pourraient inclure :

Ou des garçons - seul et l'unique parmi les options répertoriées.

Et, pour garder la forme, un peu d'éducation physique :

– distance de saut en longueur (dans certaines unités).

Même un maître du sport ne peut pas le prédire :)

Cependant, vos hypothèses ?

2) Variable aléatoire continue – accepte Tous valeurs numériques d'un intervalle fini ou infini.

Note : les abréviations DSV et NSV sont populaires dans la littérature pédagogique

Analysons d’abord la variable aléatoire discrète, puis - continu.

Loi de distribution d'une variable aléatoire discrète

- Ce correspondance entre les valeurs possibles de cette quantité et leurs probabilités. Le plus souvent, la loi est écrite dans un tableau :

Le terme est utilisé assez souvent rangée distribution, mais dans certaines situations, cela semble ambigu, et je m'en tiendrai donc à la "loi".

Et maintenant Très point important : puisque la variable aléatoire Nécessairement va accepter une des valeurs, puis les événements correspondants se forment groupe complet et la somme des probabilités de leur apparition est égale à un :

ou, s'il est écrit condensé :

Ainsi, par exemple, la loi de distribution des probabilités des points lancés sur un dé a vue suivante:

Sans commentaires.

Vous avez peut-être l’impression qu’une variable aléatoire discrète ne peut prendre que de « bonnes » valeurs entières. Dissipons l'illusion - ils peuvent être n'importe quoi :

Exemple 1

Certains jeux ont la loi de distribution gagnante suivante :

...vous rêvez probablement de telles tâches depuis longtemps :) Je vais vous confier un secret - moi aussi. Surtout après avoir fini de travailler sur théorie des champs.

Solution: puisqu'une variable aléatoire ne peut prendre qu'une seule valeur parmi trois, les événements correspondants forment groupe complet , ce qui signifie que la somme de leurs probabilités est égale à un :

Dénoncer le « partisan » :

– ainsi, la probabilité de gagner des unités conventionnelles est de 0,4.

Contrôler : c’est de cela qu’il fallait s’assurer.

Répondre:

Il n'est pas rare que vous deviez rédiger vous-même une loi sur la distribution. Pour cela, ils utilisent définition classique de la probabilité, théorèmes de multiplication/addition pour les probabilités d'événements et autres chips Tervera:

Exemple 2

La boîte contient 50 billets de loterie, parmi lesquels 12 sont gagnants, et 2 d'entre eux gagnent 1 000 roubles chacun, et le reste - 100 roubles chacun. Créer une loi de distribution Variable aléatoire– le montant des gains si un ticket est tiré au hasard dans la boîte.

Solution: comme vous l'avez remarqué, les valeurs d'une variable aléatoire sont généralement placées dans Dans l'ordre croissant. Par conséquent, nous commençons par les plus petits gains, à savoir les roubles.

Il y a 50 billets de ce type au total - 12 = 38, et selon définition classique:
– la probabilité qu’un ticket tiré au sort soit perdant.

Dans d'autres cas, tout est simple. La probabilité de gagner des roubles est :

Vérifiez : – et c'est un moment particulièrement agréable de telles tâches !

Répondre: la loi souhaitée de répartition des gains :

Tâche suivante pour décision indépendante:

Exemple 3

La probabilité que le tireur atteigne la cible est de . Établissez une loi de distribution pour une variable aléatoire - le nombre de coups après 2 tirs.

...Je savais qu'il te manquait :) Souvenons-nous théorèmes de multiplication et d'addition. La solution et la réponse se trouvent à la fin de la leçon.

La loi de distribution décrit complètement une variable aléatoire, mais en pratique il peut être utile (et parfois plus utile) de n'en connaître qu'une partie. caractéristiques numériques .

Attente d'une variable aléatoire discrète

Parlant dans un langage simple, Ce valeur moyenne attendue lorsque les tests sont répétés plusieurs fois. Laissez la variable aléatoire prendre des valeurs avec des probabilités respectivement. Alors l’espérance mathématique de cette variable aléatoire est égale à somme de produits toutes ses valeurs aux probabilités correspondantes :

ou effondré :

Calculons, par exemple, l'espérance mathématique d'une variable aléatoire - le nombre de points lancés sur un dé :

Rappelons maintenant notre jeu hypothétique :

La question se pose : est-il rentable de jouer à ce jeu ? ...qui a des impressions ? On ne peut donc pas le dire « à la légère » ! Mais on peut facilement répondre à cette question en calculant l’espérance mathématique, essentiellement : moyenne pondérée par probabilité de gagner :

Ainsi, l'espérance mathématique de ce jeu perdant.

Ne vous fiez pas à vos impressions, faites confiance aux chiffres !

Oui, ici, vous pouvez gagner 10 voire 20 à 30 fois de suite, mais à long terme, une ruine inévitable nous attend. Et je ne vous conseillerais pas de jouer à de tels jeux :) Eh bien, peut-être seulement pour s'amuser.

De tout ce qui précède, il s'ensuit que l'espérance mathématique n'est plus une valeur ALÉATOIRE.

Tâche créative pour une recherche indépendante :

Exemple 4

M. X joue à la roulette européenne selon le système suivant : il mise constamment 100 roubles sur le « rouge ». Élaborez une loi de distribution d'une variable aléatoire - ses gains. Calculez l'espérance mathématique des gains et arrondissez-la au kopeck le plus proche. Combien moyenne Le joueur perd-il pour chaque cent misé ?

Référence : La roulette européenne contient 18 secteurs rouges, 18 noirs et 1 secteur vert (« zéro »). Si un « rouge » apparaît, le joueur est payé le double de la mise, sinon cela va aux revenus du casino.

Il existe de nombreux autres systèmes de roulette pour lesquels vous pouvez créer vos propres tables de probabilités. Mais c’est le cas lorsque nous n’avons besoin d’aucune loi de distribution ni de tables, car il est établi avec certitude que l’espérance mathématique du joueur sera exactement la même. La seule chose qui change d'un système à l'autre est

La propriété la plus importante d'une variable aléatoire après l'espérance mathématique est sa dispersion, définie comme l'écart carré moyen par rapport à la moyenne :

Si elle est notée alors, la variance VX sera la valeur attendue. C'est une caractéristique de la « dispersion » de la distribution de X.

Comme exemple simple Pour calculer l'écart, supposons que nous venons de recevoir une offre que nous ne pouvons pas refuser : quelqu'un nous a donné deux certificats pour participer à une loterie. Les organisateurs de la loterie vendent 100 billets chaque semaine et participent à un tirage séparé. Le tirage au sort sélectionne l'un de ces billets selon un processus aléatoire uniforme - chaque billet a une chance égale d'être sélectionné - et le propriétaire de ce billet chanceux reçoit cent millions de dollars. Les 99 détenteurs de billets de loterie restants ne gagnent rien.

Nous pouvons utiliser le cadeau de deux manières : acheter soit deux billets pour une loterie, soit un pour chacun pour participer à deux loteries différentes. Quelle stratégie est la meilleure ? Essayons de l'analyser. Pour ce faire, désignons par variables aléatoires représentant la taille de nos gains sur le premier et le deuxième tickets. La valeur attendue en millions est

et il en va de même pour les valeurs attendues sont additives, donc notre gain total moyen sera

quelle que soit la stratégie adoptée.

Toutefois, les deux stratégies semblent différentes. Allons au-delà des valeurs attendues et étudions la distribution de probabilité complète

Si nous achetons deux billets à la même loterie, nos chances de ne rien gagner seront de 98 % et de 2 % - les chances de gagner 100 millions. Si nous achetons des billets pour différents tirages, les chiffres seront les suivants : 98,01 % - la chance de ne rien gagner, ce qui est légèrement plus élevé qu'avant ; 0,01 % - chance de gagner 200 millions, également un peu plus qu'avant ; et la chance de gagner 100 millions est désormais de 1,98 %. Ainsi, dans le second cas, la distribution des magnitudes est un peu plus dispersée ; la valeur moyenne, 100 millions de dollars, est légèrement moins probable, tandis que les valeurs extrêmes sont plus probables.

C’est ce concept de propagation d’une variable aléatoire que la dispersion est censée refléter. Nous mesurons la propagation sur le carré de l'écart d'une variable aléatoire par rapport à son espérance mathématique. Ainsi, dans le cas 1, la variance sera

dans le cas 2, la variance est

Comme nous nous y attendions, cette dernière valeur est légèrement plus grande, puisque la distribution dans le cas 2 est un peu plus étalée.

Lorsque nous travaillons avec des variances, tout est au carré, le résultat peut donc être des nombres assez grands. (Le multiplicateur est de mille milliards, ça devrait être impressionnant

même les joueurs habitués aux paris importants.) Pour convertir les valeurs en une échelle originale plus significative, ils extraient souvent Racine carrée de la dispersion. Le nombre obtenu est appelé écart type et est généralement désigné par la lettre grecque a :

Les écarts types de grandeur pour nos deux stratégies de loterie sont . À certains égards, la deuxième option est environ 71 247 $ plus risquée.

Comment la variance aide-t-elle dans le choix d’une stratégie ? Ce n'est pas clair. Une stratégie avec une variance plus élevée est plus risquée ; mais qu'est-ce qui est mieux pour notre portefeuille : le risque ou le jeu en toute sécurité ? Ayons la possibilité d'acheter non pas deux billets, mais cent. Nous pourrions alors garantir de gagner à une loterie (et la variance serait nulle) ; ou vous pourriez jouer à une centaine de tirages différents, sans rien obtenir avec une probabilité, mais avec une chance non nulle de gagner jusqu'à 100 dollars. Choisir l’une de ces alternatives dépasse le cadre de ce livre ; tout ce que nous pouvons faire ici, c'est expliquer comment faire les calculs.

En fait, il existe une manière plus simple de calculer la variance que d’utiliser directement la définition (8.13). (Il y a toutes les raisons de soupçonner ici une sorte de mathématiques cachées ; sinon, pourquoi la variance dans les exemples de loterie se révélerait-elle être un multiple entier ? Nous avons

depuis - constant ; ainsi,

"La variance est la moyenne du carré moins le carré de la moyenne."

Par exemple, dans le problème de la loterie, la valeur moyenne s'avère être ou La soustraction (le carré de la moyenne) donne des résultats que nous avons déjà obtenus plus tôt de manière plus difficile.

Il y a cependant encore plus formule simple, applicable lorsque nous calculons pour X et Y indépendants. Nous avons

puisque, comme nous le savons, pour les variables aléatoires indépendantes, donc,

"La variance de la somme des variables aléatoires indépendantes est égale à la somme de leurs variances." Ainsi, par exemple, la variance du montant pouvant être gagné avec un billet de loterie est égale à

Par conséquent, la dispersion des gains totaux de deux billets de loterie dans deux loteries différentes (indépendantes) sera la valeur de dispersion correspondante pour les billets de loterie indépendants sera

La variance de la somme des points lancés sur deux dés peut être obtenue à l’aide de la même formule, puisqu’il s’agit de la somme de deux variables aléatoires indépendantes. Nous avons

pour le bon cube ; donc, dans le cas d'un centre de masse déplacé

donc, si les deux cubes ont un centre de masse déplacé. Notez que dans ce dernier cas, la variance est plus grande, même si elle prend plus souvent une valeur moyenne de 7 que dans le cas des dés ordinaires. Si notre objectif est d’obtenir plus de sept chanceux, alors la variance n’est pas le meilleur indicateur de succès.

D'accord, nous avons établi comment calculer la variance. Mais nous n'avons pas encore répondu à la question de savoir pourquoi il est nécessaire de calculer la variance. Tout le monde le fait, mais pourquoi ? La raison principale est l'inégalité de Chebyshev qui affirme propriété importanteécarts :

(Cette inégalité diffère des inégalités de Chebyshev pour les sommes que nous avons rencontrées au chapitre 2.) Au niveau qualitatif, (8.17) affirme que la variable aléatoire X prend rarement des valeurs éloignées de sa moyenne si sa variance VX est petite. Preuve

la gestion est extraordinairement simple. Vraiment,

la division par complète la preuve.

Si nous désignons l'espérance mathématique par a et l'écart type par a et remplaçons dans (8.17) par alors la condition se transforme en donc, nous obtenons de (8.17)

Ainsi, X se situera dans - fois l'écart type de sa moyenne, sauf dans les cas où la probabilité ne dépasse pas. La variable aléatoire se situera dans 2a d'au moins 75 % des essais ; allant de à - au moins pour 99%. Ce sont des cas d'inégalité de Chebyshev.

Si vous lancez quelques dés une fois, la somme totale des points de tous les lancers sera presque toujours proche de. La raison en est la suivante : la variance des lancers indépendants sera La variance signifie l'écart type de tout.

Par conséquent, à partir de l’inégalité de Chebyshev, nous obtenons que la somme des points se situera entre

au moins pour 99 % de tous les lancers de dés corrects. Par exemple, le résultat d'un million de lancers avec une probabilité de plus de 99 % sera compris entre 6,976 millions et 7,024 millions.

En général, soit X toute variable aléatoire sur l'espace de probabilité Π ayant une espérance mathématique finie et un écart type fini une. On peut alors introduire en considération l'espace de probabilité Pn, dont les événements élémentaires sont des -séquences où each , et la probabilité est définie comme

Si l'on définit maintenant les variables aléatoires par la formule

alors la valeur

sera la somme de variables aléatoires indépendantes, qui correspond au processus de sommation des réalisations indépendantes de la valeur X sur P. L'espérance mathématique sera égale à et l'écart type - ; donc la valeur moyenne des réalisations,

variera de à dans au moins 99 % de la période. En d'autres termes, si vous en choisissez une assez grande, la moyenne arithmétique des tests indépendants sera presque toujours très proche de la valeur attendue (dans les manuels de théorie des probabilités, un théorème encore plus fort est prouvé, appelé la loi forte des grands nombres ; mais pour nous le simple corollaire de l'inégalité de Chebyshev, que nous venons de supprimer.)

Parfois, nous ne connaissons pas les caractéristiques de l’espace de probabilité, mais nous devons estimer l’espérance mathématique d’une variable aléatoire X à l’aide d’observations répétées de sa valeur. (Par exemple, nous pourrions vouloir connaître la température moyenne à midi en janvier à San Francisco ; ou nous pourrions vouloir connaître l'espérance de vie sur laquelle les agents d'assurance devraient baser leurs calculs.) Si nous disposons d'observations empiriques indépendantes, nous pouvons supposer que la la vraie espérance mathématique est approximativement égale

Vous pouvez également estimer la variance à l'aide de la formule

En regardant cette formule, vous pourriez penser qu’il y a une erreur typographique ; Il semblerait qu'elle devrait être là comme dans (8.19), puisque la vraie valeur de la dispersion est déterminée dans (8.15) à travers les valeurs attendues. Cependant, remplacer ici par permet d’obtenir une meilleure estimation, puisqu’il résulte de la définition (8.20) que

En voici la preuve :

(Dans ce calcul nous nous appuyons sur l'indépendance des observations lorsque nous remplaçons par )

En pratique, pour évaluer les résultats d'une expérience avec une variable aléatoire X, on calcule généralement la moyenne empirique et l'écart type empirique, puis on écrit la réponse sous la forme Voici, par exemple, les résultats d'un lancer de dés, probablement correct.

Comme on le sait déjà, la loi de distribution caractérise complètement une variable aléatoire. Cependant, la loi de distribution est souvent inconnue et il faut se limiter à moins d'informations. Parfois, il est encore plus rentable d'utiliser des nombres qui décrivent la variable aléatoire dans son ensemble ; ces numéros sont appelés caractéristiques numériques d'une variable aléatoire. L’espérance mathématique est l’une des caractéristiques numériques importantes.

L'espérance mathématique, comme cela sera montré ci-dessous, est approximativement égale à la valeur moyenne de la variable aléatoire. Pour résoudre de nombreux problèmes, il suffit de connaître l’espérance mathématique. Par exemple, si l'on sait que l'espérance mathématique du nombre de points marqués par le premier tireur est supérieure à celle du second, alors le premier tireur marque en moyenne plus de points que le second et, par conséquent, tire mieux. que la seconde. Bien que l’espérance mathématique fournisse beaucoup moins d’informations sur une variable aléatoire que la loi de sa distribution, la connaissance de l’espérance mathématique est suffisante pour résoudre des problèmes comme celui ci-dessus et bien d’autres.

§ 2. Espérance mathématique d'une variable aléatoire discrète

Attente mathématique Une variable aléatoire discrète est la somme des produits de toutes ses valeurs possibles et de leurs probabilités.

Laissez la variable aléatoire X ne peut prendre que des valeurs X 1 , X 2 , ..., X P. , dont les probabilités sont respectivement égales R. 1 , R. 2 , . . ., R. P. . Alors l'espérance mathématique M(X) Variable aléatoire X est déterminé par l'égalité

M(X) = X 1 R. 1 + X 2 R. 2 + … + X n p n .

Si une variable aléatoire discrète X prend un ensemble dénombrable de valeurs possibles, alors

M(X)=

De plus, l’espérance mathématique existe si la série du côté droit de l’égalité converge absolument.

Commentaire. De la définition, il s'ensuit que l'espérance mathématique d'une variable aléatoire discrète est une quantité non aléatoire (constante). Nous vous recommandons de vous souvenir de cette déclaration, car elle sera utilisée plusieurs fois par la suite. Nous montrerons plus loin que l’espérance mathématique d’une variable aléatoire continue est également une valeur constante.

Exemple 1. Trouver l'espérance mathématique d'une variable aléatoire X, connaître la loi de sa distribution :

Solution. L'espérance mathématique requise est égale à la somme des produits de toutes les valeurs possibles de la variable aléatoire et de leurs probabilités :

M(X)= 3* 0, 1+ 5* 0, 6+ 2* 0, 3= 3, 9.

Exemple 2. Trouver l'espérance mathématique du nombre d'occurrences d'un événement UN dans un essai, si la probabilité de l'événement UNégal à R.

Solution. Valeur aléatoire X - nombre d'occurrences de l'événement UN dans un test - ne peut prendre que deux valeurs : X 1 = 1 (événement UN s'est produit) avec probabilité R. Et X 2 = 0 (événement UN ne s'est pas produit) avec probabilité q= 1 -R. L'espérance mathématique requise

M(X)= 1* p+ 0* q= p

Donc, l'espérance mathématique du nombre d'occurrences d'un événement dans un essai est égale à la probabilité de cet événement. Ce résultat sera utilisé ci-dessous.

§ 3. Signification probabiliste de l'espérance mathématique

Qu'il soit produit P. tests dans lesquels la variable aléatoire X accepté T 1 valeur multipliée X 1 , T. 2 valeur multipliée X 2 ,...,m k valeur multipliée X k , et T 1 + T 2 + …+t À =p. Puis la somme de toutes les valeurs prises X, égal à

X 1 T 1 + X 2 T 2 + ... + X À T À .

Trouvons la moyenne arithmétique toutes les valeurs acceptées par une variable aléatoire, pour lesquelles on divise la somme trouvée par le nombre total de tests :

= (X 1 T 1 + X 2 T 2 + ... + X À T À)/P,

= X 1 (m 1 / n) + X 2 (m 2 / n) + ... + X À (T À /P). (*)

Constatant que l'attitude m 1 / n- fréquence relative W 1 valeurs X 1 , m 2 / n - fréquence relative W 2 valeurs X 2 etc., on écrit la relation (*) comme ceci :

=X 1 W 1 + X 2 W 2 + .. . + X À W k . (**)

Supposons que le nombre de tests soit assez important. Alors la fréquence relative est approximativement égale à la probabilité que l'événement se produise (cela sera prouvé au chapitre IX, § 6) :

W 1 p 1 , W 2 p 2 , …, W k p k .

En remplaçant les fréquences relatives par les probabilités correspondantes en relation (**), on obtient

X 1 p 1 + X 2 R. 2 + … + X À R. À .

Le côté droit de cette égalité approximative est M(X). Donc,

M(X).

La signification probabiliste du résultat obtenu est la suivante : l'espérance mathématique est à peu près égale(plus c'est précis, plus le nombre de tests est grand) la moyenne arithmétique des valeurs observées d'une variable aléatoire.

Remarque 1. Il est facile de comprendre que l'espérance mathématique est supérieure à la plus petite et inférieure à la plus grande valeur possible. En d'autres termes, sur la droite numérique, les valeurs possibles sont situées à gauche et à droite de l'espérance mathématique. En ce sens, l'espérance mathématique caractérise la localisation de la distribution et est donc souvent appelée Centre de distribution.

Ce terme est emprunté à la mécanique : si les masses R. 1 , R 2 , ..., R P. situés aux points d'abscisse X 1 , X 2 , ..., X n, et
puis l'abscisse du centre de gravité

X c =
.

Étant donné que
=
M (X) Et
on a M(X)=x Avec .

Ainsi, l'espérance mathématique est l'abscisse du centre de gravité du système points matériels, dont les abscisses sont égales aux valeurs possibles de la variable aléatoire, et les masses sont égales à leurs probabilités.

Remarque 2. L'origine du terme « espérance mathématique » est associée à la période initiale d'émergence de la théorie des probabilités (XVIe - XVIIe siècles), lorsque le champ de son application était limité aux jeux de hasard. Le joueur s'intéressait à la valeur moyenne du gain attendu, ou, en d'autres termes, à l'espérance mathématique de gagner.

Valeur attendue

Dispersion La variable aléatoire continue X, dont les valeurs possibles appartiennent à tout l'axe Ox, est déterminée par l'égalité :

Objet de la prestation. Calculateur en ligne conçu pour résoudre des problèmes dans lesquels soit densité de distribution f(x) ou fonction de distribution F(x) (voir exemple). Habituellement, dans de telles tâches, vous devez trouver espérance mathématique, écart type, graphiques des fonctions f(x) et F(x).

Instructions. Sélectionnez le type de données source : densité de distribution f(x) ou fonction de distribution F(x).

Densité de distribution f(x) donnée Fonction de distribution F(x) donnée

La densité de distribution f(x) est donnée :

La fonction de distribution F(x) est donnée :

Une variable aléatoire continue est spécifiée par une densité de probabilité
(Loi de distribution de Rayleigh - utilisée en ingénierie radio). Trouvez M(x) , D(x) .

La variable aléatoire X est appelée continu , si sa fonction de distribution F(X)=P(X< x) непрерывна и имеет производную.
La fonction de distribution d'une variable aléatoire continue est utilisée pour calculer la probabilité qu'une variable aléatoire tombe dans un intervalle donné :
P(α< X < β)=F(β) - F(α)
De plus, pour une variable aléatoire continue, peu importe que ses limites soient incluses ou non dans cet intervalle :
P(α< X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Densité de distribution une variable aléatoire continue s'appelle une fonction
f(x)=F’(x) , dérivée de la fonction de distribution.

Propriétés de la densité de distribution

1. La densité de distribution de la variable aléatoire est non négative (f(x) ≥ 0) pour toutes les valeurs de x.
2. Condition de normalisation :

La signification géométrique de la condition de normalisation : l'aire sous la courbe de densité de distribution est égale à l'unité.
3. La probabilité qu'une variable aléatoire X tombe dans l'intervalle de α à β peut être calculée à l'aide de la formule

Géométriquement, la probabilité qu'une variable aléatoire continue X tombe dans l'intervalle (α, β) est égale à l'aire trapèze courbé sous la courbe de densité de distribution basée sur cet intervalle.
4. La fonction de distribution est exprimée en termes de densité comme suit :

La valeur de la densité de distribution au point x n'est pas égale à la probabilité d'accepter cette valeur ; pour une variable aléatoire continue on ne peut parler que de la probabilité de tomber dans un intervalle donné. Laisser )