Формула математического ожидания. Дискретные случайные величины

17.10.2019

Закон распределения дискретной случайной величины

– этосоответствие между возможными значениями этой величины и их вероятностями. Чаще всего закон записывают таблицей:

Довольно часто встречается термин ряд распределения , но в некоторых ситуациях он звучит двусмысленно, и поэтому я буду придерживаться «закона».

А теперь очень важный момент : поскольку случайная величина обязательно примет одно из значений , то соответствующие события образуют полную группу и сумма вероятностей их наступления равна единице:

или, если записать свёрнуто:

Так, например, закон распределения вероятностей выпавших на кубике очков имеет следующий вид:

Без комментариев.

Возможно, у вас сложилось впечатление, что дискретная случайная величина может принимать только «хорошие» целые значения. Развеем иллюзию – они могут быть любыми:

Пример 1

Некоторая игра имеет следующий закон распределения выигрыша:

…наверное, вы давно мечтали о таких задачах:) Открою секрет – я тоже. В особенности после того, как завершил работу над теорией поля .

Решение : так как случайная величина может принять только одно из трёх значений, то соответствующие события образуют полную группу , а значит, сумма их вероятностей равна единице:

Разоблачаем «партизана»:

– таким образом, вероятность выигрыша условных единиц составляет 0,4.

Контроль: , в чём и требовалось убедиться.

Ответ :

Не редкость, когда закон распределения требуется составить самостоятельно. Для этого используют классическое определение вероятности , теоремы умножения / сложения вероятностей событий и другие фишки тервера :

Пример 2

В коробке находятся 50 лотерейных билетов, среди которых 12 выигрышных, причём 2 из них выигрывают по 1000 рублей, а остальные – по 100 рублей. Составить закон распределения случайной величины – размера выигрыша, если из коробки наугад извлекается один билет.

Решение : как вы заметили, значения случайной величины принято располагать в порядке их возрастания . Поэтому мы начинаем с самого маленького выигрыша, и именно рублей.

Всего таковых билетов 50 – 12 = 38, и по классическому определению :
– вероятность того, что наудачу извлечённый билет окажется безвыигрышным.

С остальными случаями всё просто. Вероятность выигрыша рублей составляет:

Проверка: – и это особенно приятный момент таких заданий!

Ответ : искомый закон распределения выигрыша:

Следующее задание для самостоятельного решения:

Пример 3

Вероятность того, что стрелок поразит мишень, равна . Составить закон распределения случайной величины – количества попаданий после 2 выстрелов.

…я знал, что вы по нему соскучились:) Вспоминаем теоремы умножения и сложения . Решение и ответ в конце урока.

Закон распределения полностью описывает случайную величину, однако на практике бывает полезно (а иногда и полезнее) знать лишь некоторые её числовые характеристики .

Математическое ожидание дискретной случайной величины

Говоря простым языком, это среднеожидаемое значение при многократном повторении испытаний. Пусть случайная величина принимает значения с вероятностями соответственно. Тогда математическое ожидание данной случайной величины равно сумме произведений всех её значений на соответствующие вероятности:

или в свёрнутом виде:

Вычислим, например, математическое ожидание случайной величины – количества выпавших на игральном кубике очков:

Теперь вспомним нашу гипотетическую игру:

Возникает вопрос: а выгодно ли вообще играть в эту игру? …у кого какие впечатления? Так ведь «навскидку» и не скажешь! Но на этот вопрос можно легко ответить, вычислив математическое ожидание, по сути – средневзвешенный по вероятностям выигрыш:

Таким образом, математическое ожидание данной игры проигрышно .

Не верь впечатлениям – верь цифрам!

Да, здесь можно выиграть 10 и даже 20-30 раз подряд, но на длинной дистанции нас ждёт неминуемое разорение. И я бы не советовал вам играть в такие игры:) Ну, может, только ради развлечения .

Из всего вышесказанного следует, что математическое ожидание – это уже НЕ СЛУЧАЙНАЯ величина.

Творческое задание для самостоятельного исследования:

Пример 4

Мистер Х играет в европейскую рулетку по следующей системе: постоянно ставит 100 рублей на «красное». Составить закон распределения случайной величины – его выигрыша. Вычислить математическое ожидание выигрыша и округлить его до копеек. Сколько в среднем проигрывает игрок с каждой поставленной сотни?

Справка : европейская рулетка содержит 18 красных, 18 чёрных и 1 зелёный сектор («зеро»). В случае выпадения «красного» игроку выплачивается удвоенная ставка, в противном случае она уходит в доход казино

Существует много других систем игры в рулетку, для которых можно составить свои таблицы вероятностей. Но это тот случай, когда нам не нужны никакие законы распределения и таблицы, ибо доподлинно установлено, что математическое ожидание игрока будет точно таким же. От системы к системе меняется лишь

Следующим по важности свойством случайной величины вслед за математическим ожиданием является ее дисперсия, определяемая как средний квадрат отклонения от среднего:

Если обозначить через то дисперсия VX будет ожидаемым значением Это характеристика „разброса" распределения X.

В качестве простого примера вычисления дисперсии предположим, что нам только что сделали предложение, от которого мы не в силах отказаться: некто подарил нам два сертификата для участия в одной лотерее. Устроители лотереи продают каждую неделю по 100 билетов, участвующих в отдельном тираже. В тираже выбирается один их этих билетов посредством равномерного случайного процесса - каждый билет имеет равные шансы быть выбранным - и обладатель этого счастливого билета получает сто миллионов долларов. Остальные 99 владельцев лотерейных билетов не выигрывают ничего.

Мы можем использовать подарок двумя способами: купить или два билета в одной лотерее, или по одному для участия в двух разных лотереях. Какая стратегия лучше? Попытаемся провести анализ. Для этого обозначим через случайные величины, представляющие размер нашего выигрыша по первому и второму билету. Ожидаемое значение в миллионах, равно

и то же самое справедливо для Ожидаемые значения аддитивны, поэтому наш средний суммарный выигрыш составит

независимо от принятой стратегии.

Тем не менее, две стратегии выглядят различными. Выйдем за рамки ожидаемых значений и изучим полностью распределение вероятностей

Если мы купим два билета в одной лотерее, то наши шансы не выиграть ничего составят 98% и 2% - шансы на выигрыш 100 миллионов. Если же мы купим билеты на разные тиражи, то цифры будут такими: 98.01% - шанс не выиграть ничего, что несколько больше, чем ранее; 0.01% - шанс выиграть 200 миллионов, также чуть больше, чем было ранее; и шанс выиграть 100 миллионов теперь составляет 1.98%. Таким образом, во втором случае распределение величины несколько более разбросано; среднее значение, 100 миллионов долларов, несколько менее вероятно, тогда как крайние значения более вероятны.

Именно это понятие разброса случайной величины призвана отразить дисперсия. Мы измеряем разброс через квадрат отклонения случайной величины от ее математического ожидания. Таким образом, в случае 1 дисперсия составит

в случае 2 дисперсия равна

Как мы и ожидали, последняя величина несколько больше, поскольку распределение в случае 2 несколько более разбросано.

Когда мы работаем с дисперсиями, то все возводится в квадрат, так что в результате могут получиться весьма большие числа. (Множитель есть один триллион, это должно впечатлить

даже привычных к крупным ставкам игроков.) Для преобразования величин в более осмысленную исходную шкалу часто извлекают квадратный корень из дисперсии. Полученное число называется стандартным отклонением и обычно обозначается греческой буквой а:

Стандартные отклонения величины для наших двух лотерейных стратегий составят . В некотором смысле второй вариант примерно на 71247 долларов рискованнее.

Каким образом дисперсия помогает в выборе стратегии? Это не ясно. Стратегия с большей дисперсией рискованнее; но что лучше для нашего кошелька - риск или безопасная игра? Пусть у нас есть возможность купить не два билета, а все сто. Тогда мы могли бы гарантировать выигрыш в одной лотерее (и дисперсия была бы нулевой); или же можно было сыграть в сотне разных тиражей, ничего не получая с вероятностью зато имея ненулевой шанс на выигрыш вплоть до долларов. Выбор одной из этих альтернатив лежит за рамками этой книги; все, что мы можем сделать здесь,- это объяснить, как произвести подсчеты.

В действительности имеется более простой способ вычисления дисперсии, чем прямое использование определения (8.13). (Есть все основания подозревать здесь какую-то скрытую от глаз математику; иначе с чего бы дисперсия в лотерейных примерах оказалась целым кратным Имеем

поскольку - константа; следовательно,

„Дисперсия есть среднее значение квадрата минус квадрат среднего значения"

Например, в задаче про лотерею средним значением оказывается или Вычитание (квадрата среднего) дает результаты, которые мы уже получили ранее более трудным путем.

Есть, однако, еще более простая формула, применимая, когда мы вычисляем для независимых X и Y. Имеем

поскольку, как мы знаем, для независимых случайных величин Следовательно,

„Дисперсия суммы независимых случайных величин равняется сумме их дисперсий" Так, например, дисперсия суммы, которую можно выиграть на один лотерейный билет, равняется

Следовательно, дисперсия суммарного выигрыша по двум лотерейным билетам в двух различных (независимых) лотереях составит Соответствующее значение дисперсии для независимых лотерейных билетов будет

Дисперсия суммы очков, выпавших на двух кубиках, может быть получена по той же формуле, поскольку есть сумма двух независимых случайных величин. Имеем

для правильного кубика; следовательно, случае смещенного центра масс

следовательно, если у обоих кубиков центр масс смещен. Заметьте, что в последнем случае дисперсия больше, хотя принимает среднее значение 7 чаще, чем в случае правильных кубиков. Если наша цель - выбросить побольше приносящих удачу семерок, то дисперсия - не лучший показатель успеха.

Ну хорошо, мы установили, как вычислить дисперсию. Но мы пока не дали ответа на вопрос, почему надо вычислять именно дисперсию. Все так делают, но почему? Основная причина заключается в неравенстве Чебышева которое устанавливает важное свойство дисперсии:

(Это неравенство отличается от неравенств Чебышёва для сумм, встретившихся нам в гл. 2.) На качественном уровне (8.17) утверждает, что случайная величина X редко принимает значения, далекие от своего среднего если ее дисперсия VX мала. Доказательство

тельство необычайно просто. Действительно,

деление на завершает доказательство.

Если мы обозначим математическое ожидание через а стандартное отклонение - через а и заменим в (8.17) на то условие превратится в следовательно, мы получим из (8.17)

Таким образом, X будет лежать в пределах -кратного стандартного отклонения от своего среднего значения за исключением случаев, вероятность которых не превышает Случайная величина будет лежать в пределах 2а от по крайней мере для 75% испытаний; в пределах от до - по крайней мере для 99%. Это случаи неравенства Чебышёва.

Если бросить пару кубиков раз, то общая сумма очков во всех бросаниях почти всегда, при больших будет близка к Причина этого следующая: дисперсия независимых бросаний составит Дисперсия в означает стандартное отклонение всего

Поэтому из неравенства Чебышёва получаем, что сумма очков будет лежать между

по крайней мере для 99% всех бросаний правильных кубиков. Например, итог миллиона бросаний с вероятностью более 99% будет заключен между 6.976 млн и 7.024 млн.

В общем случае, пусть X - любая случайная величина на вероятностном пространстве П, имеющая конечное математическое ожидание и конечное стандартное отклонение а. Тогда можно ввести в рассмотрение вероятностное пространство Пп, элементарными событиями которого являются -последовательности где каждое , а вероятность определяется как

Если теперь определить случайные величины формулой

то величина

будет суммой независимых случайных величин, которая соответствует процессу суммирования независимых реализаций величины X на П. Математическое ожидание будет равно а стандартное отклонение - ; следовательно, среднее значение реализаций,

будет лежать в пределах от до по крайней мере в 99% временного периода. Иными словами, если выбрать достаточно большое то среднее арифметическое независимых испытаний будет почти всегда очень близко к ожидаемому значению (В учебниках теории вероятностей доказывается еще более сильная теорема, называемая усиленным законом больших чисел; но нам достаточно и простого следствия неравенства Чебышёва, которое мы только что вывели.)

Иногда нам не известны характеристики вероятностного пространства, но требуется оценить математическое ожидание случайной величины X при помощи повторных наблюдений ее значения. (Например, нам могла бы понадобиться средняя полуденная температура января в Сан-Франциско; или же мы хотим узнать ожидаемую продолжительность жизни, на которой должны основывать свои расчеты страховые агенты.) Если в нашем распоряжении имеются независимые эмпирические наблюдения то мы можем предположить, что истинное математическое ожидание приблизительно равно

Можно оценить и дисперсию, используя формулу

Глядя на эту формулу, можно подумать, что в ней - типографская ошибка; казалось бы, там должно стоять как в (8.19), поскольку истинное значение дисперсии определяется в (8.15) через ожидаемые значения. Однако замена здесь на позволяет получить лучшую оценку, поскольку из определения (8.20) вытекает, что

Вот доказательство:

(В этой выкладке мы опираемся на независимость наблюдений, когда заменяем на )

На практике для оценки результатов эксперимента со случайной величиной X обычно вычисляют эмпирическое среднее и эмпирическое стандартное отклонение после чего записывают ответ в виде Вот, например, результаты бросаний пары кубиков, предположительно правильных.

Как уже известно, закон распределения полностью характеризует случайную величину. Однако часто закон распределения неизвестен и приходится ограничиваться меньшими сведениями. Иногда даже выгоднее пользоваться числами, которые описывают случайную величину суммарно; такие числа называют числовыми характеристиками случайной величины. К числу важных числовых характеристик относится математическое ожидание.

Математическое ожидание, как будет показано далее, приближенно равно среднему значению случайной величины. Для решения многих задач достаточно знать математическое ожидание. Например, если известно, что математическое ожидание числа выбиваемых очков у первого стрелка больше, чем у второго, то первый стрелок в среднем выбивает больше очков, чем второй, и, следовательно, стреляет лучше второго. Хотя математическое ожидание дает о случайной величине значительно меньше сведений, чем закон ее распределения, но для решения задач, подобных приведенной и многих других, знание математического ожидания оказывается достаточным.

§ 2. Математическое ожидание дискретной случайной величины

Математическим ожиданием дискретной случайной величины называют сумму произведений всех ее возможных значений на их вероятности.

Пусть случайная величина X может принимать только значения х 1 , х 2 , ..., х п , вероятности которых соответственно равны р 1 , р 2 , . . ., р п . Тогда математическое ожидание М (X ) случайной величины X определяется равенством

М (X ) = х 1 р 1 + х 2 р 2 + … + x n p n .

Если дискретная случайная величина X принимает счетное множество возможных значений, то

М (Х )=

причем математическое ожидание существует, если ряд в правой части равенства сходится абсолютно.

Замечание. Из определения следует, что математическое ожидание дискретной случайной величины есть неслучайная (постоянная) величина. Рекомендуем запомнить это утверждение, так как далее оно используется многократно. В дальнейшем будет показано, что математическое ожидание непрерывной случайной величины также есть постоянная величина.

Пример 1. Найти математическое ожидание случайной величины X , зная закон ее распределения:

Решение. Искомое математическое ожидание равно сумме произведений всех возможных значений случайной величины на их вероятности:

M (X )= 3* 0, 1+ 5* 0, 6+ 2* 0, 3= 3, 9.

Пример 2. Найти математическое ожидание числа появлений события А в одном испытании, если вероятность события А равна р.

Решение. Случайная величина X - число появлений события А в одном испытании - может принимать только два значения: х 1 = 1 (событие А наступило) с вероятностью р и х 2 = 0 (событие А не наступило) с вероятностью q = 1 -р. Искомое математическое ожидание

M (X )= 1* p + 0* q = p

Итак, математическое ожидание числа появлений события в одном испытании равно вероятности этого события. Этот результат будет использован ниже.

§ 3. Вероятностный смысл математического ожидания

Пусть произведено п испытаний, в которых случайная величина X приняла т 1 раз значение х 1 , т 2 раз значение х 2 ,...,m k раз значение x k , причем т 1 + т 2 + …+т к = п. Тогда сумма всех значений, принятых X , равна

х 1 т 1 + х 2 т 2 + ... + х к т к .

Найдем среднее арифметическое всех значений, принятых, случайной величиной, для чего разделим найденную сумму на общее число испытаний:

= (х 1 т 1 + х 2 т 2 + ... + х к т к )/п,

= х 1 (m 1 / n ) + х 2 (m 2 / n ) + ... + х к (т к /п ). (*)

Заметив, что отношение m 1 / n - относительная частота W 1 значения х 1 , m 2 / n - относительная частота W 2 значения х 2 и т. д., запишем соотношение (*) так:

= х 1 W 1 + x 2 W 2 + .. . + х к W k . (**)

Допустим, что число испытаний достаточно велико. Тогда относительная частота приближенно равна вероятности появления события (это будет доказано в гл. IX, § 6):

W 1 p 1 , W 2 p 2 , …, W k p k .

Заменив в соотношении (**) относительные частоты соответствующими вероятностями, получим

x 1 p 1 + х 2 р 2 + … + х к р к .

Правая часть этого приближенного равенства есть М (X ). Итак,

М (X ).

Вероятностный смысл полученного результата таков: математическое ожидание приближенно равно (тем точнее, чем больше число испытаний) среднему арифметическому наблюдаемых значений случайной величины.

Замечание 1. Легко сообразить, что математическое ожидание больше наименьшего и меньше наибольшего возможных значений. Другими словами, на числовой оси возможные значения расположены слева и справа от математического ожидания. В этом смысле математическое ожидание характеризует расположение распределения и поэтому его часто называют центром распределения.

Этот термин заимствован из механики: если массы р 1 , р 2 , ..., р п расположены в точках с абсциссами x 1 , х 2 , ..., х n , причем
то абсцисса центра тяжести

x c =
.

Учитывая, что
= M (X ) и
получим М (Х ) = х с .

Итак, математическое ожидание есть абсцисса центра тяжести системы материальных точек, абсциссы которых равны возможным значениям случайной величины, а массы - их вероятностям.

Замечание 2. Происхождение термина «математическое ожидание» связано с начальным периодом возникновения теории вероятностей (XVI - XVII вв.), когда область ее применения ограничивалась азартными играми. Игрока интересовало среднее значение ожидаемого выигрыша, или, иными словами, математическое ожидание выигрыша.

Математическое ожидание

Дисперсия непрерывной случайной величины X , возможные значения которой принадлежат всей оси Ох, определяется равенством:

Назначение сервиса . Онлайн калькулятор предназначен для решения задач, в которых заданы либо плотность распределения f(x) , либо функция распределения F(x) (см. пример). Обычно в таких заданиях требуется найти математическое ожидание, среднее квадратическое отклонение, построить графики функций f(x) и F(x) .

Инструкция . Выберите вид исходных данных: плотность распределения f(x) или функция распределения F(x) .

Задана плотность распределения f(x):

Задана функция распределения F(x):

Непрерывная случайна величина задана плотностью вероятностей
(закон распределения Релея – применяется в радиотехнике). Найти M(x) , D(x) .

Случайную величину X называют непрерывной , если ее функция распределения F(X)=P(X < x) непрерывна и имеет производную.
Функция распределения непрерывной случайной величины применяется для вычисления вероятностей попадания случайной величины в заданный промежуток:
P(α < X < β)=F(β) - F(α)
причем для непрерывной случайной величины не имеет значения, включаются в этот промежуток его границы или нет:
P(α < X < β) = P(α ≤ X < β) = P(α ≤ X ≤ β)
Плотностью распределения непрерывной случайной величины называется функция
f(x)=F’(x) , производная от функции распределения.

Свойства плотности распределения

1. Плотность распределения случайной величины неотрицательна (f(x) ≥ 0) при всех значениях x.
2. Условие нормировки:

Геометрический смысл условия нормировки: площадь под кривой плотности распределения равна единице.
3. Вероятность попадания случайной величины X в промежуток от α до β может быть вычислена по формуле

Геометрически вероятность попадания непрерывной случайной величины X в промежуток (α, β) равна площади криволинейной трапеции под кривой плотности распределения, опирающейся на этот промежуток.
4. Функция распределения выражается через плотность следующим образом:

Значение плотности распределения в точке x не равно вероятности принять это значение, для непрерывной случайной величины речь может идти только о вероятности попадания в заданный интервал. Пусть }