Fórmula de probabilidade total de Bayes. Fórmula de Probabilidade Total. Fórmula de Bayes

Fórmula de probabilidade total de Bayes. Fórmula de Probabilidade Total. Fórmula de Bayes

Breve teoria

Se um evento ocorrer apenas se ocorrer um dos eventos que formam um grupo completo de eventos incompatíveis, então é igual à soma dos produtos das probabilidades de cada um dos eventos e a carteira de probabilidade condicional correspondente.

Nesse caso, os eventos são chamados de hipóteses e as probabilidades são chamadas de a priori. Essa fórmula é chamada de fórmula de probabilidade total.

A fórmula de Bayes é utilizada na resolução de problemas práticos, quando ocorreu um evento que aparece junto com qualquer um dos eventos que formam um grupo completo de eventos e é necessário realizar uma reavaliação quantitativa das probabilidades das hipóteses. As probabilidades a priori (antes da experiência) são conhecidas. É necessário calcular as probabilidades a posteriori (após a experiência), ou seja, Essencialmente, você precisa encontrar as probabilidades condicionais. A fórmula de Bayes fica assim:

A próxima página trata do problema em .

Exemplo de solução de problema

Condição da tarefa 1

Na fábrica, as máquinas 1, 2 e 3 produzem 20%, 35% e 45% de todas as peças, respectivamente. Em seus produtos, o defeito é, respectivamente, 6%, 4%, 2%. Qual é a probabilidade de que um item selecionado aleatoriamente seja defeituoso? Qual a probabilidade de ter sido produzido: a) pela máquina 1; b) máquina 2; c) máquina 3?

Solução do problema 1

Denote pelo evento em que o produto padrão acabou apresentando defeito.

Um evento só pode ocorrer se ocorrer um dos três eventos:

O produto é produzido na máquina 1;

O produto é produzido na máquina 2;

O produto é produzido na máquina 3;

Vamos escrever as probabilidades condicionais:

Fórmula de Probabilidade Total

Se um evento só pode ocorrer quando ocorre um dos eventos que formam um grupo completo de eventos incompatíveis, então a probabilidade do evento é calculada pela fórmula

Usando a fórmula de probabilidade total, encontramos a probabilidade de um evento:

Fórmula de Bayes

A fórmula de Bayes permite "reorganizar a causa e o efeito": dado o fato conhecido de um evento, calcule a probabilidade de que ele tenha sido causado por uma determinada causa.

Probabilidade de que um item defeituoso foi produzido na máquina 1:

Probabilidade de que um item defeituoso foi produzido na máquina 2:

Probabilidade de que um item defeituoso foi produzido na máquina 3:

Condição da tarefa 2

O grupo é composto por 1 aluno excelente, 5 alunos bons e 14 alunos medíocres. Um aluno excelente responde 5 e 4 com igual probabilidade, um bom aluno responde 5, 4 e 3 com igual probabilidade e um aluno medíocre responde 4,3 e 2 com igual probabilidade. Um aluno selecionado aleatoriamente respondeu 4. Qual é a probabilidade de um aluno medíocre ser chamado?

Solução do problema 2

Hipóteses e probabilidades condicionais

As seguintes hipóteses são possíveis:

O excelente aluno respondeu;

Respondeu bem;

– respondeu aluno medíocre;

Deixe o evento - aluno obter 4.

Probabilidades condicionais:

Responda:

Médio o custo de resolver o trabalho de controle é de 700 a 1200 rublos (mas não inferior a 300 rublos para todo o pedido). O preço é fortemente influenciado pela urgência da decisão (de dias a várias horas). O custo da ajuda on-line no exame / teste - a partir de 1000 rublos. para a solução de bilhetes.

O aplicativo pode ser deixado diretamente no chat, tendo previamente descartado a condição das tarefas e informando os prazos para resolvê-lo. O tempo de resposta é de vários minutos.

Universidade Estadual da Sibéria de Telecomunicações e Informática

Departamento de Matemática Superior

disciplina: "Teoria das probabilidades e estatística matemática"

"Fórmula de probabilidade total e fórmula de Bayes (Bayes) e sua aplicação"

Concluído:

Chefe: Professor B.P. Zelentsov

Novosibirsk, 2010


Introdução 3

1. Fórmula de probabilidade total 4-5

2. Fórmula de Bayes (Bayes) 5-6

3. Problemas com soluções 7-11

4. As principais áreas de aplicação da fórmula de Bayes (Bayes) 11

Conclusão 12

Literatura 13


Introdução

A teoria das probabilidades é um dos ramos clássicos da matemática. Tem uma longa história. As bases deste ramo da ciência foram lançadas por grandes matemáticos. Vou citar, por exemplo, Fermat, Bernoulli, Pascal.
Mais tarde, o desenvolvimento da teoria da probabilidade foi determinado nos trabalhos de muitos cientistas.
Os cientistas de nosso país deram uma grande contribuição à teoria da probabilidade:
P.L. Chebyshev, A.M. Lyapunov, A.A. Markov, A.N. Kolmogorov. Os métodos probabilísticos e estatísticos estão agora profundamente incorporados nas aplicações. Eles são usados ​​em física, engenharia, economia, biologia e medicina. Seu papel aumentou especialmente em conexão com o desenvolvimento da tecnologia de computador.

Por exemplo, para estudar fenômenos físicos, são feitas observações ou experimentos. Seus resultados geralmente são registrados como valores de algumas quantidades observadas. Ao repetir os experimentos, encontramos uma dispersão em seus resultados. Por exemplo, ao repetir medições da mesma quantidade com o mesmo dispositivo mantendo certas condições (temperatura, umidade, etc.), obtemos resultados que diferem pelo menos um pouco, mas ainda diferem entre si. Mesmo várias medições não permitem prever com precisão o resultado da próxima medição. Nesse sentido, diz-se que o resultado de uma medição é uma quantidade aleatória. Um exemplo ainda mais claro de uma variável aleatória é o número de um bilhete de loteria premiado. Muitos outros exemplos de variáveis ​​aleatórias podem ser dados. No entanto, no mundo dos acidentes, certos padrões são encontrados. O aparato matemático para estudar tais regularidades é fornecido pela teoria da probabilidade.
Assim, a teoria da probabilidade trata da análise matemática de eventos aleatórios e variáveis ​​aleatórias associadas a eles.

1. Fórmula de probabilidade total.

Que haja um grupo de eventos H 1 ,H 2 ,..., H n, que tem as seguintes propriedades:

1) todos os eventos são incompatíveis aos pares: Oi

Hj =Æ; eu , j =1,2,...,n ; eu ¹ j ;

2) sua união forma o espaço de resultados elementares W:

.
Fig.8

Neste caso, diremos que H 1 , H 2 ,...,H n Formato grupo completo de eventos. Tais eventos são às vezes chamados hipóteses .

Deixar MAS- algum evento: MASÌW (diagrama de Venn mostrado na Figura 8). Então há fórmula de probabilidade total:

P (UMA) = P (UMA /H 1)P (H 1) + P (UMA /H 2)P (H 2) + ...+P (UMA /H n)P (H n) =

Prova. Obviamente: A=

, e todos os eventos ( eu = 1,2,...,n) são inconsistentes aos pares. A partir daqui, pelo teorema da adição de probabilidade, obtemos

P (UMA) = P (

) + P () +...+ P (

Considerando que pelo teorema da multiplicação P (

) = P (A/H eu) P (H eu)( eu = 1,2,...,n), então da última fórmula é fácil obter a fórmula acima para a probabilidade total.

Exemplo. A loja vende lâmpadas elétricas produzidas por três fábricas, com a participação da primeira fábrica - 30%, a segunda - 50%, a terceira - 20%. Casamento em seus produtos é, respectivamente, 5%, 3% e 2%. Qual é a probabilidade de que uma lâmpada selecionada aleatoriamente em uma loja seja defeituosa?

Deixe o evento H 1 é que a lâmpada selecionada é produzida na primeira fábrica, H 2 na segunda H 3 - na terceira planta. Obviamente:

P (H 1) = 3/10, P (H 2) = 5/10, P (H 3) = 2/10.

Deixe o evento MAS consiste no fato de que a lâmpada selecionada estava com defeito; A/H i significa um evento que consiste no fato de que uma lâmpada defeituosa é selecionada a partir de lâmpadas fabricadas em euª fábrica. Da condição do problema segue:

P (UMA / H 1) = 5/10; P (UMA / H 2) = 3/10; P (UMA / H 3) = 2/10

De acordo com a fórmula de probabilidade total, obtemos

2. Fórmula de Bayes (Bayes)

Deixar H 1 ,H 2 ,...,H n- grupo completo de eventos e MASÌ W é algum evento. Então, de acordo com a fórmula para a probabilidade condicional

(1)

Aqui P (H k /UMA) é a probabilidade condicional do evento (hipótese) H k ou a probabilidade de H ké implementado desde que o evento MAS ocorrido.

De acordo com o teorema da multiplicação de probabilidade, o numerador da fórmula (1) pode ser representado como

P = P = P (UMA /H k)P (H k)

Para representar o denominador da fórmula (1), pode-se usar a fórmula de probabilidade total

P (UMA)

Agora de (1) pode-se obter uma fórmula chamada Fórmula de Bayes :

Pela fórmula de Bayes, a probabilidade de realização da hipótese é calculada H k desde que o evento MAS ocorrido. A fórmula de Bayes também é chamada fórmula de probabilidade de hipótese. Probabilidade P (H k) é chamada de probabilidade a priori da hipótese H k, e a probabilidade P (H k /UMA) é a probabilidade posterior.

Teorema. A probabilidade de uma hipótese após o teste é igual ao produto da probabilidade da hipótese antes do teste pela probabilidade condicional correspondente do evento ocorrido durante o teste, dividida pela probabilidade total desse evento.

Exemplo. Considere o problema acima sobre lâmpadas elétricas, apenas mude a questão do problema. Deixe o comprador comprar uma lâmpada elétrica nesta loja e ela estava com defeito. Encontre a probabilidade de que esta lâmpada seja fabricada na segunda fábrica. Valor P (H 2) = 0,5 neste caso, esta é a probabilidade a priori do evento de que a lâmpada comprada seja fabricada na segunda fábrica. Tendo recebido a informação de que a lâmpada comprada está com defeito, podemos corrigir nossa estimativa da possibilidade de fabricar essa lâmpada na segunda fábrica calculando a probabilidade posterior desse evento.

Fórmula de Bayes

teorema de Bayes- um dos principais teoremas da teoria elementar da probabilidade, que determina a probabilidade de um evento ocorrer em condições em que apenas algumas informações parciais sobre os eventos são conhecidas com base em observações. De acordo com a fórmula de Bayes, é possível recalcular a probabilidade com mais precisão, levando em consideração tanto as informações previamente conhecidas quanto os dados de novas observações.

"Significado físico" e terminologia

A fórmula de Bayes permite "reorganizar a causa e o efeito": dado o fato conhecido de um evento, calcule a probabilidade de que ele tenha sido causado por uma determinada causa.

Eventos que refletem a ação de "causas" neste caso são geralmente chamados hipóteses, porque eles são suposto os eventos que o conduziram. A probabilidade incondicional da validade de uma hipótese é chamada a priori(Qual é a probabilidade da causa? geralmente), e condicional - levando em consideração o fato do evento - a posteriori(Qual é a probabilidade da causa? acabou por levar em conta os dados do evento).

Consequência

Uma consequência importante da fórmula de Bayes é a fórmula para a probabilidade total de um evento dependendo de de várias hipóteses inconsistentes ( e só deles!).

- a probabilidade do evento ocorrer B, dependendo de uma série de hipóteses UMA eu se os graus de confiabilidade dessas hipóteses são conhecidos (por exemplo, medidos experimentalmente);

Derivação da fórmula

Se um evento depende apenas de causas UMA eu, então, se aconteceu, significa que algumas das razões necessariamente aconteceram, ou seja,

Pela fórmula de Bayes

transferir P(B) à direita, obtemos a expressão desejada.

Método de filtragem de spam

Um método baseado no teorema de Bayes foi aplicado com sucesso na filtragem de spam.

Descrição

Ao treinar o filtro, para cada palavra encontrada em letras, seu “peso” é calculado e armazenado - a probabilidade de uma letra com essa palavra ser spam (no caso mais simples, de acordo com a definição clássica de probabilidade: “aparições em spam / aparências de tudo”).

Ao verificar uma carta recém-chegada, a probabilidade de ser spam é calculada de acordo com a fórmula acima para um conjunto de hipóteses. Neste caso, "hipóteses" são palavras, e para cada palavra "confiabilidade da hipótese" -% desta palavra na letra, e "dependência do evento na hipótese" P(B | UMA eu) - "peso" previamente calculado da palavra. Ou seja, o “peso” da letra neste caso nada mais é do que o “peso” médio de todas as suas palavras.

Uma carta é classificada como "spam" ou "não-spam" pelo fato de seu "peso" exceder uma determinada barra definida pelo usuário (geralmente 60-80% é obtido). Após a decisão sobre uma carta, os “pesos” das palavras incluídas nela são atualizados no banco de dados.

Característica

Este método é simples (os algoritmos são elementares), conveniente (permite que você fique sem "listas negras" e truques artificiais semelhantes), eficaz (após o treinamento em uma amostra suficientemente grande, ele corta até 95-97% do spam e em caso de erros, ele pode ser treinado). Em geral, há todas as indicações para seu uso generalizado, que é o que acontece na prática - quase todos os filtros de spam modernos são construídos com base nisso.

No entanto, o método também tem uma desvantagem fundamental: com base na suposição, o que algumas palavras são mais comuns em spam, enquanto outras são mais comuns em e-mails comuns, e é ineficiente se essa suposição for falsa. No entanto, como mostra a prática, mesmo uma pessoa não é capaz de determinar esse spam "a olho" - somente depois de ler a carta e entender seu significado.

Outra desvantagem não fundamental associada à implementação - o método funciona apenas com texto. Sabendo dessa limitação, os spammers começaram a colocar informações publicitárias na imagem, enquanto o texto da carta está ausente ou não faz sentido. Contra isso, deve-se usar ferramentas de reconhecimento de texto (um procedimento "caro", usado apenas quando absolutamente necessário), ou métodos de filtragem antigos - "listas negras" e expressões regulares (já que essas letras geralmente têm uma forma estereotipada).

Veja também

Notas

Links

Literatura

  • Byrd Kiwi. Teorema do Rev. Bayes. // Revista Computerra, 24 de agosto de 2001
  • Paulo Graham. Um plano para spam. // Site pessoal de Paul Graham.

Fundação Wikimedia. 2010.

Veja o que é a "fórmula de Bayes" em outros dicionários:

    Uma fórmula que se parece com: onde a1, A2, ..., An são eventos incompatíveis, O esquema geral para a aplicação de F. in. g.: se o evento B pode ocorrer no decomp. condições sob as quais n hipóteses A1, A2, ..., An são feitas com probabilidades P (A1), ... conhecidas antes do experimento, ... ... Enciclopédia Geológica

    Permite calcular a probabilidade de um evento de interesse através das probabilidades condicionais deste evento, assumindo determinadas hipóteses, bem como as probabilidades dessas hipóteses. Formulação Seja dado um espaço de probabilidade e um grupo completo em pares ... ... Wikipedia

    Permite calcular a probabilidade de um evento de interesse através das probabilidades condicionais deste evento, assumindo determinadas hipóteses, bem como as probabilidades dessas hipóteses. Formulação Seja dado um espaço de probabilidade, e um grupo completo de eventos, como ... ... Wikipedia

    - (ou fórmula de Bayes) é um dos principais teoremas da teoria das probabilidades, que permite determinar a probabilidade de que um evento (hipótese) tenha ocorrido na presença apenas de evidências indiretas (dados) que podem ser imprecisas ... Wikipedia

    O teorema de Bayes é um dos principais teoremas da teoria da probabilidade elementar, que determina a probabilidade de um evento ocorrer sob condições em que apenas algumas informações parciais sobre eventos são conhecidas com base em observações. De acordo com a fórmula de Bayes, você pode ... ... Wikipedia

    Bayes, Thomas Thomas Bayes Reverendo Thomas Bayes Data de nascimento: 1702 (1702) Local de nascimento ... Wikipedia

    Thomas Bayes Reverendo Thomas Bayes Data de nascimento: 1702 (1702) Local de nascimento: Londres ... Wikipedia

    A inferência bayesiana é um dos métodos de inferência estatística, em que a fórmula de Bayes é usada para refinar estimativas probabilísticas da verdade das hipóteses quando as evidências chegam. O uso da atualização Bayesiana é especialmente importante em ... ... Wikipedia

    Você gostaria de melhorar este artigo?: Encontre e forneça notas de rodapé para referências a fontes autorizadas que confirmam o que foi escrito. Colocando notas de rodapé, faça indicações mais precisas das fontes. Pere... Wikipedia

    Os prisioneiros trairão uns aos outros, seguindo seus próprios interesses egoístas, ou permanecerão em silêncio, minimizando assim o prazo total? Dilema do prisioneiro (Eng. Dilema do prisioneiro, o nome "dilema" é menos comumente usado ... Wikipedia

Livros

  • Teoria da Probabilidade e Estatística Matemática em Problemas: Mais de 360 ​​Problemas e Exercícios, Borzykh D. O manual proposto contém problemas de vários níveis de complexidade. No entanto, a ênfase principal é colocada em tarefas de média complexidade. Isso é feito intencionalmente para incentivar os alunos a…

Formule e prove a fórmula da probabilidade total. Dê um exemplo de sua aplicação.

Se os eventos H 1 , H 2 , ..., H n são incompatíveis aos pares e pelo menos um desses eventos ocorre necessariamente durante cada teste, então para qualquer evento A a igualdade é verdadeira:

P(A)= PH1(A)P(H 1)+ PH2(A)P(H 2)+…+ PHn(A)P(H n) – fórmula de probabilidade total. Neste caso, H 1 , H 2 , …, H n são chamados de hipóteses.

Prova: O evento A divide-se em variantes: AH 1 , AH 2 , …, AH n . (A vem junto com H 1, etc.) Em outras palavras, temos A \u003d AH 1 + AH 2 + ... + AH n. Como H 1 , H 2 , …, H n são incompatíveis aos pares, os eventos AH 1 , AH 2 , …, AH n também são incompatíveis. Aplicando a regra da adição, encontramos: P (A) \u003d P (AH 1) + P (AH 2) + ... + P (AH n). Substituindo cada termo P(AH i) do lado direito pelo produto P Hi(A)P(H i), obtemos a igualdade requerida.

Exemplo:

Digamos que temos dois conjuntos de peças. A probabilidade de que a parte do primeiro conjunto seja padrão é 0,8 e a segunda é 0,9. Vamos encontrar a probabilidade de que uma peça tomada ao acaso seja padrão.

P(A) \u003d 0,5 * 0,8 + 0,5 * 0,9 \u003d 0,85.

Formule e prove a fórmula de Bayes. Dê um exemplo de sua aplicação.

Fórmula de Bayes:

Ele permite superestimar as probabilidades de hipóteses após o resultado do teste ser conhecido, como resultado do qual o evento A apareceu.

Prova: Deixe que o evento A possa ocorrer sob a condição de ocorrência de um dos eventos incompatíveis H 1 , H 2 , …, H n , formando um grupo completo. Como não se sabe de antemão quais desses eventos ocorrerão, eles são chamados de hipóteses.

A probabilidade de ocorrência do evento A é determinada pela fórmula da probabilidade total:

P(A)= PH1 (A)P(H 1)+ PH2 (A)P(H 2)+…+ PHn (A)P(H n) (1)

Suponhamos que um teste tenha sido realizado, como resultado de qual evento A. Vamos determinar como as probabilidades das hipóteses mudaram devido ao fato de o evento A já ter ocorrido. Em outras palavras, vamos procurar probabilidades condicionais

PA (H 1), PA (H 2), ..., PA (H n).

Pelo teorema da multiplicação temos:

P (AH i) \u003d P (A) P A (H i) \u003d P (H i) P Hi (A)

Vamos substituir P(A) aqui pela fórmula (1), obtemos

Exemplo:

Há três caixas idênticas. Na primeira caixa há n=12 bolas brancas, na segunda caixa há m=4 bolas brancas e n-m=8 bolas pretas, na terceira caixa há n=12 bolas pretas. Uma bola branca é retirada de uma caixa escolhida ao acaso. Encontre a probabilidade P de que a bola seja retirada da segunda caixa.

Solução.

4) Deduza uma fórmula para a probabilidadeksucesso na sérientestes de acordo com o esquema de Bernoulli.

Investigamos o caso quando n experimentos idênticos e independentes, cada um com apenas 2 resultados ( UMA;). Aqueles. alguma experiência é repetida n vezes, e em cada experiência algum evento MAS pode aparecer com probabilidade P(A)=q ou não aparecem com uma probabilidade P()=q-1=p .

O espaço de eventos elementares de cada série de teste contém pontos ou sequências de símbolos MAS e . Esse espaço de probabilidade é chamado de esquema de Bernoulli. A tarefa é, para isso, k encontre a probabilidade de que n- repetição repetida do evento de experiência MAS virá k uma vez.

Para maior clareza, vamos concordar com cada ocorrência do evento MAS considerado um sucesso MAS - como fracasso. Nosso objetivo é encontrar a probabilidade de que n experimentos exatamente k será bem sucedido; Vamos denotar este evento temporariamente por b.

Evento NO representado como a soma de uma série de eventos - opções de eventos NO. Para corrigir uma determinada variante, você precisa indicar o número desses experimentos que terminam em sucesso. Por exemplo, uma das opções é

. O número de todas as opções é, obviamente, , e a probabilidade de cada opção, devido à independência dos experimentos, é . Daí a probabilidade do evento NOé igual a . Para enfatizar a dependência da expressão resultante em n e k, vamos denotá-lo . Então, .

5) Usando a fórmula de Laplace aproximada integral, deduza uma fórmula para estimar o desvio da frequência relativa do evento A da probabilidade p da ocorrência de A em um experimento.

Sob as condições do esquema de Bernoulli com valores dados de n e p para um dado e>0, estimamos a probabilidade do evento , onde k é o número de sucessos em n experimentos. Esta desigualdade é equivalente a |k-np|£en, ou seja. -en £ k-np £ en ou np-en £ k £ np+en. Assim, estamos falando em obter uma estimativa para a probabilidade de um evento k 1 £ k £ k 2 , onde k 1 = np-en, k 2 = np+en. Aplicando a fórmula de Laplace aproximada integral, obtemos: P( » . Levando em conta a estranheza da função de Laplace, obtemos a igualdade aproximada P( » 2Ф .

Observação : Porque pela condição n=1, então substituímos 1 por n e obtemos a resposta final.

6) Deixe Xé uma variável aleatória discreta que assume apenas valores não negativos e tem uma expectativa matemática m. Prove que P(X≥ 4) ≤ m/ 4 .

m= (como o 1º termo é positivo, então se for removido, será menor) ³ (substituir uma por 4, será apenas menor) ³ = =4× P(X³4). Daqui P(X≥ 4) ≤ m/ 4 .

(Em vez de 4, pode haver qualquer número).

7) Prove que se X e S são variáveis ​​aleatórias discretas independentes que assumem um conjunto finito de valores, então M(XY)=M(X)M(Y)

x 1 x2
p1 p2

chamou um número M(XY)= x 1 p 1 + x 2 p 2 + ...

Se variáveis ​​aleatórias X e S são independentes, então a esperança matemática de seu produto é igual ao produto de suas expectativas matemáticas (teorema da multiplicação de expectativas matemáticas).

Prova: Valores possíveis X denotar x1, x2, …, valores possíveis S - s 1 , s 2, ... uma pij =P(X=xi, Y=yj). XY M(XY)= Tendo em conta a independência das quantidades X e S temos: P(X= xi, Y=yj)= P(X=xi) P(Y=yj). denotando P(X=xi)=ri, P(Y=yj)=sj, reescrevemos essa igualdade na forma p ij = r i s j

Nesse caminho, M(XY)= = . Transformando a igualdade resultante, obtemos: M(XY)=()() = M(X)M(Y), Q.E.D.

8) Prove que se X e S são variáveis ​​aleatórias discretas que assumem um conjunto finito de valores, então M(X+S) = M(X) +M(S).

A expectativa matemática de uma variável aleatória discreta com uma lei de distribuição

x 1 x2
p1 p2

chamou um número M(XY)= x 1 p 1 + x 2 p 2 + ...

A expectativa matemática da soma de duas variáveis ​​aleatórias é igual à soma das expectativas matemáticas dos termos: M(X+Y)= M(X)+M(Y).

Prova: Valores possíveis X denotar x1, x2, …, valores possíveis S - s 1 , s 2, ... uma pij =P(X=xi, Y=yj). Lei da distribuição de magnitude X+Y será expresso na tabela correspondente. M(X+Y)= .Esta fórmula pode ser reescrita da seguinte forma: M(X+Y)= .A primeira soma do lado direito pode ser representada como . A expressão é a probabilidade de que qualquer um dos eventos ocorra (X=x i , Y=y 1), (X=x i , Y=y 2), … Portanto, esta expressão é igual a P(X=x i). Daqui . Da mesma maneira, . Como resultado, temos: M(X+Y)= M(X)+M(Y), que deve ser provado.

9) Deixe Xé uma variável aleatória discreta distribuída de acordo com a lei de distribuição binomial com parâmetros n e R. Prove que M(X)=nr, D(X)=np(1-p).

Que seja produzido n ensaios independentes, em cada um dos quais o evento A pode ocorrer com uma probabilidade R, então a probabilidade do evento oposto Ā é igual a q=1-p. Considere sl. valor X- número de ocorrência do evento MAS dentro n experimentos. Vamos representar X como a soma dos indicadores do evento A para cada tentativa: X \u003d X 1 + X 2 + ... + X n. Agora vamos provar que M(Xi)=p, D(Xi)=np. Para fazer isso, considere a lei de distribuição cl. valores, que se parece com:

X
R R q

É óbvio que M(X)=p, a variável aleatória X 2 tem a mesma lei de distribuição, portanto D (X) \u003d M (X 2) -M 2 (X) \u003d p-p 2 \u003d p (1-p) \u003d pq. Nesse caminho, M(Xi)=p, D(Xi)=pq. De acordo com o teorema da adição de expectativas matemáticas M(X)=M(X 1)+..+M(Xn)=nr. Uma vez que as variáveis ​​aleatórias Х eu são independentes, então as variações também se somam: D(X)=D(X 1)+…+D(X n)=npq=np(1-p).

10) Deixe Xé uma variável aleatória discreta distribuída de acordo com a lei de Poisson com o parâmetro λ. Prove que M(X) = λ .

A lei de Poisson é dada pela tabela:

Daí temos:

Assim, o parâmetro λ, que caracteriza uma dada distribuição de Poisson, nada mais é do que a esperança matemática do valor X.

11) Seja X uma variável aleatória discreta distribuída de acordo com uma lei geométrica com parâmetro p. Prove que M(X) = .

A lei de distribuição geométrica está associada a uma sequência de tentativas de Bernoulli até o 1º evento bem sucedido A. A probabilidade de ocorrência do evento A em uma tentativa é igual a p, o evento oposto é q = 1-p. A lei de distribuição da variável aleatória X - o número de tentativas tem a forma:

X n
R R pq pq n-1

A série escrita entre parênteses é obtida pela diferenciação termo a termo de uma progressão geométrica

Consequentemente, .

12) Prove que o coeficiente de correlação das variáveis ​​aleatórias X e Y satisfaz a condição .

Definição: O coeficiente de correlação de duas variáveis ​​aleatórias é a razão de sua covariância pelo produto dos desvios padrão dessas variáveis: . .

Prova: Considere uma variável aleatória Z = . Vamos calcular sua variância. Como o lado esquerdo é não negativo, o lado direito é não negativo. Portanto, , |ρ|≤1.

13) Como é calculada a variância no caso de uma distribuição contínua com densidade f(x)? Prove que para uma variável aleatória X com densidade dispersão D(X) não existe, e a expectativa matemática M(X) existe.

A variância de uma variável aleatória absolutamente contínua X com a função densidade f(x) e a expectativa matemática m = M(X) é determinada pela mesma igualdade que para a variável discreta

No caso em que uma variável aleatória absolutamente contínua X está concentrada no intervalo ,

∞ - a integral diverge, portanto, a dispersão não existe.

14) Prove que para uma variável aleatória normal X com uma função de densidade de distribuição esperança matemática М(Х) = μ.

Fórmula

Vamos provar que μ é a esperança matemática.

Pela definição da expectativa matemática de uma r.v. contínua,

Vamos introduzir uma nova variável. Daqui. Levando em conta que os novos limites de integração são iguais aos antigos, obtemos

O primeiro dos termos é igual a zero devido à estranheza do integrando. O segundo dos termos é μ (integral de Poisson ).

Então, M(X)=μ, ou seja a esperança matemática da distribuição normal é igual ao parâmetro μ.

15) Prove que para uma variável aleatória normal X com uma função de densidade de distribuição dispersão D(X) = σ2.

Fórmula descreve a densidade da distribuição de probabilidade normal de uma r.v contínua.

Vamos provar que é o desvio padrão da distribuição normal. Vamos introduzir uma nova variável z=(х-μ)/ . Daqui . Levando em conta que os novos limites de integração são iguais aos antigos, obtemos Integrando por partes, definindo u=z, encontramos Portanto, .Então, o desvio padrão da distribuição normal é igual ao parâmetro .

16) Prove que para uma variável aleatória contínua distribuída de acordo com uma lei exponencial com um parâmetro , a esperança matemática é .

Diz-se que uma variável aleatória X, que assume apenas valores não negativos, é distribuída de acordo com uma lei exponencial se, para algum parâmetro positivo λ>0, a função densidade tiver a forma:

Para encontrar a esperança matemática, usamos a fórmula

O teorema de Bayes é descrito em detalhes em um artigo separado. Este é um trabalho maravilhoso, mas tem 15.000 palavras. A própria essência do teorema é brevemente explicada na mesma tradução do artigo de Kalid Azad.

  • Os resultados de pesquisas e testes não são eventos. Existe um método para diagnosticar o câncer, mas existe o evento em si - a presença da doença. O algoritmo verifica se a mensagem contém spam, mas o evento (o spam realmente chegou ao correio) deve ser considerado separadamente do resultado de seu trabalho.
  • Há erros nos resultados do teste. Muitas vezes nossos métodos de pesquisa revelam o que não é (falso positivo) e não revelam o que é (falso negativo).
  • Com a ajuda de testes, obtemos as probabilidades de um determinado resultado. Muitas vezes analisamos os resultados dos testes sozinhos e não levamos em consideração os erros de método.
  • Resultados falsos positivos distorcem a imagem. Suponha que você esteja tentando detectar algum fenômeno muito raro (1 em 1.000.000). Mesmo que seu método seja preciso, é provável que seu resultado positivo seja realmente um falso positivo.
  • É mais conveniente trabalhar com números naturais. Melhor dizer: 100 de 10.000, não 1%. Com esta abordagem, haverá menos erros, especialmente ao multiplicar. Digamos que precisamos trabalhar ainda mais nesse 1%. O raciocínio em porcentagens é desajeitado: "em 80% dos casos de 1% obteve um resultado positivo". Informações muito mais fáceis são percebidas da seguinte forma: "em 80 casos em 100, foi observado um resultado positivo".
  • Mesmo na ciência, qualquer fato é apenas o resultado da aplicação de algum método. Do ponto de vista filosófico, um experimento científico é apenas um teste com um provável erro. Existe um método que revela uma substância química ou algum fenômeno, e existe um evento em si - a presença desse fenômeno. Nossos métodos de teste podem dar um resultado falso, e qualquer equipamento tem um erro inerente.
O teorema de Bayes transforma os resultados dos testes em probabilidades de eventos.
  • Se soubermos a probabilidade de um evento e a probabilidade de falsos positivos e falsos negativos, podemos corrigir os erros de medição.
  • O teorema correlaciona a probabilidade de um evento com a probabilidade de um determinado resultado. Podemos relacionar Pr(A|X): a probabilidade de um evento A dado um resultado X, e Pr(X|A): a probabilidade de um resultado X dado um evento A.

Entendendo o Método

O artigo referenciado no início deste ensaio discute o método diagnóstico (mamografia) que detecta o câncer de mama. Vamos considerar este método em detalhes.
  • 1% de todas as mulheres têm câncer de mama (e, portanto, 99% não ficam doentes)
  • 80% das mamografias detectam a doença quando ela realmente é (e, portanto, 20% não detectam)
  • 9,6% dos estudos detectam câncer quando não há nenhum (e, portanto, 90,4% relatam corretamente um resultado negativo)
Agora vamos criar uma tabela assim:

Como trabalhar com esses dados?
  • 1% das mulheres tem câncer de mama
  • se o paciente tiver uma doença, olhe na primeira coluna: há 80% de chance de que o método tenha dado o resultado correto e 20% de chance de que o resultado do estudo esteja incorreto (falso negativo)
  • se o paciente não tiver sido diagnosticado com a doença, observe a segunda coluna. Com uma probabilidade de 9,6% podemos dizer que o resultado positivo do estudo está incorreto, e com uma probabilidade de 90,4% podemos dizer que o paciente está realmente saudável.

Quão preciso é o método?

Agora vamos ver o resultado positivo do teste. Qual é a probabilidade de uma pessoa estar realmente doente: 80%, 90%, 1%?

Vamos pensar:

  • Há um resultado positivo. Analisaremos todos os resultados possíveis: o resultado obtido pode ser tanto verdadeiro positivo quanto falso positivo.
  • A probabilidade de um resultado positivo verdadeiro é igual a: a probabilidade de adoecer multiplicada pela probabilidade de o teste realmente detectar a doença. 1% * 80% = 0,008
  • A probabilidade de um resultado falso positivo é igual a: a probabilidade de a doença não estar presente, multiplicada pela probabilidade de o método detectar a doença incorretamente. 99% * 9,6% = 0,09504
Agora a tabela está assim:

Qual é a probabilidade de uma pessoa estar realmente doente se um resultado de mamografia positivo for obtido? A probabilidade de um evento é a razão entre o número de resultados possíveis de um evento e o número total de todos os resultados possíveis.

Probabilidade do Evento = Resultados do Evento / Todos os Resultados Possíveis

A probabilidade de um resultado positivo verdadeiro é 0,008. A probabilidade de um resultado positivo é a probabilidade de um resultado positivo verdadeiro + a probabilidade de um resultado falso positivo.

(.008 + 0.09504 = .10304)

Assim, a probabilidade de uma doença com resultado positivo do estudo é calculada da seguinte forma: 0,008 / 0,10304 = 0,0776. Este valor é de cerca de 7,8%.

Ou seja, um resultado de mamografia positivo significa apenas que a probabilidade de ter uma doença é de 7,8%, e não de 80% (este último valor é apenas a precisão estimada do método). Tal resultado parece incompreensível e estranho no início, mas você precisa considerar: o método dá um resultado falso positivo em 9,6% dos casos (e isso é bastante), então haverá muitos resultados falsos positivos na amostra. Para uma doença rara, a maioria dos resultados positivos serão falsos positivos.

Vamos correr nossos olhos sobre a mesa e tentar entender intuitivamente o significado do teorema. Se temos 100 pessoas, apenas uma delas tem a doença (1%). Nesta pessoa, com 80% de probabilidade, o método dará um resultado positivo. Dos 99% restantes, 10% terão resultados positivos, o que nos dá, grosso modo, 10 falsos positivos em 100. Se considerarmos todos os resultados positivos, apenas 1 em 11 será verdadeiro. Assim, se for obtido um resultado positivo, a probabilidade da doença é de 1/11.

Acima, calculamos que essa probabilidade é igual a 7,8%, ou seja, o número é na verdade mais próximo de 1/13, mas aqui, com um raciocínio simples, conseguimos encontrar uma estimativa aproximada sem uma calculadora.

teorema de Bayes

Agora vamos descrever o curso de nossos pensamentos com uma fórmula, que é chamada de teorema de Bayes. Este teorema permite corrigir os resultados do estudo de acordo com a distorção que os resultados falsos positivos introduzem:
  • Pr(A|X) = probabilidade de doença (A) com resultado positivo (X). Isso é exatamente o que queremos saber: qual é a probabilidade de um evento no caso de um resultado positivo. No nosso exemplo, é igual a 7,8%.
  • Pr(X|A) = probabilidade de resultado positivo (X) no caso em que o paciente está realmente doente (A). No nosso caso, este é o valor do verdadeiro positivo - 80%
  • Pr(A) = probabilidade de ficar doente (1%)
  • Pr(não A) = probabilidade de não ficar doente (99%)
  • Pr(X|not A) = probabilidade de um resultado positivo do estudo se não houver doença. Este é o valor de falsos positivos - 9,6%.
Podemos concluir que para obter a probabilidade de um evento, você precisa dividir a probabilidade de um resultado positivo verdadeiro pela probabilidade de todos os resultados positivos. Agora podemos simplificar a equação:
Pr(X) é a constante de normalização. Ela nos serviu bem: sem ela, um resultado positivo do teste nos daria 80% de chance de um evento.
Pr(X) é a probabilidade de qualquer resultado positivo, seja um verdadeiro positivo em um estudo de paciente (1%) ou um falso positivo em um estudo saudável (99%).

Em nosso exemplo, Pr(X) é um número bastante grande porque há uma alta probabilidade de resultados falsos positivos.

Pr(X) produz um resultado de 7,8%, o que à primeira vista parece contra-intuitivo.

O significado do teorema

Estamos testando para descobrir o verdadeiro estado das coisas. Se nossos testes forem perfeitos e precisos, então as probabilidades de tentativas e as probabilidades de eventos coincidirão. Todos os resultados positivos serão verdadeiramente positivos e os resultados negativos serão negativos. Mas vivemos no mundo real. E em nosso mundo, os testes dão resultados errados. O teorema de Bayes considera resultados distorcidos, corrige erros, reconstrói a população e encontra a probabilidade de um resultado positivo verdadeiro.

Filtro de spam

O teorema de Bayes é aplicado com sucesso em filtros de spam.

Nós temos:

  • evento A - em um email de spam
  • o resultado do teste é o conteúdo de certas palavras na carta:

O filtro leva em consideração os resultados do teste (conteúdo de determinadas palavras no e-mail) e prevê se o e-mail contém spam. Todo mundo entende que, por exemplo, a palavra "Viagra" é mais comum em spam do que em e-mails comuns.

O filtro de spam baseado em lista negra tem a desvantagem de frequentemente produzir falsos positivos.

O filtro de spam Bayesiano adota uma abordagem ponderada e razoável: trabalha com probabilidades. Quando analisamos as palavras em um e-mail, podemos calcular a probabilidade de que o e-mail seja spam em vez de tomar decisões de sim/não. Se houver 99% de chance de que o e-mail contenha spam, então o e-mail é realmente spam.

Com o tempo, o filtro treina em uma amostra cada vez maior e atualiza as probabilidades. Por exemplo, filtros avançados baseados no teorema de Bayes verificam muitas palavras seguidas e as usam como dados.

Fontes adicionais:

Etiquetas: adicionar etiquetas