Fórmula de Bayes quando aplicada. Uma explicação simples do teorema de Bayes

Fórmula de Bayes quando aplicada.  Uma explicação simples do teorema de Bayes
Fórmula de Bayes quando aplicada. Uma explicação simples do teorema de Bayes

Ao derivar a fórmula probabilidade total o evento deveria MAS, cuja probabilidade deveria ser determinada, poderia acontecer a um dos eventos H 1 , N 2 , ... , H n, formando um grupo completo de eventos incompatíveis aos pares. As probabilidades desses eventos (hipóteses) eram conhecidas de antemão. Suponhamos que um experimento tenha sido realizado, como resultado do qual o evento MAS chegou. este informação adicional permite reavaliar as probabilidades de hipóteses Oi , tendo calculado P(Hi/A).

ou, usando a fórmula de probabilidade total, obtemos

Essa fórmula é chamada de fórmula de Bayes ou teorema da hipótese. A fórmula de Bayes permite "revisar" as probabilidades das hipóteses depois que o resultado do experimento se torna conhecido, como resultado do qual o evento apareceu MAS.

Probabilidades Р(Нi) são as probabilidades a priori das hipóteses (foram calculadas antes do experimento). As probabilidades P(H i/A) são as probabilidades a posteriori das hipóteses (são calculadas após o experimento). A fórmula de Bayes permite calcular as probabilidades posteriores a partir de suas probabilidades anteriores e das probabilidades condicionais do evento MAS.

Exemplo. Sabe-se que 5% de todos os homens e 0,25% de todas as mulheres são daltônicos. Uma pessoa selecionada aleatoriamente pelo número do cartão médico sofre de daltonismo. Qual a probabilidade de ser um homem?

Solução. Evento MAS A pessoa é daltônica. O espaço de eventos elementares para o experimento - uma pessoa é selecionada pelo número do cartão médico - Ω = ( H 1 , N 2 ) consiste em 2 eventos:

H 1 - um homem é selecionado,

H 2 - uma mulher é selecionada.

Esses eventos podem ser escolhidos como hipóteses.

De acordo com a condição do problema (escolha aleatória), as probabilidades desses eventos são as mesmas e iguais a P(H 1 ) = 0.5; P(H 2 ) = 0.5.

Em que probabilidades condicionais o fato de uma pessoa sofrer de daltonismo são iguais, respectivamente:

FRIGIDEIRA 1 ) = 0.05 = 1/20; FRIGIDEIRA 2 ) = 0.0025 = 1/400.

Como se sabe que a pessoa selecionada é daltônica, ou seja, o evento ocorreu, utilizamos a fórmula de Bayes para reavaliar a primeira hipótese:

Exemplo. Há três caixas idênticas. A primeira caixa contém 20 bolas brancas, a segunda caixa contém 10 bolas brancas e 10 pretas e a terceira caixa contém 20 bolas pretas. Uma bola branca é retirada de uma caixa escolhida ao acaso. Calcule a probabilidade de que a bola seja retirada da primeira caixa.

Solução. Denotado por MAS evento - aparência bola branca. Três suposições (hipóteses) podem ser feitas sobre a escolha da caixa: H 1 ,H 2 , H 3 - seleção da primeira, segunda e terceira caixas, respectivamente.

Como a escolha de qualquer uma das caixas é igualmente possível, as probabilidades das hipóteses são as mesmas:

P(H 1 )=P(H 2 )=P(H 3 )= 1/3.

De acordo com a condição do problema, a probabilidade de tirar uma bola branca da primeira caixa

Probabilidade de tirar uma bola branca da segunda caixa



Probabilidade de tirar uma bola branca da terceira caixa

Encontramos a probabilidade desejada usando a fórmula de Bayes:

Repetição de testes. Fórmula de Bernoulli.

Existem n tentativas, em cada uma das quais o evento A pode ou não ocorrer, e a probabilidade do evento A em cada tentativa individual é constante, ou seja, não muda de experiência para experiência. Já sabemos como encontrar a probabilidade de um evento A em um experimento.

De especial interesse é a probabilidade de ocorrência de um certo número de vezes (m vezes) do evento A em n experimentos. tais problemas são facilmente resolvidos se os testes forem independentes.

Def. Vários testes são chamados independente em relação ao evento A se a probabilidade do evento A em cada um deles não depender dos resultados de outros experimentos.

A probabilidade P n (m) da ocorrência do evento A exatamente m vezes (não ocorrência n-m vezes, evento ) nessas n tentativas. O evento A aparece em uma variedade de sequências m vezes).

- Fórmula de Bernoulli.

As seguintes fórmulas são óbvias:

P n (m menos k vezes em n tentativas.

P n (m>k) = P n (k+1) + P n (k+2) +…+ P n (n) - probabilidade de ocorrência do evento A mais k vezes em n tentativas.

Formulário de eventos grupo completo, se pelo menos um deles ocorrer necessariamente como resultado do experimento e forem inconsistentes aos pares.

Vamos supor que o evento UMA só pode ocorrer em conjunto com um dos vários eventos incompatíveis em pares que formam um grupo completo. Vamos chamar os eventos eu= 1, 2,…, n) hipóteses experiência adicional (a priori). A probabilidade de ocorrência do evento A é determinada pela fórmula probabilidade total :

Exemplo 16 São três urnas. A primeira urna contém 5 bolas brancas e 3 pretas, a segunda urna contém 4 bolas brancas e 4 pretas e a terceira urna contém 8 bolas brancas. Uma das urnas é escolhida ao acaso (isso pode significar, por exemplo, que uma seleção é feita a partir de uma urna auxiliar contendo três bolas numeradas 1, 2 e 3). Uma bola é retirada ao acaso desta urna. Qual é a probabilidade de ser preto?

Solução. Evento UMA– bola preta é sorteada. Se fosse conhecido de qual urna a bola é retirada, então a probabilidade necessária poderia ser calculada de acordo com a definição clássica de probabilidade. Vamos introduzir suposições (hipóteses) sobre qual urna é escolhida para extrair a bola.

A bola pode ser retirada da primeira urna (hipótese ), ou da segunda (hipótese ), ou da terceira (hipótese ). Como há chances iguais de escolher qualquer uma das urnas, então .

Daí segue que

Exemplo 17. As lâmpadas elétricas são fabricadas em três fábricas. A primeira planta produz 30% total lâmpadas elétricas, o segundo - 25%,
e o terceiro para o resto. Os produtos da primeira fábrica contêm 1% de lâmpadas elétricas defeituosas, a segunda - 1,5%, a terceira - 2%. A loja recebe produtos das três fábricas. Qual é a probabilidade de que uma lâmpada comprada em uma loja seja defeituosa?

Solução. As suposições devem ser inseridas quanto à fábrica em que a lâmpada foi fabricada. Sabendo disso, podemos encontrar a probabilidade de que seja defeituoso. Vamos introduzir a notação para eventos: UMA– a lâmpada elétrica adquirida apresentou defeito, – a lâmpada foi fabricada pela primeira fábrica, – a lâmpada foi fabricada pela segunda fábrica,
– a lâmpada é fabricada pela terceira fábrica.

A probabilidade desejada é encontrada pela fórmula de probabilidade total:

Fórmula de Bayes. Deixar - grupo completo eventos incompatíveis aos pares (hipótese). MASé um evento aleatório. Então,

A última fórmula que permite superestimar as probabilidades das hipóteses após o resultado do teste ser conhecido, como resultado do qual o evento A apareceu, é chamado Fórmula de Bayes .

Exemplo 18. Uma média de 50% dos pacientes com a doença são internados em um hospital especializado Para, 30% com doença eu, 20 % –
com doença M. A probabilidade de uma cura completa da doença Ké igual a 0,7 para doenças eu e M essas probabilidades são respectivamente 0,8 e 0,9. O paciente internado no hospital recebeu alta saudável. Encontre a probabilidade de que esse paciente tenha a doença K.


Solução. Apresentamos hipóteses: - o paciente sofria de uma doença Para eu, o paciente sofria da doença M.

Então, pela condição do problema, temos . Vamos apresentar um evento MAS O paciente internado no hospital recebeu alta saudável. Por condição

Pela fórmula da probabilidade total, temos:

Fórmula de Bayes.

Exemplo 19. Sejam cinco bolas na urna e todas as suposições sobre o número de bolas brancas são igualmente prováveis. Uma bola é retirada ao acaso da urna e ela é branca. Qual é a suposição mais provável sobre a composição inicial da urna?

Solução. Seja a hipótese de que na urna de bolas brancas , ou seja, é possível fazer seis suposições. Então, pela condição do problema, temos .

Vamos apresentar um evento MAS Uma bola branca sorteada aleatoriamente. Vamos calcular. Como , então pela fórmula de Bayes temos:

Assim, a hipótese é a mais provável, pois .

Exemplo 20. Dois dos três elementos de operação independente do dispositivo de computação falharam. Encontre a probabilidade de falha do primeiro e segundo elementos se as probabilidades de falha do primeiro, segundo e terceiro elementos forem respectivamente iguais a 0,2; 0,4 e 0,3.

Solução. Denotado por MAS evento - dois elementos falharam. As seguintes hipóteses podem ser feitas:

- o primeiro e o segundo elementos falharam e o terceiro elemento pode ser reparado. Como os elementos funcionam independentemente, o teorema da multiplicação se aplica:

Quem é Bayes? E o que isso tem a ver com gestão? – pode ser seguido por uma pergunta bastante justa. Por enquanto, acredite: isso é muito importante! .. e interessante (pelo menos para mim).

Em que paradigma a maioria dos gerentes opera: se observo algo, que conclusões posso tirar disso? O que Bayes ensina: o que deve ser de fato para que eu observe esse algo? É assim que todas as ciências se desenvolvem, e ele escreve sobre isso (cito de memória): uma pessoa que não tem uma teoria na cabeça fugirá de uma ideia para outra sob a influência de varios eventos(observações). Não é à toa que dizem: não há nada mais prático do que uma boa teoria.

Um exemplo da prática. Meu subordinado comete um erro, e meu colega (chefe de outro departamento) diz que seria necessário exercer influência gerencial sobre o funcionário negligente (ou seja, punir/repreender). E eu sei que esse funcionário faz de 4 a 5 mil operações do mesmo tipo por mês e, durante esse período, ele não comete mais de 10 erros. Sente a diferença no paradigma? Meu colega reage à observação, e eu tenho conhecimento a priori que um funcionário comete um certo número de erros, para que mais um não afete esse conhecimento ... por exemplo, 15 desses erros! .. Isso já se tornará um motivo para investigar as causas da não conformidade com as normas.

Convencido da importância da abordagem Bayesiana? Intrigado? Espero que sim". E agora uma mosca na pomada. Infelizmente, as ideias bayesianas raramente são dadas de primeira. Sinceramente, tive azar, pois conheci essas idéias através da literatura popular, após a leitura que muitas dúvidas permaneceram. Ao planejar escrever uma nota, coletei tudo o que havia delineado anteriormente de acordo com Bayes e também estudei o que eles escrevem na Internet. Apresento a vocês meu melhor palpite sobre o tema. Introdução à Probabilidade Bayesiana.

Derivação do teorema de Bayes

Considere o seguinte experimento: nomeamos qualquer número situado no segmento e fixamos quando esse número está, por exemplo, entre 0,1 e 0,4 (Fig. 1a). A probabilidade deste evento é igual à razão entre o comprimento do segmento e o comprimento total do segmento, desde que a ocorrência de números no segmento equiprovável. Matematicamente, isso pode ser escrito p(0,1 <= x <= 0,4) = 0,3, или кратко R(X) = 0,3, onde R- probabilidade, Xé uma variável aleatória no intervalo , Xé uma variável aleatória no intervalo . Ou seja, a probabilidade de acertar o segmento é de 30%.

Arroz. 1. Interpretação gráfica de probabilidades

Agora considere o quadrado x (Fig. 1b). Digamos que temos que nomear pares de números ( x, y), cada um dos quais é maior que zero e menor que um. A probabilidade de que x(primeiro número) estará dentro do segmento (área azul 1), igual à razão entre a área da área azul e a área de todo o quadrado, ou seja, (0,4 - 0,1 ) * (1 - 0) / (1 * 1) \u003d 0, 3, ou seja, os mesmos 30%. A probabilidade de que y está dentro do segmento (área verde 2) é igual à razão entre a área da área verde e a área de todo o quadrado p(0,5 <= y <= 0,7) = 0,2, или кратко R(S) = 0,2.

O que pode ser aprendido sobre os valores ao mesmo tempo x e y. Por exemplo, qual é a probabilidade de que ambos x e y estão nos segmentos dados correspondentes? Para fazer isso, você precisa calcular a proporção da área do domínio 3 (a interseção das listras verdes e azuis) para a área de todo o quadrado: p(X, S) = (0,4 – 0,1) * (0,7 – 0,5) / (1 * 1) = 0,06.

Agora suponha que queremos saber qual é a probabilidade de que y está no intervalo se x já está na faixa. Ou seja, de fato, temos um filtro e quando chamamos pares ( x, y), então descartamos imediatamente os pares que não satisfazem a condição para encontrar x em um determinado intervalo, e então dos pares filtrados contamos aqueles para os quais y satisfaça nossa condição e considere a probabilidade como a razão do número de pares para os quais y encontra-se no segmento acima para o número total de pares filtrados (ou seja, para os quais x encontra-se no segmento). Podemos escrever essa probabilidade como p(S|X no X acertar no intervalo." Obviamente, essa probabilidade é igual à razão entre a área da área 3 e a área da área azul 1. A área da área 3 é (0,4 - 0,1) * (0,7 - 0,5) = 0,06, e a área da área azul 1 ( 0,4 - 0,1) * (1 - 0) = 0,3, então sua proporção é 0,06 / 0,3 = 0,2. Em outras palavras, a probabilidade de encontrar y no segmento, desde que x pertence ao segmento p(S|X) = 0,2.

No parágrafo anterior, formulamos a identidade: p(S|X) = p(X, S) /p( X). Lê-se: "probabilidade de acertar no na faixa, desde que X acerto no intervalo é igual à razão da probabilidade de acerto simultâneo X na faixa e no no intervalo, para a probabilidade de acertar X dentro do intervalo."

Por analogia, considere a probabilidade p(X|S). chamamos de casais x, y) e filtrar aqueles para os quais y situa-se entre 0,5 e 0,7, então a probabilidade de que x está no segmento desde que y pertence ao segmento é igual à razão entre a área da área 3 e a área da área verde 2: p(X|S) = p(X, S) / p(S).

Observe que as probabilidades p(X, S) e p(Y, X) são iguais, e ambos são iguais à razão entre a área da zona 3 e a área de todo o quadrado, mas as probabilidades p(S|X) e p(X|S) não igual; enquanto a probabilidade p(S|X) é igual à razão entre a área da área 3 e a área 1, e p(X|S) – domínio 3 para domínio 2. Observe também que p(X, S) é frequentemente indicado como p(X&S).

Então temos duas definições: p(S|X) = p(X, S) /p( X) e p(X|S) = p(X, S) / p(S)

Vamos reescrever essas igualdades como: p(X, S) = p(S|X)*p( X) e p(X, S) = p(X|S) * p(S)

Como os lados esquerdos são iguais, os direitos também são: p(S|X)*p( X) = p(X|S) * p(S)

Ou podemos reescrever a última igualdade como:

Este é o teorema de Bayes!

É possível que transformações tão simples (quase tautológicas) dêem origem a um grande teorema!? Não se apresse em conclusões. Vamos falar novamente sobre o que temos. Havia alguma probabilidade inicial (a priori) R(X) que a variável aleatória X uniformemente distribuído no segmento está dentro do intervalo X. Algum evento aconteceu S, com o qual obtivemos a probabilidade a posteriori da mesma variável aleatória X: R(X|Y), e esta probabilidade difere de R(X) pelo coeficiente . Evento S chamado de evidência, mais ou menos confirmando ou refutando X. Este coeficiente é às vezes chamado poder da evidência. Quanto mais poderosa a evidência, mais o fato da observação Y muda a probabilidade anterior, mais a probabilidade posterior difere da anterior. Se a evidência for fraca, o posterior é quase igual ao anterior.

Fórmula de Bayes para variáveis ​​aleatórias discretas

Na seção anterior, derivamos a fórmula de Bayes para variáveis ​​aleatórias contínuas x e y definidas no intervalo . Considere um exemplo com variáveis ​​aleatórias discretas, cada uma assumindo dois valores possíveis. Durante os exames médicos de rotina, verificou-se que, aos quarenta anos, 1% das mulheres sofrem de câncer de mama. 80% das mulheres com câncer obtêm resultados de mamografia positivos. 9,6% das mulheres saudáveis ​​também obtêm resultados de mamografia positivos. Durante o exame, uma mulher dessa faixa etária recebeu um resultado de mamografia positivo. Qual é a probabilidade de que ela realmente tenha câncer de mama?

O curso de raciocínio/cálculos é o seguinte. Do 1% de pacientes com câncer, a mamografia dará 80% de resultados positivos = 1% * 80% = 0,8%. De 99% das mulheres saudáveis, a mamografia dará 9,6% de resultados positivos = 99% * 9,6% = 9,504%. No total, dos 10,304% (9,504% + 0,8%) com mamografia positiva, apenas 0,8% está doente e os 9,504% restantes são saudáveis. Assim, a probabilidade de uma mulher com mamografia positiva ter câncer é de 0,8% / 10,304% = 7,764%. Você achou que 80% ou mais?

Em nosso exemplo, a fórmula de Bayes assume a seguinte forma:

Vamos falar mais uma vez sobre o significado "físico" desta fórmula. Xé uma variável aleatória (diagnóstico), que assume os seguintes valores: X 1- doente e X 2- saudável; S– variável aleatória (resultado da medição - mamografia), que assume os valores: Y 1- um resultado positivo e Y2- resultado negativo; p(X 1)- a probabilidade de doença antes da mamografia (probabilidade a priori), igual a 1%; R(S 1 |X 1 ) - a probabilidade de um resultado positivo se o paciente estiver doente (probabilidade condicional, pois deve ser especificada nas condições do problema), igual a 80%; R(S 1 |X 2 ) – a probabilidade de resultado positivo se o paciente for saudável (também probabilidade condicional), igual a 9,6%; p(X 2)- a probabilidade de a paciente estar saudável antes da mamografia (probabilidade a priori), igual a 99%; p(X 1|S 1 ) – a probabilidade de que o paciente esteja doente, dado um resultado de mamografia positivo (probabilidade posterior).

Pode-se ver que a probabilidade posterior (o que estamos procurando) é proporcional à probabilidade anterior (inicial) com um coeficiente um pouco mais complexo . Vou enfatizar novamente. Na minha opinião, esse é um aspecto fundamental da abordagem bayesiana. Dimensão ( S) acrescentou certa quantidade de informações às inicialmente disponíveis (a priori), o que esclareceu nosso conhecimento sobre o objeto.

Exemplos

Para consolidar o material abordado, tente resolver vários problemas.

Exemplo 1 Existem 3 urnas; nas primeiras 3 bolas brancas e 1 preta; na segunda - 2 bolas brancas e 3 pretas; no terceiro - 3 bolas brancas. Alguém se aproxima aleatoriamente de uma das urnas e retira 1 bola dela. Esta bola é branca. Encontre as probabilidades posteriores de que a bola seja retirada da 1ª, 2ª, 3ª urna.

Solução. Temos três hipóteses: H 1 = (primeira urna selecionada), H 2 = (segunda urna selecionada), H 3 = (terceira urna selecionada). Como a urna é escolhida ao acaso, as probabilidades a priori das hipóteses são: Р(Н 1) = Р(Н 2) = Р(Н 3) = 1/3.

Como resultado do experimento, o evento A = apareceu (uma bola branca foi retirada da urna selecionada). Probabilidades condicionais do evento A sob as hipóteses H 1, H 2, H 3: P(A|H 1) = 3/4, P(A|H 2) = 2/5, P(A|H 3) = 1. Por exemplo, a primeira igualdade fica assim: “a probabilidade de tirar uma bola branca se a primeira urna for escolhida é 3/4 (já que há 4 bolas na primeira urna e 3 delas são brancas)”.

Aplicando a fórmula de Bayes, encontramos as probabilidades posteriores das hipóteses:

Assim, à luz das informações sobre a ocorrência do evento A, as probabilidades das hipóteses mudaram: a mais provável passou a ser a hipótese H 3 , a menos provável - a hipótese H 2 .

Exemplo 2 Dois atiradores atiram independentemente no mesmo alvo, cada um disparando um tiro. A probabilidade de acertar o alvo para o primeiro atirador é de 0,8, para o segundo - 0,4. Após o disparo, um buraco foi encontrado no alvo. Encontre a probabilidade de que este buraco pertença ao primeiro lançador (descartamos o resultado (ambos os buracos coincidiram) como pouco improvável).

Solução. Antes do experimento, as seguintes hipóteses são possíveis: H 1 = (nem a primeira nem a segunda flecha acertarão), H 2 = (ambas as flechas acertarão), H 3 - (o primeiro atirador acertará e o segundo não acertará ), H 4 = (o primeiro atirador não acertará e o segundo acertará). Probabilidades prévias de hipóteses:

P (H 1) \u003d 0,2 * 0,6 \u003d 0,12; P (H 2) \u003d 0,8 * 0,4 \u003d 0,32; P (H 3) \u003d 0,8 * 0,6 \u003d 0,48; P (H 4) \u003d 0,2 * 0,4 \u003d 0,08.

As probabilidades condicionais do evento observado A = (há um buraco no alvo) sob essas hipóteses são: P(A|H 1) = P(A|H 2) = 0; P(A|H 3) = P(A|H 4) = 1

Após a experiência, as hipóteses H 1 e H 2 tornam-se impossíveis, e as probabilidades posteriores das hipóteses H 3 e H 4 segundo a fórmula de Bayes serão:

Bayes contra spam

A fórmula de Bayes encontrou ampla aplicação no desenvolvimento de filtros de spam. Digamos que você queira treinar um computador para determinar quais e-mails são spam. Começaremos a partir do dicionário e combinações de palavras usando estimativas Bayesianas. Vamos primeiro criar um espaço de hipóteses. Vamos ter 2 hipóteses a respeito de qualquer carta: H A é spam, H B não é spam, mas uma carta normal e necessária.

Primeiro, vamos "treinar" nosso futuro sistema anti-spam. Vamos pegar todas as letras que temos e dividi-las em dois "montões" de 10 letras. Colocamos cartas de spam em um e chamamos de heap H A, no outro colocamos a correspondência necessária e chamamos de heap H B. Agora vamos ver: quais palavras e frases são encontradas no spam e e-mails necessários e com que frequência? Essas palavras e frases serão chamadas de evidência e denotadas por E 1 , E 2 ... Acontece que palavras comumente usadas (por exemplo, as palavras “como”, “seu”) nas pilhas H A e H B ocorrem com aproximadamente o mesma frequência. Assim, a presença dessas palavras em uma carta não nos diz nada sobre a qual pilha ela pertence (evidência fraca). Vamos atribuir a essas palavras um valor neutro da estimativa da probabilidade de "spam", digamos, 0,5.

Deixe a frase "Inglês conversacional" aparecer em apenas 10 letras e com mais frequência em e-mails de spam (por exemplo, em 7 e-mails de spam de todos os 10) do que nos corretos (em 3 de 10). Vamos dar a esta frase uma pontuação mais alta de 7/10 para spam e uma pontuação mais baixa para e-mails normais: 3/10. Por outro lado, descobriu-se que a palavra "amigo" era mais comum em letras normais (6 em ​​10). E assim recebemos uma pequena carta: “Amigo! Como é o seu inglês falado?. Vamos tentar avaliar seu "spamness". Vamos colocar as estimativas gerais P(HA), P(H B) de pertencer a cada heap usando uma fórmula de Bayes um tanto simplificada e nossas estimativas aproximadas:

P(HA) = A/(A+B), Onde A \u003d p a1 * p a2 * ... * pan, B \u003d p b1 * p b2 * ... * p b n \u003d (1 - p a1) * (1 - p a2) * ... * ( 1 - pa).

Tabela 1. Avaliação Bayesiana simplificada (e incompleta) da escrita

Assim, nossa carta hipotética recebeu uma avaliação da probabilidade de pertencimento com ênfase na direção do "spam". Podemos decidir jogar a carta em uma das pilhas? Vamos definir os limites de decisão:

  • Vamos supor que a letra pertence ao heap H i se P(H i) ≥ T.
  • A letra não pertence ao heap se P(H i) ≤ L.
  • Se L ≤ P(H i) ≤ T, então nenhuma decisão pode ser tomada.

Você pode tomar T = 0,95 e L = 0,05. Já para a carta em questão e 0,05< P(H A) < 0,95, и 0,05 < P(H В) < 0,95, то мы не сможем принять решение, куда отнести данное письмо: к спаму (H A) или к нужным письмам (H B). Можно ли улучшить оценку, используя больше информации?

Sim. Vamos calcular a pontuação para cada evidência de uma maneira diferente, assim como Bayes sugeriu. Deixar:

F a é o número total de emails de spam;

F ai é o número de letras com um certificado eu em uma pilha de spam;

F b é o número total de letras necessárias;

F bi é o número de letras com um certificado eu em uma pilha de cartas necessárias (relevantes).

Então: p ai = F ai /F a , p bi = F bi /F b . P(HA) = A/(A+B), P(H B) = B/(A+B), OndeÀ = p a1 *p a2 *…*p an , B = p b1 *p b2 *…*p b n

Observe que as pontuações das evidências de palavras p ai e p bi tornaram-se objetivas e podem ser calculadas sem a participação humana.

Tabela 2. Uma estimativa Bayesiana mais precisa (mas incompleta) para recursos disponíveis de uma carta

Obtivemos um resultado bastante definido - com uma grande margem de probabilidade, a letra pode ser atribuída às letras necessárias, pois P(H B) = 0,997 > T = 0,95. Por que o resultado mudou? Porque usamos mais informações - levamos em consideração o número de letras em cada uma das pilhas e, a propósito, determinamos as estimativas p ai e p bi com muito mais precisão. Eles foram determinados da mesma forma que o próprio Bayes, calculando as probabilidades condicionais. Em outras palavras, p a3 é a probabilidade de que a palavra "buddy" apareça no e-mail, dado que o e-mail já pertence ao heap de spam H A . O resultado não demorou a chegar - parece que podemos tomar uma decisão com maior certeza.

Bayes vs Fraude Corporativa

Uma aplicação interessante da abordagem Bayesiana foi descrita por MAGNUS8.

Meu projeto atual (SI para detecção de fraude em uma empresa fabril) utiliza a fórmula de Bayes para determinar a probabilidade de fraude (fraude) na presença/ausência de diversos fatos indiretamente em favor da hipótese da possibilidade de fraude. O algoritmo é de autoaprendizagem (com feedback), ou seja, recalcula seus coeficientes (probabilidades condicionais) mediante a efetiva confirmação ou não da fraude durante a verificação pelo serviço de segurança econômica.

Provavelmente vale a pena dizer que tais métodos ao projetar algoritmos exigem uma cultura matemática bastante alta do desenvolvedor, porque o menor erro na derivação e/ou implementação de fórmulas computacionais anulará e desacreditará todo o método. Os métodos probabilísticos são especialmente culpados disso, pois o pensamento humano não está adaptado para trabalhar com categorias probabilísticas e, portanto, não há “visibilidade” e compreensão do “significado físico” dos parâmetros probabilísticos intermediários e finais. Tal entendimento existe apenas para os conceitos básicos da teoria da probabilidade, e então você só precisa combinar e derivar coisas complexas com muito cuidado de acordo com as leis da teoria da probabilidade - o senso comum não ajudará mais nos objetos compostos. Isso, em particular, está associado a batalhas metodológicas bastante sérias que ocorrem nas páginas dos livros modernos sobre a filosofia da probabilidade, bem como um grande número de sofismas, paradoxos e problemas de curiosidade sobre esse tópico.

Mais uma nuance que tive que enfrentar - infelizmente, quase tudo mais ou menos ÚTIL NA PRÁTICA neste tópico está escrito em inglês. Nas fontes de língua russa, existe basicamente apenas uma teoria bem conhecida com exemplos de demonstração apenas para os casos mais primitivos.

Concordo plenamente com o último comentário. Por exemplo, o Google, ao tentar encontrar algo como o livro “Probabilidade Bayesiana”, não deu nada inteligível. É verdade que ele disse que um livro com estatísticas bayesianas foi proibido na China. (O professor de estatística Andrew Gelman relatou em um blog da Universidade de Columbia que seu livro, Data Analysis with Regression and Multilevel/Hierarchical Models, foi banido da publicação na China. text.”) Eu me pergunto se um motivo semelhante levou à ausência de livros sobre Bayesian probabilidade na Rússia?

Conservadorismo no processo de processamento da informação humana

As probabilidades determinam o grau de incerteza. Probabilidade, tanto para Bayes quanto para nossa intuição, é simplesmente um número entre zero e o que representa o grau em que uma pessoa um tanto idealizada acredita que a afirmação é verdadeira. A razão pela qual o homem é um tanto idealizado é que a soma de suas probabilidades para dois eventos mutuamente exclusivos deve ser igual à probabilidade de qualquer um desses eventos ocorrer. A propriedade da aditividade tem tais implicações que poucas pessoas reais podem igualar todas elas.

O teorema de Bayes é uma consequência trivial da propriedade da aditividade, inegável e aceita por todos os probabilistas, Bayesianos e outros. Uma maneira de escrever é a seguinte. Se P(HA |D) é a probabilidade subsequente de que a hipótese A era após o valor dado D ser observado, P(HA) é sua probabilidade anterior antes do valor dado D ser observado, P(D|HA) é a probabilidade de que um dado valor D será observado, se H A for verdadeiro, e P(D) é a probabilidade incondicional de um dado valor D, então

(1) P(HA |D) = P(D|HA) * P(HA) / P(D)

P(D) é mais bem pensado como uma constante de normalização, fazendo com que as probabilidades posteriores se somem a um sobre o conjunto exaustivo de hipóteses mutuamente exclusivas que estão sendo consideradas. Se precisar ser calculado, pode ser assim:

Mas mais frequentemente P(D) é eliminado em vez de contado. Uma maneira conveniente de eliminá-lo é transformar o teorema de Bayes na forma de uma relação probabilidade-odds.

Considere outra hipótese, H B , mutuamente exclusiva para H A, e mude de idéia sobre ela com base na mesma quantidade dada que mudou de idéia sobre H A. O teorema de Bayes diz que

(2) P(H B |D) = P(D|H B) * P(H B) / P(D)

Agora dividimos a Equação 1 pela Equação 2; o resultado será assim:

onde Ω 1 são as probabilidades posteriores a favor de H A em termos de H B , Ω 0 são as probabilidades anteriores e L é um número familiar aos estatísticos como razão de probabilidades. A Equação 3 é a mesma versão relevante do teorema de Bayes que a Equação 1, e muitas vezes é muito mais útil especialmente para experimentos envolvendo hipóteses. Os proponentes bayesianos argumentam que o teorema de Bayes é uma regra formalmente ótima de como revisar opiniões à luz de novos dados.

Estamos interessados ​​em comparar o comportamento ideal definido pelo teorema de Bayes com o comportamento real das pessoas. Para você ter uma ideia do que isso significa, vamos fazer um experimento com você como sujeito. Este saco contém 1000 fichas de poker. Eu tenho duas dessas bolsas, uma com 700 fichas vermelhas e 300 azuis, e outra com 300 fichas vermelhas e 700 azuis. Joguei uma moeda para determinar qual usar. Assim, se nossas opiniões forem as mesmas, sua probabilidade atual de tirar uma sacola com mais fichas vermelhas é de 0,5. Agora, você amostra aleatoriamente, retornando após cada token. Em 12 fichas, você obtém 8 vermelhas e 4 azuis. Agora, com base em tudo o que você sabe, qual é a probabilidade de que uma sacola tenha mais vermelhos? É claro que é superior a 0,5. Por favor, não continue lendo até ter registrado sua classificação.

Se você se parece com um sujeito típico, sua pontuação fica entre 0,7 e 0,8. Se fizéssemos o cálculo correspondente, no entanto, a resposta seria 0,97. De fato, é muito raro que uma pessoa a quem não tenha sido demonstrada anteriormente a influência do conservadorismo chegue a uma estimativa tão alta, mesmo que esteja familiarizada com o teorema de Bayes.

Se a proporção de fichas vermelhas no saco for R, então a probabilidade de obter r fichas vermelhas e ( n-r) azul em n amostras com retorno - pr (1–p)n–r. Assim, em um experimento típico de bolsa e fichas de pôquer, se HUMA significa que a proporção de fichas vermelhas é r A e HB significa que a parte é RB, então a razão de probabilidade:

Ao aplicar a fórmula de Bayes, deve-se levar em conta apenas a probabilidade da observação real, e não as probabilidades de outras observações que ele poderia ter feito, mas não fez. Este princípio tem amplas implicações para todas as aplicações estatísticas e não estatísticas do teorema de Bayes; é a ferramenta técnica mais importante do pensamento bayesiano.

Revolução Bayesiana

Seus amigos e colegas estão falando sobre algo chamado "Teorema de Bayes" ou "regra Bayesiana" ou algo chamado pensamento Bayesiano. Eles gostam muito disso, então você vai online e encontra uma página sobre o teorema de Bayes e... É uma equação. E isso é tudo... Por que um conceito matemático suscita tanto entusiasmo nas mentes? Que tipo de "revolução bayesiana" está ocorrendo entre os cientistas, e argumenta-se que mesmo a própria abordagem experimental pode ser descrita como seu caso especial? Qual é o segredo que os seguidores de Bayes conhecem? Que tipo de luz eles veem?

A revolução bayesiana na ciência não aconteceu porque cada vez mais cientistas cognitivos começaram a perceber de repente que os fenômenos mentais têm uma estrutura bayesiana; não porque cientistas de todas as áreas começaram a usar o método Bayesiano; mas porque a própria ciência é um caso especial do teorema de Bayes; evidência experimental é evidência Bayesiana. Revolucionários Bayesianos argumentam que quando você faz um experimento e obtém evidências que "apóiam" ou "refutam" sua teoria, essa confirmação ou refutação ocorre de acordo com as regras Bayesianas. Por exemplo, você deve levar em conta não apenas que sua teoria pode explicar o fenômeno, mas também que existem outras explicações possíveis que também podem prever esse fenômeno.

Anteriormente, a filosofia da ciência mais popular era a velha filosofia que foi substituída pela revolução bayesiana. A ideia de Karl Popper de que as teorias podem ser completamente falsificadas, mas nunca completamente confirmadas, é outro caso especial de regras bayesianas; se p(X|A) ≈ 1 - se a teoria faz previsões corretas, então a observação de ~X falsifica A muito fortemente. Por outro lado, se p(X|A) ≈ 1 e observamos X, isso não apoiam muito a teoria; alguma outra condição B é possível, tal que p(X|B) ≈ 1, e sob a qual a observação de X não evidencia A, mas evidencia B. Para observar X definitivamente confirmando A, precisaríamos saber não que p( X|A) ≈ 1 e que p(X|~A) ≈ 0, que não podemos saber porque não podemos considerar todas as explicações alternativas possíveis. Por exemplo, quando a teoria da relatividade geral de Einstein ultrapassou a teoria da gravidade altamente verificável de Newton, fez de todas as previsões da teoria de Newton um caso especial da teoria de Einstein.

Da mesma forma, a afirmação de Popper de que uma ideia deve ser falsificável pode ser interpretada como uma manifestação da regra bayesiana sobre a conservação da probabilidade; se o resultado X é uma evidência positiva para a teoria, então o resultado ~X deve falsificar a teoria até certo ponto. Se você está tentando interpretar X e ~X como "apoiando" uma teoria, as regras Bayesianas dizem que isso é impossível! Para aumentar a probabilidade de uma teoria, você deve submetê-la a testes que podem potencialmente reduzir sua probabilidade; esta não é apenas uma regra para detectar charlatães na ciência, mas uma consequência do Teorema da Probabilidade Bayesiana. Por outro lado, a ideia de Popper de que apenas a falsificação é necessária e nenhuma confirmação é necessária está errada. O teorema de Bayes mostra que a falsificação é uma evidência muito forte em comparação com a confirmação, mas a falsificação ainda é de natureza probabilística; não é governado por regras fundamentalmente diferentes e não difere nisto da confirmação, como argumenta Popper.

Assim, descobrimos que muitos fenômenos nas ciências cognitivas, mais os métodos estatísticos usados ​​pelos cientistas, mais o próprio método científico, são todos casos especiais do teorema de Bayes. É disso que se trata a revolução bayesiana.

Bem-vindo à Conspiração Bayesiana!

Literatura sobre Probabilidade Bayesiana

2. O Prêmio Nobel de Economia Kahneman (et al.) descreve muitas aplicações diferentes de Bayes em um livro maravilhoso. Só no meu resumo deste livro muito grande, contei 27 referências ao nome de um ministro presbiteriano. Fórmulas mínimas. (.. Gostei muito. Verdade, é complicado, muita matemática (e onde sem ela), mas capítulos individuais (por exemplo, Capítulo 4. Informações), claramente sobre o tema. Aconselho a todos. Mesmo que a matemática seja difícil para você, leia a linha, pulando a matemática e pescando grãos úteis ...

14. (suplemento datado de 15 de janeiro de 2017), um capítulo do livro de Tony Crilly. 50 ideias que você precisa conhecer. Matemáticas.

O físico Richard Feynman, ganhador do Nobel, falando de um filósofo com uma presunção particularmente grande, disse certa vez: “Não é a filosofia como ciência que me irrita, mas a pompa que foi criada em torno dela. Se ao menos os filósofos pudessem rir de si mesmos! Se ao menos eles pudessem dizer: "Eu digo que é assim, mas Von Leipzig achou que era diferente, e ele também sabe algo sobre isso." Se ao menos eles se lembrassem de esclarecer que era apenas sua .

O teorema de Bayes é descrito em detalhes em um artigo separado. Este é um trabalho maravilhoso, mas tem 15.000 palavras. A própria essência do teorema é brevemente explicada na mesma tradução do artigo de Kalid Azad.

  • Os resultados de pesquisas e testes não são eventos. Existe um método para diagnosticar o câncer, mas existe o evento em si - a presença da doença. O algoritmo verifica se a mensagem contém spam, mas o evento (o spam realmente chegou ao correio) deve ser considerado separadamente do resultado de seu trabalho.
  • Há erros nos resultados do teste. Muitas vezes nossos métodos de pesquisa revelam o que não é (falso positivo) e não revelam o que é (falso negativo).
  • Com a ajuda de testes, obtemos as probabilidades de um determinado resultado. Muitas vezes analisamos os resultados dos testes sozinhos e não levamos em consideração os erros de método.
  • Resultados falsos positivos distorcem a imagem. Suponha que você esteja tentando detectar algum fenômeno muito raro (1 em 1.000.000). Mesmo que seu método seja preciso, é provável que seu resultado positivo seja realmente um falso positivo.
  • É mais conveniente trabalhar com números naturais. Melhor dizer: 100 de 10.000, não 1%. Com esta abordagem, haverá menos erros, especialmente ao multiplicar. Digamos que precisamos trabalhar ainda mais nesse 1%. O raciocínio em porcentagens é desajeitado: "em 80% dos casos de 1% obteve um resultado positivo". Informações muito mais fáceis são percebidas da seguinte forma: "em 80 casos em 100, foi observado um resultado positivo".
  • Mesmo na ciência, qualquer fato é apenas o resultado da aplicação de algum método. Do ponto de vista filosófico, um experimento científico é apenas um teste com um provável erro. Existe um método que revela uma substância química ou algum fenômeno, e existe um evento em si - a presença desse fenômeno. Nossos métodos de teste podem dar um resultado falso, e qualquer equipamento tem um erro inerente.
O teorema de Bayes transforma os resultados dos testes em probabilidades de eventos.
  • Se soubermos a probabilidade de um evento e a probabilidade de falsos positivos e falsos negativos, podemos corrigir os erros de medição.
  • O teorema correlaciona a probabilidade de um evento com a probabilidade de um determinado resultado. Podemos relacionar Pr(A|X): a probabilidade de um evento A dado um resultado X, e Pr(X|A): a probabilidade de um resultado X dado um evento A.

Entendendo o Método

O artigo referenciado no início deste ensaio discute o método diagnóstico (mamografia) que detecta o câncer de mama. Vamos considerar este método em detalhes.
  • 1% de todas as mulheres têm câncer de mama (e, portanto, 99% não ficam doentes)
  • 80% das mamografias detectam a doença quando ela realmente é (e, portanto, 20% não detectam)
  • 9,6% dos estudos detectam câncer quando não há nenhum (e, portanto, 90,4% relatam corretamente um resultado negativo)
Agora vamos criar uma tabela assim:

Como trabalhar com esses dados?
  • 1% das mulheres tem câncer de mama
  • se o paciente tiver uma doença, olhe na primeira coluna: há 80% de chance de que o método tenha dado o resultado correto e 20% de chance de que o resultado do estudo esteja incorreto (falso negativo)
  • se o paciente não tiver sido diagnosticado com a doença, observe a segunda coluna. Com uma probabilidade de 9,6% podemos dizer que o resultado positivo do estudo está incorreto, e com uma probabilidade de 90,4% podemos dizer que o paciente está realmente saudável.

Quão preciso é o método?

Agora vamos ver o resultado positivo do teste. Qual é a probabilidade de uma pessoa estar realmente doente: 80%, 90%, 1%?

Vamos pensar:

  • Há um resultado positivo. Analisaremos todos os resultados possíveis: o resultado obtido pode ser tanto verdadeiro positivo quanto falso positivo.
  • A probabilidade de um resultado positivo verdadeiro é igual a: a probabilidade de adoecer multiplicada pela probabilidade de o teste realmente detectar a doença. 1% * 80% = 0,008
  • A probabilidade de um resultado falso positivo é igual a: a probabilidade de a doença não estar presente, multiplicada pela probabilidade de o método detectar a doença incorretamente. 99% * 9,6% = 0,09504
Agora a tabela está assim:

Qual é a probabilidade de uma pessoa estar realmente doente se um resultado de mamografia positivo for obtido? A probabilidade de um evento é a razão entre o número de resultados possíveis de um evento e o número total de todos os resultados possíveis.

Probabilidade do Evento = Resultados do Evento / Todos os Resultados Possíveis

A probabilidade de um resultado positivo verdadeiro é 0,008. A probabilidade de um resultado positivo é a probabilidade de um resultado positivo verdadeiro + a probabilidade de um resultado falso positivo.

(.008 + 0.09504 = .10304)

Assim, a probabilidade de uma doença com resultado positivo do estudo é calculada da seguinte forma: 0,008 / 0,10304 = 0,0776. Este valor é de cerca de 7,8%.

Ou seja, um resultado de mamografia positivo significa apenas que a probabilidade de ter uma doença é de 7,8%, e não de 80% (este último valor é apenas a precisão estimada do método). Tal resultado parece incompreensível e estranho no início, mas você precisa considerar: o método dá um resultado falso positivo em 9,6% dos casos (e isso é bastante), então haverá muitos resultados falsos positivos na amostra. Para uma doença rara, a maioria dos resultados positivos serão falsos positivos.

Vamos correr nossos olhos sobre a mesa e tentar entender intuitivamente o significado do teorema. Se temos 100 pessoas, apenas uma delas tem a doença (1%). Nesta pessoa, com 80% de probabilidade, o método dará um resultado positivo. Dos 99% restantes, 10% terão resultados positivos, o que nos dá, grosso modo, 10 falsos positivos em 100. Se considerarmos todos os resultados positivos, apenas 1 em 11 será verdadeiro. Assim, se for obtido um resultado positivo, a probabilidade da doença é de 1/11.

Acima, calculamos que essa probabilidade é igual a 7,8%, ou seja, o número é na verdade mais próximo de 1/13, mas aqui, com um raciocínio simples, conseguimos encontrar uma estimativa aproximada sem uma calculadora.

teorema de Bayes

Agora vamos descrever o curso de nossos pensamentos com uma fórmula, que é chamada de teorema de Bayes. Este teorema permite corrigir os resultados do estudo de acordo com a distorção que os resultados falsos positivos introduzem:
  • Pr(A|X) = probabilidade de doença (A) com resultado positivo (X). Isso é exatamente o que queremos saber: qual é a probabilidade de um evento no caso de um resultado positivo. No nosso exemplo, é igual a 7,8%.
  • Pr(X|A) = probabilidade de resultado positivo (X) no caso em que o paciente está realmente doente (A). No nosso caso, este é o valor do verdadeiro positivo - 80%
  • Pr(A) = probabilidade de ficar doente (1%)
  • Pr(não A) = probabilidade de não ficar doente (99%)
  • Pr(X|not A) = probabilidade de um resultado positivo do estudo se não houver doença. Este é o valor de falsos positivos - 9,6%.
Podemos concluir que para obter a probabilidade de um evento, você precisa dividir a probabilidade de um resultado positivo verdadeiro pela probabilidade de todos os resultados positivos. Agora podemos simplificar a equação:
Pr(X) é a constante de normalização. Ela nos serviu bem: sem ela, um resultado positivo do teste nos daria 80% de chance de um evento.
Pr(X) é a probabilidade de qualquer resultado positivo, seja um verdadeiro positivo em um estudo de paciente (1%) ou um falso positivo em um estudo saudável (99%).

Em nosso exemplo, Pr(X) é um número bastante grande porque há uma alta probabilidade de resultados falsos positivos.

Pr(X) produz um resultado de 7,8%, o que à primeira vista parece contra-intuitivo.

O significado do teorema

Estamos testando para descobrir o verdadeiro estado das coisas. Se nossos testes forem perfeitos e precisos, então as probabilidades de tentativas e as probabilidades de eventos coincidirão. Todos os resultados positivos serão verdadeiramente positivos e os resultados negativos serão negativos. Mas vivemos no mundo real. E em nosso mundo, os testes dão resultados errados. O teorema de Bayes considera resultados distorcidos, corrige erros, reconstrói a população e encontra a probabilidade de um resultado positivo verdadeiro.

Filtro de spam

O teorema de Bayes é aplicado com sucesso em filtros de spam.

Nós temos:

  • evento A - em um email de spam
  • o resultado do teste é o conteúdo de certas palavras na carta:

O filtro leva em consideração os resultados do teste (conteúdo de determinadas palavras no e-mail) e prevê se o e-mail contém spam. Todo mundo entende que, por exemplo, a palavra "Viagra" é mais comum em spam do que em e-mails comuns.

O filtro de spam baseado em lista negra tem a desvantagem de frequentemente produzir falsos positivos.

O filtro de spam Bayesiano adota uma abordagem ponderada e razoável: trabalha com probabilidades. Quando analisamos as palavras em um e-mail, podemos calcular a probabilidade de que o e-mail seja spam em vez de tomar decisões de sim/não. Se houver 99% de chance de que o e-mail contenha spam, então o e-mail é realmente spam.

Com o tempo, o filtro treina em uma amostra cada vez maior e atualiza as probabilidades. Por exemplo, filtros avançados baseados no teorema de Bayes verificam muitas palavras seguidas e as usam como dados.

Fontes adicionais:

Etiquetas: adicionar etiquetas

Fórmula de Bayes:

As probabilidades P(H i) das hipóteses H i são chamadas de probabilidades a priori - as probabilidades antes dos experimentos.
As probabilidades P(A/H i) são chamadas de probabilidades a posteriori - as probabilidades das hipóteses H i refinadas como resultado do experimento.

Exemplo 1. O dispositivo pode ser montado a partir de peças de alta qualidade e de peças de qualidade comum. Cerca de 40% dos dispositivos são montados com peças de alta qualidade. Se o dispositivo for montado a partir de peças de alta qualidade, sua confiabilidade (probabilidade de operação sem falhas) ao longo do tempo t é 0,95; se de peças de qualidade comum - sua confiabilidade é de 0,7. O dispositivo foi testado pelo tempo t e funcionou perfeitamente. Encontre a probabilidade de que ele seja montado com peças de alta qualidade.
Solução. Duas hipóteses são possíveis: H 1 - o dispositivo é montado a partir de peças de alta qualidade; H 2 - o dispositivo é montado a partir de peças de qualidade comum. As probabilidades dessas hipóteses antes do experimento: P(H 1) = 0,4, P(H 2) = 0,6. Como resultado do experimento, foi observado o evento A - o dispositivo funcionou perfeitamente durante o tempo t. As probabilidades condicionais deste evento sob as hipóteses H 1 e H 2 são: P(A|H 1) = 0,95; P(A|H2) = 0,7. Usando a fórmula (12), encontramos a probabilidade da hipótese H 1 após o experimento:

Exemplo #2. Dois atiradores atiram independentemente no mesmo alvo, cada um disparando um tiro. A probabilidade de acertar o alvo para o primeiro atirador é 0,8, para o segundo 0,4. Após o disparo, um buraco foi encontrado no alvo. Assumindo que dois atiradores não podem acertar o mesmo ponto, encontre a probabilidade de que o primeiro atirador acerte o alvo.
Solução. Seja o evento A um buraco encontrado no alvo após o disparo. Antes do início das filmagens, hipóteses são possíveis:
H 1 - nem o primeiro nem o segundo atirador acertarão, a probabilidade desta hipótese: P(H 1) = 0,2 0,6 = 0,12.
H 2 - ambos os atiradores acertarão, P(H 2) = 0,8 0,4 = 0,32.
H 3 - o primeiro atirador acertará e o segundo não acertará, P(H 3) = 0,8 0,6 = 0,48.
H 4 - o primeiro atirador não acertará, mas o segundo acertará, P (H 4) = 0,2 0,4 = 0,08.
As probabilidades condicionais do evento A sob essas hipóteses são:

Após a experiência, as hipóteses H 1 e H 2 tornam-se impossíveis, e as probabilidades das hipóteses H 3 e H 4
será igual:


Assim, é mais provável que o alvo seja atingido pelo primeiro atirador.

Exemplo #3. Na oficina de montagem, um motor elétrico é conectado ao dispositivo. Os motores elétricos são fornecidos por três fabricantes. Existem 19,6 e 11 motores elétricos das plantas nomeadas no armazém, respectivamente, que podem funcionar sem falhas até o final do período de garantia, respectivamente, com probabilidades de 0,85, 0,76 e 0,71. O trabalhador pega aleatoriamente um motor e o monta no dispositivo. Encontre a probabilidade de que o motor elétrico, montado e funcionando sem falhas até o final do período de garantia, tenha sido fornecido pelo primeiro, segundo ou terceiro fabricante, respectivamente.
Solução. O primeiro teste é a escolha do motor elétrico, o segundo é o funcionamento do motor elétrico durante o período de garantia. Considere os seguintes eventos:
A - o motor elétrico funciona perfeitamente até o final do período de garantia;
H 1 - o montador retirará o motor dos produtos da primeira fábrica;
H 2 - o montador retirará o motor dos produtos da segunda fábrica;
H 3 - o montador retirará o motor dos produtos da terceira fábrica.
A probabilidade do evento A é calculada pela fórmula de probabilidade total:

As probabilidades condicionais são especificadas na declaração do problema:

Vamos encontrar as probabilidades


Usando as fórmulas de Bayes (12), calculamos as probabilidades condicionais das hipóteses H i:

Exemplo #4. As probabilidades de que durante a operação do sistema, que é composto por três elementos, os elementos com números 1, 2 e 3 venham a falhar, estão relacionadas como 3: 2: 5. As probabilidades de detecção de falhas desses elementos são 0,95, respectivamente; 0,9 e 0,6.

b) Nas condições desta tarefa, foi detectada uma falha durante a operação do sistema. Qual elemento é mais provável de falhar?

Solução.
Seja A um evento de falha. Vamos introduzir um sistema de hipóteses H1 - falha do primeiro elemento, H2 - falha do segundo elemento, H3 - falha do terceiro elemento.
Encontramos as probabilidades das hipóteses:
P(H1) = 3/(3+2+5) = 0,3
P(H2) = 2/(3+2+5) = 0,2
P(H3) = 5/(3+2+5) = 0,5

De acordo com a condição do problema, as probabilidades condicionais do evento A são:
P(A|H1) = 0,95, P(A|H2) = 0,9, P(A|H3) = 0,6

a) Encontre a probabilidade de detectar uma falha no sistema.
P(A) = P(H1)*P(A|H1) + P(H2)*P(A|H2) + P(H3)*P(A|H3) = 0,3*0,95 + 0,2*0,9 + 0,5 *0,6 = 0,765

b) Nas condições desta tarefa, foi detectada uma falha durante a operação do sistema. Qual elemento é mais provável de falhar?
P1 = P(H1)*P(A|H1)/P(A) = 0,3*0,95 / 0,765 = 0,373
P2 = P(H2)*P(A|H2)/P(A) = 0,2*0,9/0,765 = 0,235
P3 = P(H3)*P(A|H3)/P(A) = 0,5*0,6/0,765 = 0,392

A probabilidade máxima do terceiro elemento.