Bayes formulasining umumiy ehtimolining shartli ehtimollik formulasi. Bayes formulalari

Bayes formulasining umumiy ehtimolining shartli ehtimollik formulasi. Bayes formulalari

Bayes teoremasi alohida maqolada batafsil tavsiflangan. Bu ajoyib asar, lekin u 15 000 so'zdan iborat. Kalid Azaddan maqolaning xuddi shu tarjimasi teoremaning mohiyatini qisqacha tushuntiradi.

  • Tadqiqot va sinov natijalari voqea emas. Saraton kasalligini aniqlash usuli mavjud va hodisaning o'zi ham bor - kasallikning mavjudligi. Algoritm xabarda spam bor-yo'qligini tekshiradi, ammo voqea (spam haqiqatan ham pochta orqali kelgan) uning ish natijasidan alohida ko'rib chiqilishi kerak.
  • Sinov natijalarida xatolar mavjud. Ko'pincha bizning tadqiqot usullari mavjud bo'lmagan narsalarni (noto'g'ri ijobiy) aniqlaydi va nima borligini (noto'g'ri salbiy) aniqlamaydi.
  • Sinovlar yordamida biz ma'lum bir natijaning ehtimolini olamiz. Ko'pincha biz test natijalarini mustaqil ravishda ko'rib chiqamiz va usul xatolarini hisobga olmaymiz.
  • Noto'g'ri ijobiy natijalar rasmni buzadi. Aytaylik, siz juda kam uchraydigan hodisani aniqlashga harakat qilyapsiz (1 000 000 ta holat). Sizning usulingiz to'g'ri bo'lsa ham, sizning ijobiy natijangiz noto'g'ri ijobiy bo'lishi ehtimoli bor.
  • Natural sonlar bilan ishlash qulayroq. Aytish yaxshiroq: 1% emas, 10000 dan 100 ta. Ushbu yondashuv bilan, ayniqsa, ko'paytirishda kamroq xatolar bo'ladi. Aytaylik, biz ushbu 1% bilan ishlashni davom ettirishimiz kerak. Foizlarda mulohaza yuritish noqulay: "1% holatlarning 80 foizida ijobiy natija bo'ldi." Ma'lumotni quyidagicha qabul qilish ancha oson: "100 ta holatdan 80 tasida ijobiy natija kuzatildi".
  • Hatto fanda ham har qanday fakt faqat usulni qo'llash natijasidir. Falsafiy nuqtai nazardan, ilmiy eksperiment shunchaki xatolik ehtimoli bo'lgan sinovdir. Kimyoviy moddani yoki qandaydir hodisani ochib beradigan usul bor va hodisaning o'zi bor - bu hodisaning mavjudligi. Sinov usullarimiz noto'g'ri natijalar berishi mumkin va barcha jihozlar o'ziga xos xatolikka ega.
Bayes teoremasi test natijalarini hodisalar ehtimoliga aylantiradi.
  • Agar biz hodisaning ehtimolini va noto'g'ri musbat va noto'g'ri salbiy ehtimolini bilsak, o'lchash xatolarini tuzatishimiz mumkin.
  • Teorema hodisaning ehtimolini ma'lum bir natija ehtimoli bilan bog'laydi. Biz Pr(A|X) ni bog‘lashimiz mumkin: A hodisasining ehtimoli, berilgan X natijasi va Pr(X|A): A hodisasi berilgan X natija ehtimoli.

Keling, usulni tushunaylik

Ushbu inshoning boshida bog'langan maqolada ko'krak bezi saratonini aniqlaydigan diagnostika usuli (mammogramma) ko'rib chiqiladi. Keling, ushbu usulni batafsil ko'rib chiqaylik.
  • Barcha ayollarning 1 foizi ko'krak bezi saratoniga chalinadi (va shunga mos ravishda 99 foizi uni yuqtirmaydi)
  • Mammogrammalarning 80% kasallikni haqiqatda mavjud bo'lganda aniqlaydi (va shunga mos ravishda 20% uni aniqlamaydi)
  • Sinovlarning 9,6 foizi saraton kasalligini yo'q bo'lganda aniqlaydi (va shunga mos ravishda 90,4 foizi salbiy natijani to'g'ri aniqlaydi)
Endi shunday jadval tuzamiz:

Ushbu ma'lumotlar bilan qanday ishlash kerak?
  • Ayollarning 1 foizi ko'krak saratoniga chalinadi
  • Agar bemorga kasallik tashxisi qo'yilgan bo'lsa, birinchi ustunga qarang: usul to'g'ri natija berganligining 80% ehtimoli va test natijasi noto'g'ri (noto'g'ri salbiy) bo'lishining 20% ​​ehtimoli bor.
  • agar bemorning kasalligi aniqlanmagan bo'lsa, ikkinchi ustunga qarang. 9,6% ehtimol bilan biz tadqiqotning ijobiy natijasi noto'g'ri, 90,4% ehtimol bilan bemor haqiqatan ham sog'lom deb aytishimiz mumkin.

Usul qanchalik aniq?

Keling, ijobiy test natijasini ko'rib chiqaylik. Odamning haqiqatan ham kasal bo'lish ehtimoli qanday: 80%, 90%, 1%?

Keling, o'ylab ko'raylik:

  • Ijobiy natija bor. Keling, barcha mumkin bo'lgan natijalarni ko'rib chiqaylik: natija haqiqiy ijobiy yoki noto'g'ri ijobiy bo'lishi mumkin.
  • Haqiqiy ijobiy natija ehtimoli quyidagilarga teng: kasallikni yuqtirish ehtimoli testning haqiqatda kasallikni aniqlaganligi ehtimoliga ko'paytiriladi. 1% * 80% = .008
  • Noto'g'ri ijobiy natija ehtimoli quyidagilarga teng: kasallikning yo'qligi ehtimolligi usul kasallikni noto'g'ri aniqlash ehtimoliga ko'paytiriladi. 99% * 9,6% = .09504
Endi jadval quyidagicha ko'rinadi:

Agar ijobiy mamogramma olingan bo'lsa, odamning haqiqatan ham kasal bo'lish ehtimoli qanday? Hodisa ehtimoli - bu hodisaning mumkin bo'lgan natijalari sonining barcha mumkin bo'lgan natijalarning umumiy soniga nisbati.

Hodisa ehtimoli = hodisaning natijalari / barcha mumkin bo'lgan natijalar

Haqiqiy ijobiy natija ehtimoli .008 ga teng. Ijobiy natija ehtimoli - haqiqiy ijobiy natija ehtimoli + noto'g'ri ijobiy natija ehtimoli.

(.008 + 0.09504 = .10304)

Shunday qilib, ijobiy test natijasi bilan kasallik ehtimoli quyidagicha hisoblanadi: .008/.10304 = 0.0776. Bu qiymat taxminan 7,8% ni tashkil qiladi.

Ya'ni, ijobiy mamogramma natijasi faqat kasallik ehtimoli 80% emas, balki 7,8% ekanligini anglatadi (oxirgi qiymat faqat usulning taxminiy aniqligi). Bu natija dastlab tushunarsiz va g'alati tuyuladi, lekin siz e'tiborga olishingiz kerak: usul 9,6% hollarda noto'g'ri ijobiy natija beradi (bu juda ko'p), shuning uchun namunada juda ko'p noto'g'ri ijobiy natijalar bo'ladi. Kamdan kam uchraydigan kasallik uchun ijobiy natijalarning aksariyati noto'g'ri bo'ladi.

Keling, jadvalni ko'rib chiqaylik va teoremaning ma'nosini intuitiv ravishda tushunishga harakat qilaylik. Agar bizda 100 kishi bo'lsa, ulardan faqat bittasida kasallik bor (1%). Bu odam uchun usul ijobiy natija berishining 80% ehtimoli bor. Qolgan 99% dan 10% ijobiy natijalarga ega bo'ladi, bu bizga taxminan 100 tadan 10 ta noto'g'ri ijobiy natija beradi. Agar barcha ijobiy natijalarni hisobga olsak, 11 tadan faqat 1 tasi to'g'ri bo'ladi. Shunday qilib, agar ijobiy natija olinsa, kasallik ehtimoli 1/11 ni tashkil qiladi.

Yuqorida biz bu ehtimollik 7,8% ekanligini hisoblab chiqdik, ya'ni. Bu raqam aslida 1/13 ga yaqinroq, ammo bu erda oddiy mulohaza yuritish bilan biz kalkulyatorsiz taxminiy taxminni topa oldik.

Bayes teoremasi

Keling, Bayes teoremasi deb nomlangan formuladan foydalanib, fikrlash pog'onasini tasvirlaylik. Ushbu teorema tadqiqot natijalarini noto'g'ri ijobiy natijalar bilan kiritilgan buzilishlarga muvofiq tuzatishga imkon beradi:
  • Pr (A | X) = ijobiy natija (X) berilgan kasallik ehtimoli (A). Bu biz bilmoqchi bo'lgan narsa: agar natija ijobiy bo'lsa, hodisaning ehtimoli qanday. Bizning misolimizda bu 7,8% ni tashkil qiladi.
  • Pr (X | A) = bemor haqiqatan ham kasal bo'lgan taqdirda ijobiy natija (X) ehtimoli (A). Bizning holatda, bu haqiqiy ijobiy qiymat - 80%
  • Pr(A) = kasallanish ehtimoli (1%)
  • Pr(A emas) = ​​kasal bo'lmaslik ehtimoli (99%)
  • Pr (X | A emas) = ​​kasallik bo'lmasa, tadqiqotning ijobiy natijasi ehtimoli. Bu noto'g'ri ijobiy ko'rsatkich - 9,6%.
Xulosa qilishimiz mumkin: hodisaning ehtimolini olish uchun siz haqiqiy ijobiy natija ehtimolini barcha ijobiy natijalar ehtimoliga bo'lishingiz kerak. Endi biz tenglamani soddalashtirishimiz mumkin:
Pr(X) - normalizatsiya konstantasi. Bu bizga yaxshi xizmat qildi: usiz testning ijobiy natijasi bizga voqea sodir bo'lishining 80% imkoniyatini bergan bo'lardi.
Pr (X) - bemorlarni o'rganishda haqiqiy ijobiy natija (1%) yoki sog'lom odamlarni o'rganishda noto'g'ri ijobiy natija (99%) bo'ladimi, har qanday ijobiy natija ehtimoli.

Bizning misolimizda Pr (X) juda katta raqam, chunki noto'g'ri musbatlar ehtimoli yuqori.

Pr (X) 7,8% natija beradi, bu birinchi qarashda qarama-qarshi ko'rinadi.

Teoremaning ma'nosi

Biz ishlarning haqiqiy holatini aniqlash uchun sinovlarni o'tkazmoqdamiz. Agar bizning testlarimiz mukammal va to'g'ri bo'lsa, unda testlarning ehtimollari va hodisalarning ehtimollari mos keladi. Barcha ijobiy natijalar haqiqatan ham ijobiy bo'ladi va barcha salbiy natijalar salbiy bo'ladi. Ammo biz haqiqiy dunyoda yashayapmiz. Va bizning dunyomizda testlar noto'g'ri natijalar beradi. Bayes teoremasi noto'g'ri natijalarni hisobga oladi, xatolarni tuzatadi, populyatsiyani qayta tiklaydi va haqiqiy ijobiy ehtimolini topadi.

Spam filtri

Bayes teoremasi spam filtrlarida muvaffaqiyatli qo'llaniladi.

Bizda ... bor:

  • voqea A - xatdagi spam
  • test natijasi - xatdagi ba'zi so'zlarning mazmuni:

Filtr sinov natijalarini (maktubdagi ma'lum so'zlarning mazmunini) hisobga oladi va xatda spam bor yoki yo'qligini taxmin qiladi. Har bir inson, masalan, "Viagra" so'zi oddiy harflardan ko'ra ko'proq spamda topilganligini tushunadi.

Qora ro'yxatga asoslangan spam-filtrning kamchiliklari bor - u ko'pincha noto'g'ri ijobiy natijalar beradi.

Bayes teoremasi spam filtri muvozanatli va aqlli yondashuvdan foydalanadi: u ehtimollar bilan ishlaydi. Elektron pochtadagi so'zlarni tahlil qilganimizda, ha/yo'q qarorlarini qabul qilishdan ko'ra, elektron pochtaning spam bo'lish ehtimolini hisoblashimiz mumkin. Agar xatda spam bo'lish ehtimoli 99% bo'lsa, xat haqiqatan ham shunday.

Vaqt o'tishi bilan filtr tobora kattaroq namunaga o'rgatiladi va ehtimolliklarni yangilaydi. Shunday qilib, Bayes teoremasi asosida yaratilgan ilg'or filtrlar qatordagi ko'plab so'zlarni tekshiradi va ularni ma'lumot sifatida ishlatadi.

Qo'shimcha manbalar:

Teglar: teglar qo'shish

Sibir davlat telekommunikatsiya va informatika universiteti

Oliy matematika kafedrasi

“Ehtimollar nazariyasi va matematik statistika” fanidan

"To'liq ehtimollik formulasi va Bayes (Bayes) formulasi va ularning qo'llanilishi"

Bajarildi:

Rahbar: professor B.P.Zelentsov

Novosibirsk, 2010 yil


Kirish 3

1. Umumiy ehtimollik formulasi 4-5

2. Bayes formulasi (Bayes) 5-6

3. 7-11 yechimlari bilan bog’liq masalalar

4. Bayes formulasini qo'llashning asosiy yo'nalishlari (Bayes) 11

Xulosa 12

Adabiyot 13


Kirish

Ehtimollar nazariyasi matematikaning klassik tarmoqlaridan biridir. Bu uzoq tarixga ega. Fanning bu sohasiga asos solgan buyuk matematiklar. Men, masalan, Fermat, Bernoulli, Paskalni nomlayman.
Keyinchalik, ehtimollar nazariyasining rivojlanishi ko'plab olimlarning ishlarida aniqlandi.
Mamlakatimiz olimlari ehtimollar nazariyasiga katta hissa qo'shdilar:
P.L.Chebishev, A.M.Lyapunov, A.A.Markov, A.N.Kolmogorov. Ehtimoliy va statistik usullar endi ilovalarga chuqur kirib bordi. Ular fizika, texnologiya, iqtisodiyot, biologiya va tibbiyotda qo'llaniladi. Ularning roli, ayniqsa, kompyuter texnikasining rivojlanishi bilan bog'liq holda ortdi.

Masalan, fizik hodisalarni o'rganish uchun kuzatishlar yoki tajribalar o'tkaziladi. Ularning natijalari odatda ba'zi kuzatiladigan miqdorlarning qiymatlari shaklida qayd etiladi. Tajribalarni takrorlashda biz ularning natijalarining tarqalishini aniqlaymiz. Misol uchun, ma'lum sharoitlarni (harorat, namlik va boshqalar) saqlagan holda bir xil miqdordagi o'lchovlarni bir xil qurilma bilan takrorlash orqali biz bir-biridan kamida bir oz farq qiladigan natijalarga erishamiz. Hatto takroriy o'lchovlar ham keyingi o'lchov natijasini aniq bashorat qilishga imkon bermaydi. Shu ma'noda, ular o'lchov natijasi tasodifiy o'zgaruvchidir, deyishadi. Tasodifiy o'zgaruvchining yanada yorqin misoli lotereyadagi yutuq chiptasining soni. Tasodifiy o'zgaruvchilarning boshqa ko'plab misollarini keltirish mumkin. Shunga qaramay, tasodiflar olamida ma'lum naqshlar ochiladi. Bunday naqshlarni o'rganish uchun matematik apparat ehtimollar nazariyasi bilan ta'minlangan.
Shunday qilib, ehtimollar nazariyasi tasodifiy hodisalar va ular bilan bog'liq tasodifiy o'zgaruvchilarning matematik tahlili bilan shug'ullanadi.

1. Umumiy ehtimollik formulasi.

Bir guruh tadbirlar bo'lsin H 1 ,H 2 ,..., Hn, quyidagi xususiyatlarga ega:

1) barcha hodisalar juftlik bilan mos kelmaydi: H i

Hj =Æ; i , j =1,2,...,n ; i ¹ j ;

2) ularning birlashuvi W elementar natijalar makonini tashkil qiladi:

.
8-rasm

Bunday holda, biz buni aytamiz H 1 , H 2 ,...,Hn shakl voqealarning to'liq guruhi. Bunday hodisalar ba'zan deyiladi farazlar .

Mayli A- ba'zi voqea: AÌW (Venn diagrammasi 8-rasmda ko'rsatilgan). Keyin ushlab turadi umumiy ehtimollik formulasi:

P (A) = P (A /H 1)P (H 1) + P (A /H 2)P (H 2) + ...+P (A /Hn)P (Hn) =

Isbot. Shubhasiz: A=

va barcha hodisalar ( i = 1,2,...,n) juftlikda mos kelmaydi. Bu yerdan, ehtimollarni qo'shish teoremasidan foydalanib, biz olamiz

P (A) = P (

) + P () +...+ P (

Agar ko'paytirish teoremasi bilan shuni hisobga olsak P (

) = P (A/H i) P (H i) ( i = 1,2,...,n), keyin oxirgi formuladan yuqoridagi umumiy ehtimollik formulasini olish oson.

Misol. Do'konda uchta zavod tomonidan ishlab chiqarilgan elektr lampalar sotiladi, birinchi zavodning ulushi 30%, ikkinchisi 50%, uchinchisi esa 20%. Ularning mahsulotlaridagi nuqsonlar mos ravishda 5%, 3% va 2% ni tashkil qiladi. Do'konda tasodifiy tanlangan chiroqning nuqsonli bo'lish ehtimoli qanday?

Tadbirga ruxsat bering H 1 - tanlangan chiroq birinchi zavodda ishlab chiqariladi, H ikkinchisida 2, H 3 - uchinchi zavodda. Shubhasiz:

P (H 1) = 3/10, P (H 2) = 5/10, P (H 3) = 2/10.

Tadbirga ruxsat bering A tanlangan chiroq nuqsonli bo'lib chiqdi; A/H i ishlab chiqarilgan lampalardan nuqsonli chiroq tanlab olingan hodisani bildiradi i- o'simlik. Muammo bayonotidan quyidagicha:

P (A / H 1) = 5/10; P (A / H 2) = 3/10; P (A / H 3) = 2/10

Umumiy ehtimollik formulasidan foydalanib, biz olamiz

2. Bayes formulasi (Bayes)

Mayli H 1 ,H 2 ,...,Hn- hodisalarning to'liq guruhi va A M W - qandaydir hodisa. Keyin, shartli ehtimollik formulasiga ko'ra

(1)

Bu yerga P (Hk /A) – hodisaning shartli ehtimoli (gipoteza) Hk yoki buning ehtimoli Hk sodir bo'lishi sharti bilan amalga oshiriladi A sodir bo'ldi.

Ehtimollarni ko'paytirish teoremasiga ko'ra, (1) formulaning numeratori quyidagicha ifodalanishi mumkin.

P = P = P (A /Hk)P (Hk)

Formulaning (1) maxrajini ifodalash uchun siz umumiy ehtimollik formulasidan foydalanishingiz mumkin

P (A)

Endi (1) dan formulani olishimiz mumkin Bayes formulasi :

Bayes formulasi gipotezaning amalga oshishi ehtimolini hisoblab chiqadi Hk hodisa bo'lishi sharti bilan A sodir bo'ldi. Bayes formulasi ham deyiladi gipotezalarning ehtimollik formulasi. Ehtimollik P (Hk) gipotezaning oldingi ehtimolligi deyiladi Hk, va ehtimollik P (Hk /A) – posterior ehtimollik.

Teorema. Sinovdan keyingi gipotezaning ehtimoli sinovdan oldingi gipotezaning ehtimolligi va sinov paytida sodir bo'lgan hodisaning tegishli shartli ehtimoli ko'paytmasiga teng bo'lib, ushbu hodisaning umumiy ehtimoliga bo'linadi.

Misol. Keling, elektr lampalar haqidagi yuqoridagi muammoni ko'rib chiqaylik, faqat muammoning savolini o'zgartiring. Aytaylik, xaridor ushbu do'kondan elektr chiroq sotib oldi va u nuqsonli bo'lib chiqdi. Ushbu lampaning ikkinchi zavodda ishlab chiqarilganligi ehtimolini toping. Kattalik P (H 2) = 0,5 bu holda sotib olingan chiroq ikkinchi zavodda ishlab chiqarilgan hodisaning apriori ehtimoli. Xarid qilingan chiroqning nuqsonli ekanligi haqida ma'lumot olganimizdan so'ng, biz ushbu hodisaning orqa ehtimolini hisoblash orqali ushbu chiroqni ikkinchi zavodda ishlab chiqarish imkoniyati haqidagi taxminimizni to'g'rilashimiz mumkin.

Foydali sahifami? Saqlang yoki do'stlaringizga ayting

Agar voqea A hosil qiluvchi hodisalardan biri sodir bo'lgandagina sodir bo'lishi mumkin mos kelmaydigan hodisalarning to'liq guruhi, keyin hodisaning ehtimoli A formula bo'yicha hisoblanadi

Bu formula deyiladi umumiy ehtimollik formulasi.

Keling, mos kelmaydigan hodisalarning to'liq guruhini yana bir bor ko'rib chiqaylik, ularning ehtimoli . Tadbir A faqat biz chaqiradigan har qanday hodisalar bilan birga sodir bo'lishi mumkin farazlar. Keyin, umumiy ehtimollik formulasiga ko'ra

Agar voqea A sodir bo'lgan bo'lsa, bu gipotezalarning ehtimolini o'zgartirishi mumkin .

Ehtimollarni ko'paytirish teoremasi bo'yicha

.

Xuddi shunday, qolgan farazlar uchun

Olingan formula deyiladi Bayes formulasi (Bayes formulasi). Gipotezalarning ehtimolliklari deyiladi posterior ehtimolliklar, holbuki - oldingi ehtimolliklar.

Misol. Do'kon uchta zavoddan yangi mahsulotlarni oldi. Ushbu mahsulotlarning foizli tarkibi quyidagicha: 20% - birinchi korxona mahsuloti, 30% - ikkinchi korxona mahsuloti, 50% - uchinchi korxona mahsuloti; Bundan tashqari, birinchi korxonada mahsulotning 10 foizi eng yuqori navga, ikkinchi korxonada - 5 foiz va uchinchi korxonada - 20 foiz yuqori navga to'g'ri keladi. Tasodifiy sotib olingan yangi mahsulot eng yuqori sifatga ega bo'lish ehtimolini toping.

Yechim. bilan belgilaymiz IN eng yuqori navli mahsulot sotib olinadigan hodisani biz mos ravishda birinchi, ikkinchi va uchinchi korxonalarga tegishli mahsulotlarni sotib olishdan iborat bo'lgan hodisalar bilan belgilaymiz.

Siz umumiy ehtimollik formulasini qo'llashingiz mumkin va bizning yozuvimizda:

Ushbu qiymatlarni umumiy ehtimollik formulasiga almashtirib, biz kerakli ehtimollikni olamiz:

Misol. Uchta otuvchidan biri otishma chizig'iga chaqiriladi va ikkita o'q uzadi. Birinchi otuvchi uchun bitta o'q bilan nishonga tegish ehtimoli 0,3, ikkinchisi uchun - 0,5; uchinchisi uchun - 0,8. Maqsadga tegmadi. O‘qlarni birinchi otgan otishma ehtimolini toping.

Yechim. Uchta faraz mumkin:

Birinchi otishma o't chizig'iga chaqiriladi,

Ikkinchi o'q otish chizig'iga chaqiriladi,

Uchinchi otuvchi otishma chizig'iga chaqiriladi.

Har qanday otishmachini otishma chizig'iga chaqirish ham birdek mumkin

Tajriba natijasida B hodisasi kuzatildi - o'q uzilgandan keyin nishonga tegmadi. Gipotezalar bo'yicha ushbu hodisaning shartli ehtimollari quyidagilarga teng:

Bayes formulasidan foydalanib, biz tajribadan keyin gipoteza ehtimolini topamiz:

Misol. Uchta avtomatik mashina bir xil turdagi qismlarni qayta ishlaydi, ular qayta ishlanganidan keyin umumiy konveyerga o'tkaziladi. Birinchi mashina nuqsonlarning 2% ni, ikkinchisi - 7%, uchinchisi - 10% ni ishlab chiqaradi. Birinchi mashinaning mahsuldorligi ikkinchisidan 3 marta, uchinchisi esa ikkinchisidan 2 marta kam.

a) Yig'ish liniyasidagi nuqson darajasi qanday?

b) Konveyerdagi nuqsonli qismlar orasida har bir mashinaning qismlari qanday ulushga ega?

Yechim. Keling, yig'ish liniyasidan tasodifiy bir qismni olib, A hodisasini ko'rib chiqaylik - bu qism nuqsonli. Bu qism qayerda qayta ishlanganligi haqidagi farazlar bilan bog'liq: – tasodifiy olingan qism --chi mashinada qayta ishlandi, .

Shartli ehtimollar (muammo bayonida ular foizlar shaklida berilgan):

Mashina unumdorligi o'rtasidagi bog'liqlik quyidagilarni anglatadi:

Va farazlar to'liq guruhni tashkil qilganligi sababli, u holda .

Hosil bo'lgan tenglamalar tizimini yechib, topamiz: .

a) yig'ish liniyasidan tasodifiy olingan qismning nuqsonli bo'lishining to'liq ehtimoli.

Keling, misol bilan boshlaylik. Sizning oldingizda urnada, teng ehtimollik bilan(1) ikkita oq shar, (2) bitta oq va bitta qora, (3) ikkita qora bo'lishi mumkin. Siz to'pni sudrab ketasiz va u oq bo'lib chiqadi. Endi buni qanday baholaysiz? ehtimollik bu uchta variant (gipotezalar)? Shubhasiz, ikkita qora shar bilan gipoteza (3) ehtimoli = 0. Ammo qolgan ikkita gipotezaning ehtimolliklarini qanday hisoblash mumkin!? Buni bizning holatlarimizda shaklga ega bo'lgan Bayes formulasi yordamida amalga oshirish mumkin (formulaning soni tekshirilayotgan gipoteza soniga to'g'ri keladi):

Eslatmani yuklab oling yoki

X– qiymatlarni qabul qiluvchi tasodifiy o‘zgaruvchi (gipoteza): x 1- ikkita oq, x 2- bitta oq, bitta qora; x 3- ikkita qora; da– qiymatlarni qabul qiluvchi tasodifiy o‘zgaruvchi (hodisalar): 1 da– oq to'p chiqariladi va 2 da– qora shar tortib olinadi; P(x 1)- to'pni chizishdan oldin birinchi gipoteza ehtimoli ( a priori ehtimollik yoki imkoniyat uchun tajriba) = 1/3; P(x 2)– to‘pni chizishdan oldingi ikkinchi gipoteza ehtimoli = 1/3; P(x 3)– to‘pni chizishdan oldingi uchinchi gipoteza ehtimoli = 1/3; P(y 1|x 1)– oq sharni chizishning shartli ehtimoli, agar birinchi gipoteza to'g'ri bo'lsa (to'plar oq) = 1; P(y 1|x 2) agar ikkinchi gipoteza to'g'ri bo'lsa, oq to'pni chizish ehtimoli (bir to'p oq, ikkinchisi qora) = ½; P(y 1|x 3) agar uchinchi gipoteza to'g'ri bo'lsa, oq to'pni chizish ehtimoli (ikkalasi ham qora) = 0; P(y 1)– oq sharni chizish ehtimoli = ½; R (y 2)– qora sharni chizish ehtimoli = ½; va nihoyat, biz qidirayotgan narsa - P(x 1|y 1) birinchi gipotezaning to'g'ri bo'lish ehtimoli (ikkala to'p ham oq), biz oq to'pni chizganimizni hisobga olsak ( a posteriori ehtimollik yoki imkoniyat keyin tajriba); P(x 2|y 1) ikkinchi gipotezaning to'g'ri bo'lish ehtimoli (bir to'p oq, ikkinchisi qora), agar biz oq to'pni chizgan bo'lsak.

Birinchi gipotezaning (ikkita oq) to'g'ri bo'lish ehtimoli, agar biz oq to'pni chizganmiz:

Ikkinchi gipotezaning to'g'ri bo'lish ehtimoli (biri oq, ikkinchisi qora), agar biz oq sharni chizgan bo'lsak:

Uchinchi gipotezaning to'g'ri bo'lish ehtimoli (ikkita qora), biz oq to'pni chizganmiz:

Bayes formulasi nima qiladi? Bu gipotezalarning apriori ehtimollariga asoslanib, buni amalga oshirishga imkon beradi - P(x 1), P(x 2), P(x 3)- va sodir bo'lgan voqealar ehtimoli - P(y 1), R (y 2)- gipotezalarning orqa ehtimolini hisoblang, masalan, oq shar chizilgan bo'lsa, birinchi gipoteza ehtimoli - P(x 1|y 1).

(1) formulaga yana bir bor qaytaylik. Birinchi gipotezaning dastlabki ehtimoli edi P(x 1) = 1/3. Ehtimollik bilan P(y 1) = 1/2 biz oq to'pni chizishimiz mumkin va ehtimollik bilan P(y 2) = 1/2- qora. Biz oqni tortib oldik. Birinchi gipoteza to'g'ri bo'lishi sharti bilan oq rangni chizish ehtimoli P(y 1|x 1) = 1. Bayes formulasida aytilishicha, oq chizilganidan beri birinchi gipotezaning ehtimoli 2/3 ga oshdi, ikkinchi gipotezaning ehtimoli hali ham 1/3, uchinchi gipotezaning ehtimoli esa nolga aylandi.

Agar biz qora to'pni tortib olsak, orqadagi ehtimolliklar nosimmetrik tarzda o'zgarishini tekshirish oson: P(x 1|y 2) = 0, P(x 2).|y 2) = 1/3, P(x 3|y 2) = 2/3.

Per Simon Laplas 1814 yilda nashr etilgan asarida Bayes formulasi haqida shunday yozgan:

Bu hodisalardan sabablarga o'tish bilan shug'ullanadigan favqulodda vaziyatlarni tahlil qilish bo'limining asosiy tamoyilidir.

Nega Bayes formulasini tushunish juda qiyin!? Menimcha, chunki bizning odatiy yondashuvimiz sababdan ta'sirga qarab fikr yuritishdir. Misol uchun, urnada 36 ta shar bo'lsa, ulardan 6 tasi qora, qolganlari oq. Oq sharni chizish ehtimoli qanday? Bayes formulasi voqealardan sabablarga (gipotezalarga) o'tish imkonini beradi. Agar bizda uchta gipoteza bo'lsa va voqea sodir bo'lgan bo'lsa, bu hodisa (muqobil emas) gipotezalarning dastlabki ehtimolliklariga qanday ta'sir qildi? Bu ehtimolliklar qanday o'zgargan?

Men Bayesning formulasi faqat ehtimollar haqida emasligiga ishonaman. Bu idrok paradigmasini o'zgartiradi. Deterministik paradigmadan foydalanganda fikrlash jarayoni qanday? Agar biror hodisa yuz bergan bo'lsa, uning sababi nima edi? Agar baxtsiz hodisa, favqulodda vaziyat, harbiy to'qnashuv bo'lsa. Ularning aybi kim yoki nima edi? Bayeslik kuzatuvchi nima deb o'ylaydi? Haqiqatning tuzilishi nimaga olib keldi berilgan falon ko'rinishga ish... Bayesian buni tushunadi aks holda Bunday holda, natija boshqacha bo'lishi mumkin edi ...

(1) va (2) formulalardagi belgilarni biroz boshqacha joylashtiramiz:

Keling, ko'rgan narsalarimiz haqida yana gaplashaylik. Teng boshlang'ich (apriori) ehtimollik bilan uchta farazdan biri to'g'ri bo'lishi mumkin. Teng ehtimollik bilan biz oq yoki qora to'pni chizishimiz mumkin edi. Biz oqni tortib oldik. Ushbu yangi qo'shimcha ma'lumotlardan kelib chiqib, gipotezalarni baholashimiz qayta ko'rib chiqilishi kerak. Bayes formulasi buni sonli bajarishga imkon beradi. Birinchi gipotezaning oldingi ehtimoli (formula 7) edi P(x 1), oq to'p chizilgan, birinchi farazning posterior ehtimoli bo'ldi P(x 1|1 da). Bu ehtimollar bir omil bilan farqlanadi.

Tadbir 1 da gipotezani ozmi-koʻpmi tasdiqlaydigan yoki rad etadigan dalil deb ataladi x 1. Bu koeffitsient ba'zan dalil kuchi deb ataladi. Dalil qanchalik kuchli bo'lsa (koeffitsient birlikdan qanchalik farq qilsa), kuzatish fakti shunchalik katta bo'ladi. 1 da oldingi ehtimolni o'zgartirsa, keyingi ehtimol oldingisidan shunchalik ko'p farq qiladi. Agar dalillar zaif bo'lsa (koeffitsient ~ 1), keyingi ehtimollik oldingisiga deyarli teng.

Sertifikat 1 da V = 2 marta gipotezaning oldingi ehtimolini o'zgartirdi x 1(formula 4). Shu bilan birga, dalillar 1 da gipotezaning ehtimolini o'zgartirmadi x 2, uning kuchidan beri = 1 (formula 5).

Umuman olganda, Bayes formulasi quyidagi shaklga ega:

X- quyidagi qiymatlarni olgan tasodifiy o'zgaruvchi (bir-birini istisno qiluvchi farazlar to'plami): x 1, x 2, … , Xn. da- quyidagi qiymatlarni qabul qiluvchi tasodifiy o'zgaruvchi (bir-birini istisno qiluvchi hodisalar to'plami): 1 da, 2 da, … , dan. Bayes formulasi gipotezaning posterior ehtimolini topish imkonini beradi Xi voqea sodir bo'lganda y j. Numerator gipotezaning oldingi ehtimolining mahsulotidir XiP(xi) voqea sodir bo'lish ehtimoli haqida y j, agar gipoteza to'g'ri bo'lsa XiP(y j|xi). Maxraj - bu numeratorda bo'lgani kabi, barcha farazlar uchun ko'paytmalarning yig'indisidir. Agar biz maxrajni hisoblasak, biz hodisaning umumiy ehtimolini olamiz daj(gipotezalardan biri to'g'ri bo'lsa) - P(y j) (1-3 formulalardagi kabi).

Yana bir bor guvohlik haqida. Tadbir y j gipotezaning oldingi ehtimolini qayta ko'rib chiqish imkonini beruvchi qo'shimcha ma'lumot beradi Xi. Dalil kuchi - – numeratorda voqea sodir bo‘lish ehtimolini o‘z ichiga oladi y j, agar gipoteza to'g'ri bo'lsa Xi. Maxraj - bu hodisaning umumiy ehtimoli. daj(yoki voqea sodir bo'lish ehtimoli daj barcha gipotezalar bo'yicha o'rtacha). daj gipoteza uchun yuqorida xi, barcha farazlar uchun o'rtacha ko'rsatkichdan ko'ra, keyin dalillar gipoteza qo'liga o'ynaydi xi, uning posterior ehtimolini oshiradi P(y j|xi). Voqea sodir bo'lish ehtimoli bo'lsa daj gipoteza uchun quyida xi barcha farazlar uchun o'rtacha ko'rsatkichdan ko'ra, keyin dalillar posterior ehtimollikni pasaytiradi P(y j|xi) uchun farazlar xi. Voqea sodir bo'lish ehtimoli bo'lsa daj gipoteza uchun xi barcha gipotezalar uchun o'rtacha bilan bir xil bo'lsa, u holda dalillar posterior ehtimollikni o'zgartirmaydi P(y j|xi) uchun farazlar xi.

Mana bir nechta misollar Bayes formulasi haqidagi tushunchangizni mustahkamlaydi deb umid qilaman.

Vazifa 2. Ikki otuvchi bir xil nishonga mustaqil ravishda o'q uzadi, har biri bittadan o'q uzadi. Birinchi otishma uchun nishonga tegish ehtimoli 0,8, ikkinchisi uchun - 0,4. Otishmadan keyin nishonda bitta teshik topildi. Bu teshik birinchi otuvchiga tegishli bo'lish ehtimolini toping. .

Vazifa 3. Kuzatilayotgan ob'ekt ikki holatdan birida bo'lishi mumkin: H 1 = (ishlayotgan) va H 2 = (ishlamaydi). Bu holatlarning oldingi ehtimoli P(H 1) = 0,7, P (H 2) = 0,3. Ob'ektning holati to'g'risida bir-biriga qarama-qarshi ma'lumot beruvchi ikkita ma'lumot manbasi mavjud; birinchi manba ob'ekt ishlamayotganligi haqida xabar beradi, ikkinchisi - u ishlayapti. Ma'lumki, birinchi manba 0,9 ehtimollik bilan to'g'ri, 0,1 ehtimollik bilan esa noto'g'ri ma'lumot beradi. Ikkinchi manba kamroq ishonchli: u 0,7 ehtimollik bilan to'g'ri ma'lumotni va 0,3 ehtimollik bilan noto'g'ri ma'lumot beradi. Gipotezalarning posterior ehtimolliklarini toping. .

1-3-masalalar E.S.Ventsel, L.A.Ovcharovning darsligidan olingan. Ehtimollar nazariyasi va uning muhandislik tatbiqlari, 2.6-bo'lim Gipoteza teoremasi (Bayes formulasi).

4-masala kitob, 4.3-bo'lim Bayes teoremasidan olingan.