注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

天地不仁,以万物为Googol!

天行有常,不以物喜,不以己悲……

 
 
 

日志

 
 

终于理解了!  

2007-05-27 13:53:47|  分类: 积累 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
最早是在负暄老大的blog上看到的,一篇关于贝叶斯理论的解释:http://www.yudkowsky.net/bayes/bayes.html。可惜负暄老大blog今天打不开,没法去刨祖坟找最早的出处了(其实是不得不自己翻译了)……

着来自一个医学问题:参加例行透视检测(routine screening)的40岁年龄组的妇女,有1%患有乳腺癌。得癌症的妇女里,80%会有阳性反应(get positive mammographies,最后那个词查不到)。没有得癌症的妇女里,9.6%会有阳性反应。现在,有一个属于四十岁年龄组的妇女,他的检测反应呈阳性,那么她真的患有癌症的几率有多大?

最终的结果很令人惊异,看到这里的人不妨先自己大概算一下,然后再看看为什么。当然开头的那个论文里解释的很清楚,我这里只不过是拾人牙慧而已。

最笨的方法,假设处于40岁年龄组的妇女有10000(1万)个,那么患有乳腺癌的人数是10000 * 1% = 100个。这100个人里有阳性反应的是100 * 80% = 80个。而不患乳腺癌的人数是10000 * (1 - 1%) = 9900个,这9900个人里有阳性反应的是9900 * 9.6% (约)= 950个。那么,这10000个受检测的人里,有阳性反应的是80 + 950 = 1030个人,而这1030个人里只有80个人真的得了癌症,那么当检测为阳性时的概率就是80 / 1030 = 7.8%。

好了,答案出来了,结果是7.8%,不知道你看到这里怎么想。

然后,再说明一下如何将这些数字抽象成数学概念,并且用概率里的贝叶斯理论来得到答案。

由于得癌症和检测呈阳性是两个事件,这里假设分别为事件A(得癌症)和事件B(检测呈阳性)。那么事件A的概率(以下简称A的概率,用P(A)表示)P(A)=1%。

事件B的概率(以下简称B的概率,用P(B)表示)就比较复杂了,要分两种情况:A成立(得癌症,A)和A不成立(不得癌症,A。太阳!没法在上面加横线,就加在下面了,大家凑合看……)。在A情况下,P(B)=P(B|A)=80%,其中P(B|A)表示在A成立的情况下,B发生的概率。在A情况下,P(B|A)=9.6%。根据贝叶斯定理:
P(B) = P(B|A) * P(A) + P(B|A) * P(A) = 80% * 1% + 9.6% * 99% = 10.3%。这个P(B)是指在所有情况下,B发生的概率,也就是所有人检测呈阳性的概率。

那么,如果检测呈阳性,实际得癌症的几率是多少呢?这个表示为P(A|B) = P(A) * P(B|A) / P(B) = 1% * 80% / 10.3% = 7.8%。

恩……其实写这个的目的是想说,很多时候你看到的统计数据的意义和你想的并不一样。即便80%这种准确度,依旧无法准确判定。原因就在于,80%仅仅是一个条件概率,是在已经确认得癌症的情况下,检测的准确度。而由于得癌症本身的概率很小,那么检测错误的数量就会被放大,最终结果,如果检测阳性,真正得癌症的概率却很小。当你能将以前错误的直觉感觉消除,恭喜悟到了。

当然,这并不是说不要相信检测。毕竟癌症是真实存在的,就算大家不爱惜数学,也要爱惜身体不是。由于检测准确的概率比较小,那么,多次检测后如果都是阳性,比如5次连续检测呈阳性,那么得癌症的几率是多大?很简单1 - (1 - 7.8%)^3 = 33%。这时的概率就很大了,需要做进一步的检查。

由此可以看到,定期体检的重要性!


这里还有另一个违反直觉的例子,与贝叶斯无关:一份报告显示,美国黑人嫌疑杀人犯获罪的概率四倍于美国白人。这说明什么?
  评论这张
 
阅读(361)| 评论(11)
推荐 转载

历史上的今天

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017