2010年《让子弹飞》中,土匪张马子伏击县长马邦德时有一句经典台词:“别急,让子弹飞一会儿。”最后子弹成了决定输赢的关键一枪,也正是这样一颗子弹串起了剧中所有人的命运。
之所以用一个四年前的老电影故事,主要是因为子弹飞行和命中目标的过程,以及这个过程中的看客心态和射手心态,和我们现在的环境非常相似:大数据和公共卫生建设。过去几年,大数据技术对公共卫生就像一颗高速飞行的子弹,无时无刻不在空飞行,无法真正为公共卫生提供成熟、可操作的解决方案。
回顾过去,2009年的一场甲型H1N1流感是拉动大数据的关键力量。在与夺去数百人生命的流行病的斗争中,人们发现了预测流行病的重要性。在传统的公共卫生管理中,当发现新的流感病例时,医生通常需要通知疾病控制和预防中心。但这种治疗有一个致命的缺点:流行性疾病的传播速度远远快于传播后的信息——人们发病多天后会选择医院进行治疗,从治疗到医院发出预警信息进行诊断会有一至两周左右的滞后期。结果,当一种流行病真正在公众中爆发时,它已经错过了最佳预警期。
因此,在公共卫生的流行病管理中,如何把握这个常常被医疗管理者和公众忽视的黄金周成为关键。我们可以回放当一种流行病在个体身上出现时,人们的行为是如何受到压力的:第一天,他们会忽略一些轻微的不适,继续工作和学习;第三天、第五天,甚至在接下来的一周,病情扩大,不适加重,于是开始通过网络查询病情和相应的治疗方案。这时候人的行为被转移,有的人继续自我治疗,有的人选择去医疗机构治疗。
其中,从第一周到第三天开始后的第二周,行为大数据成为预测的关键。在此期间,人们在网上询问各种关于疾病和自我治疗方法的问题。无论是问疾病关键词还是问药物关键词,都可以成为大数据预警的触发机制。通过实时监测,大数据公司可以发现不同疾病的地理分布和接触人群的广度,并结合医务工作者的丰富经验判断疫情爆发的可能性。
比如谷歌的“流感预测”就是目前海外高度认可的案例。他们将美国人搜索最频繁的5000万条词条与美国疾控中心提供的2003年至2008年季节性流感传播期的数据进行对比,最终通过建立数学模型构建了预测体系。2009年发布了冬季流感的预测结果,与官方数据的相关性高达97%。目前,谷歌疫情疾病预测包括流感趋势和登革热趋势。
2010年,中国政府部门开始尝试与百度等互联网科技公司合作,尝试通过大数据挖掘管理实现疫情疾病预警管理。中国疾病预防控制中心副主任、中国科学院院士高福也认同大数据在公共卫生防控中的作用。他公开表示,大数据可以在流感到来之前为人们提供一些解释性信息,为预防流感提供缓冲时间。
如今,中国不仅预测了流感,还开始预测包括肝炎、结核病和性传播疾病在内的四大疾病。百度是这个大数据预测服务的提供者。除了查询数据,数据源还使用了谷歌没有使用过的微博数据,以及百度知道的疾病相关问题的趋势。借助其在移动互联网拥有超过1亿用户的14个门户,移动数据也将为下一步的预测提供深远的支持,如:各地患病人口迁移的数据特征、各地天气变化等。据说未来的预测会从目前的4种疾病扩大到30多种重大疾病。
在数据分析和挖掘方面,百度疾病预测以区域差异为重要变量,对每个城市分别建模,仅基于数据输出的模型就有300多个。结合精心准备的背景数据,百度的疾病预测最终产品可以提供全国331个地级市、2870个区县的疾病情况预测。
最后,大数据不再只是飞行。登陆中国公共卫生管理只是一个美好的开始。我们可以想得更多,这个数据库的模型可以更丰富。比如在数据采集端,可以通过智能移动健康设备实现对个人健康数据的实时监控,并将数据传输到公共健康管理数据库,还可以建立个人健康管理的电子记录。在数据利用方面,可以通过个人电子健康档案实现对家庭疾病和慢性病的实时监测,实现长期对症治疗。(解放军305医院教授鲁愚)