大数据真的可以推动疫情防控吗?
2020年开年之际,新型冠状病毒感染的肺炎疫情汹涌而至。相比于2003年的SARS疫情,十余年间,新一代信息技术迅猛发展,人类社会已进入大数据时代。面对新型冠状病毒感染的肺炎威胁,大数据这一技术手段可提供重要帮助,城市管理者也在新型智慧城市建设的过程中获取了很多疫情防控和城市管理的经验。
大数据真的可以推动疫情防控吗?
面对紧急突发的公共卫生事件及多方来源的海量数据,如何联合政企单位科学运用大数据技术,为公众提供更完整、连续、准确、及时的防疫信息,为专家提供追溯疾病源头的方法,为决策者提供传染病发展的趋势,是大数据应用于防疫的三大重要任务。
可分析“涉疫”人员流动轨迹通过集成电信运营商、互联网公司、交通部门等单位的信息,大数据可以分析出人员流动轨迹。具体来说,利用数据分析、数据挖掘等技术,一方面可以通过手机信令等包含地理位置和时间戳信息的数据分析绘制病患的行动轨迹;另一方面,根据病患确诊日期前一段时间的行动轨迹和同行时间较长的伴随人员,大数据可以推断出病患密切接触者。综合分析确诊病患、疑似病患和相关接触者的行动轨迹,可以准确刻画跨地域漫入、漫出的不同类别人员的流动情况,这既为精准施治提供了有力指导,也为预测高危地区和潜在高危地区提供了有力依据。
可追溯传染病源头利用人工智能、深度学习等新兴技术,联合出行轨迹流动信息、社交信息、消费数据、暴露接触史等大量数据进行科学建模,可以根据病患确诊顺序和密切接触人员等信息定位时空碰撞点,进而有望推算出疾病传播路径,为传染病溯源分析提供理论依据。
可预测疫情发展态势通过高危人群,即确诊病患和病患密切接触者的运动情况,结合疫情新增确诊、疑似、死亡、治愈的病例数,借助传播动力学模型、动态感染模型、回归模型等大数据模型和技术,不仅可以分析展示发病热力分布和密切接触者的风险热力分布,还可以预测疫情峰值拐点等重要信息。根据预测的疫情发展态势,卫生部门可以针对发病热力分布,对重点区域强化卫生措施;依据风险热力分布,对可能扩散的区域提前设置防疫防控资源,避免出现二次爆发、局部爆发和多点爆发。同时,疫情发展趋势预测对于政府部门确定复工时间、出台公共管理和促进经济发展的措施都将起到很重要的作用。无论对决策者还是普通人,心中有“数”,才能提前陈设,防患未然。
新冠疫情拐点何时出现?大数据能否预测
中国科学院计算技术研究所研究员王元卓表示,疫情爆发期间,疫情数据的高位保持和新产生的传染突发事件对政府及相关管理部门现有的管控方法和措施都提出了新的严峻挑战。人们最关心的疫情的发展何时出现拐点?以及疫情何时能过去?我们的生活何时能恢复正常?而大数据的两个主要作用就是感知现在和预测未来。
王元卓融合所采集的开源网络数据,通过智能模型的学习,基于截至2月12日12时的数据,对当前的疫情的发展给出了如下分析和判断。
由于返程高峰的到来,尚未能够准确的从数据分析得出疫情拐点,其要根据对返程高峰的防控情况来决定,但从现有数据分析来看,疫情的峰值有望在2月中下旬出现。但目前,河南、浙江、广东大于1000人,安徽、湖南、江西大于500人,面对目前的返程期疫情防控仍然很严峻,所以对疫情拐点预测带来了很大不确定性。
王元卓认为,当前全国新增确诊病例趋于缓和,呈下降趋势,最高时接近4000人左右,疑似病例波动较大,但整体也呈现出下降态势,证明各级管理机构前期采取的“早发现、早诊断、早隔离”的措施取得明显效果,下一步各级管理机关还应该加大对机场、火车站、汽车站等交通工具的防范措施力度,避免返程高峰引起疫情再次上升。新增治愈病例呈上升趋势,新增死亡病例仍呈缓慢的线性增长趋势,说明社会医疗保障条件的有效增强,治愈率会越来越高,死亡人数会越来越少,当前阶段。一是要加大研发力度,尽快研发出疫苗,二是要给予群众以引导,增强自我防范意识。
搜索大数据:远程办公需求 环比上涨663%
近日,百度发布的《新冠肺炎搜索大数据报告-复工篇》显示,,自1月18日以来,疫情相关内容的搜索热度便持续攀升,一直是人们的关注焦点。而随着复工开学时间临近,复工开学相关内容的搜索热度也迅速上升,环比上涨8倍。报告指出,近30天远程办公需求环比上涨663%,“云开工”成主流。其中,北上广深等一线城市的网民最为关注“远程办公”。
当下,复工复厂成为热点话题。如何生产抗疫两不误,做到平安复工?各地因地制宜,利用大数据研判疫情,下好先手棋,逐步有序开展工作。通过汇总疾控、电力、交通等多部门的大数据,对复工复产做出精确评估。在杭州,有企业复工申报平台,不搞一刀切;在湖州,有开复工企业白名单制度;在绍兴,借助大数据分析,一些企业陆续恢复生产。
这些充分发挥移动互联网和大数据优势的举措,对疫情防控起到“过滤网”的作用。大数据的作用,从疫情初始到现在,先后历经了三个阶段:从“传声筒”到“防火墙”,再到“过滤网”。面对突发公共危机,不仅需要强大的人员、物资、财富动员能力,更需要强大的数据分析处理能力,而且越早介入,费效比越低。
在疫情爆发初期,为“传声筒”阶段,公众亟需各类信息的获得和传输。一方面,通过社交媒体、新闻客户端等渠道,实时获取疫情动态、防疫知识等信息。另一方面,在自我防护、官方通报之外,想获取更为完整、准确的数据和信息,进而参与到疫情防控的方方面面。
随着疫情防控进入第二阶段,全国多地进行严格的区域管理,移动互联网和大数据的优势格外凸显。某种程度而言,它的作用就是“防火墙”,让疫情防控更加高效。这时,移动互联网既是民情信息的聚集地,也是疫情防控的资料库。据此,政府可以做出更理性的决定,采取更有利的行动。
眼下,疫情防控工作到了关键阶段,发挥好大数据的“过滤网”作用至关重要。分析人群聚集分布情况,指导医疗资源合理调动,实现尽早发现病患和密切接触者,切断传染源,尽最大可能控制疫情波及范围。同时,推动复工复产,降低疫情对经济的影响,做好保障和改善民生工作,让百姓安心。
数据采集手段及流传 仍存问题
虽然大数据在精准防疫和决策支持方面可以发挥重大作用,但从我国此次应对新型冠状病毒感染的肺炎疫情来看,仍有很大空间值得挖掘和提升。为了进一步推动大数据助力疫情防控,以下3个问题亟需得到解决。
一是数据采集手段原始,质量较低。一些政府部门和基层组织在采集疫情相关数据仍然采用手工作坊式的人海战术。在采集时通常采用手工填表、打电话等方式,这既给基层工作人员增加负担,也无法保证数据的真实性。例如,在采集患者个人信息时,由于没有区分所留手机号到底属于病患还是其家属,运营商系统核验时就会存在大量身份证号与手机号不一致的情况,导致后续数据分析的准确性和真实性模糊。
二是数据流转存在隐私泄露的风险。为应对新型冠状病毒的防疫需求,有关部门第一时间制作了隐去个人隐私信息的确诊患者相同行程查询工具,但在原始数据上报过程中,数据还是遭到了不同程度泄露,这给被泄露人的生活带来了极大不便。
三是跨地区、跨层级、跨部门的数据流转难以实现。大数据的核心在于互联互通。针对个人的行为分析,手机信令仅能提供较为粗糙的移动轨迹,对区域性分析结果影响较小,但对于轨迹精确度要求高的防疫场景,则需要更多例如火车、飞机、共享单车、网约车、搜索引擎、社交媒体等更多维度跨层级和跨领域的信息。目前,不同企业和政府部门的数据呈现“孤岛”形态,数据亟需高效整合,才能更好应用于疫情治理。
打破“孤岛”形态,推动大数据助力疫情防控
面对不断蔓延的疫情形势,有关部门可在以下3个方面进行改进和强化。
一是提升采集手段,强化数据校验。要通过各种技术手段,避免数据低效采集。例如,各地疾控部门对于患者的流行病学调查,除了通过对患者直接的调查采访外,还应从有关部门采集患者的手机信令数据、交通出行数据,甚至是微信、支付宝等基于位置服务的数据(LBS数据)。这些数据的准确度往往比手工采集要高得多。此外,还需要进行多方数据校验,从源头上提高数据质量,为后续的数据分析奠定良好基础。
二是保护病患隐私,加强安全规范。越是紧急状态,越需要加强对数据隐私的保护,否则会引发公众不必要的猜测和恐慌。政府机构在信息发布中,应坚守两个原则:一是脱敏原则,发布内容要“经过处理无法识别特定个人且不能复原”;二是非必要不公开原则,发布内容应限于与疾病传播和公众防疫相关,例如日本厚生省拒绝发布患者的国籍数据就体现了这一原则。
三是打破数据“孤岛”,高效运转数据。对于政府部门来说,当前亟需打通各环节数据“孤岛”,综合卫生、通信、交通、公安、人口、气象等多维度数据,进行更加深入的综合分析计算。同时,在进行疫情态势分析预测时,也应不断根据更新的数据调整和优化模型与算法,提升预测模型和算法的准确性。(文章来源:中国信息通信研究院、中新经纬、新浪科技)
责任编辑:Shine
买车卖车 养车维修 疑难故障 学大招
扫码加群 BOSS团同行好友等你交流