有一家位于南京的名为摄星智能的公司,近期做了一件值得称赞的事,他们研发出了一个能够进行实时更新的疫情预测模型,该模型的准确率高得令人惊叹,其误差率仅仅只有0.3%,这个模型自2月3号起便开始向公众开放,所有的人都能够通过上网查看到未来一个月疫情有可能出现的发展趋势状况,这相较于每天只是对着数字盲目猜测而言要可靠得多。
海量数据是预测的基础
若要达成精准的预测,首先必须得具备海量的、真实的数据作为基础。摄星智能的那些工程师们从起始之时就从来未曾有过闲暇,他们运用自己所研发的爬虫工具,如同勤劳的蜘蛛那般在网络之上搜集信息。
自2019年12月8号媒体首次报道疫情起,直至采访当日的全部公开数据,他们都予以爬取。其中不仅涵盖每日新增的确诊与疑似病例,还包含治愈人数、死亡人数,甚至细致到每个城市的数据,以及全国正在接受医学观察的人数这一情况。
经典模型的现代化改良
仅仅只有数据是不行的,还必须要有科学的数学模型用以分析这些数据。摄星智能的算法团队快速地调研了国内以及国外各种各样的预测算法,最终挑选出了两个经典的传染病模型:SIR和SEIR。
这俩模型身为流行病学的资深者,然而面对全然崭新的新冠病毒,势必要予以改良,依据不同阶段里政府管控力度存在的差异,针对模型展开了精细的调整之举,使得模型更契合中国抗疫的实际情形。
机器学习让预测更聪明
只不过是个经改良后的空壳子的模型,实则是机器学习使其变得聪明起来。研发团队将爬取到的数量庞大的历史数据,毫无保留地输入进模型,让其自行去学习并训练各项参数。
此过程仿若教导一个孩子去认知动物,为其展示数量众多的猫的图片,如此一来便可知道究竟何为猫了,借由此番方式,模型能够持续优化自身算法,致使预测结果愈发趋近于真实情形。
借鉴历史是为了更好前行
针对这次疫情的数据之外,研发团队还引入了一个强大的“外援”,那即是 2003 年 SARS 疫情的发展数据。尽管病毒存在差异,然而同属冠状病毒家族,疫情的传播以及发展具备诸多共通之处。
那种跨时空的数据借鉴,是他们把SARS的数据拿来训练模型,这就等同于让模型提前学习了上一场“考试”的答案。如此一来,模型对疫情的走向拥有了更深刻的理解,预测起来也就更加有底气了。
实时更新动态优化
最厉害的是这样些地方,这个模型并非那个一成不变的,它是能够做到实时更新的。官方那边发布出来哪些最新的疫情数据,模型当即就能够捕获,随后会自动地使预测结果得到针对性的调整。
这便意味着,你每日所见到的最新预测,皆是依据当下此刻的最新情形推算得出的。就拿2月2号早上8点那次的预测来说,他们在前一日预测的确诊人数为17256人,然而实际公布的却是17205人,误差仅仅只有少得可怜的0.3%。
智能预测的公众价值
当时杨理想创建这家公司的最初想法,是要凭借相关技术给社会干些实在的事。此次将预测模型朝着公众予以开放,期望每一位个体都能够借助这个工具,在有关自己未来的生活以及工作方面有一份合理的规划 ,这都成为了他的想法。
不论政府部门对医疗资源予以调配,还是普通老百姓作出哪天出门采购的决定,此预测均可给出极具价值的参考。信息呈现透明状态,大家内心方不再慌乱,众人齐心协力,打赢这场仗的信心亦愈发充足了。
注视完这篇文稿,你是否也怀揣冲动立刻要去探寻一下那个预测链接?对于这种高科技化的预测,在我们普通人规划生活方面究竟能起到多大的助力作用?欢迎于评论区域交流一下你的见解看法,可千万别不记得给予点赞以及给予分享,好让更多的人得以目睹这个颇具实用价值的工具。


