17岁高中生制作新冠追踪网站 被CDC表扬

把科学带回家 2020-04-09 19:18+-

17岁高中生制作新冠追踪网站 被CDC表扬

现在国内在播报国外新冠疫情时,常常使用约翰霍普金斯大学建造的网站。这个网站的访问量是每天10亿,而建造和维护者是约翰霍普金斯大学的两个中国博士生。

约翰霍普金斯大学的网站实际上是在1月21日研发,1月22日上线的。不过,有一个网站比它更早开始追踪全球新冠疫情,它也是现在世界上最大的新冠追踪网站之一。而它的开发者,是一个17岁的高中生。

2019年12月底,就在川普还在佛罗里达度假,而媒体开始播报武汉出现奇怪的肺炎的时候,一个17岁的少年感到忧心忡忡,并开始建造一个追踪疫情的网站。

17岁高中生制作新冠追踪网站 被CDC表扬

2019年12月30日,路透社援引中国政府的报道,武汉出现症状类似SARS的27个病例。

这个少年叫做 Avi Schiffmann,来自华盛顿州的默瑟岛高中(Mercer Island High School)。

17岁高中生制作新冠追踪网站 被CDC表扬

你可以在下面这个地址访问他建造的这个网站:

ncov2019.live

17岁高中生制作新冠追踪网站 被CDC表扬

他制作这个网站最初的动机是为了帮助人们更好更快地收获各国政府发布的新冠数据,因为阅读中文和七七八八的外国网站实在是太难了。

此外,许多官方机构的数据更新并不及时,比如美国 CDC 周末不更新,而且显示的是前一天下午4点的统计结果。

为了解决这些问题,他从世界卫生组织、美国疾病控制与预防中心(CDC)、韩国联合通讯社(Yonhap News Agency)以及世界各国政府的网站上搜罗数据,然后整合起来发布。

而在他的网站上线的时候,新冠的感染人数还不到1千人,而且还没有在中国以外的地方爆发。

17岁高中生制作新冠追踪网站 被CDC表扬

在这个网站上,你可以分大洲、分国家、分州浏览确诊病例、死亡病例以及痊愈病例的数据。网站的更新速度也很快,每分钟都会自动更新一次。

作为对比,而约翰霍普金斯大的网站是每天更新,而且数据是由博士生董恩盛、杜鸿儒和一些志愿者共同搜集的。

17岁高中生制作新冠追踪网站 被CDC表扬

结果,Avi 的网站爆红,截止3月中旬一天有3千万的访问量,总共有3.5亿访问人次,网站流量的60%的来自美国以外的国家。

网站红了以后,他也被媒体的邮件轰炸了,大家都想采访他,其中包括《彭博社》、《纽约客》等大媒体。有很多医药公司和科技初创公司给他发了offer,邀请他去实习,有人甚至出价800万美金要在他的网站上投广告。美国 CDC 甚至给他发了庆贺函,夸他数据采集和更新做得好。

在接受采访的时候,Avi Schiffmann 告诉《纽约客》:“我只是想让人们容易获取数据,但没想到它会变这么大。”

Avi 不但对于新冠疫情的重视比身边人要早,也很早开始注意到口罩的重要性。他很早就开始自制口罩,连他的外科医生老妈现在都后悔没有早听儿子的。

17岁高中生制作新冠追踪网站 被CDC表扬

所以,他是怎么制作这个网站的呢?

Avi 使用的技术叫做抓取(web-scraping),你可以把它看作大型的自动复制黏贴。

17岁高中生制作新冠追踪网站 被CDC表扬

比如,微博上有人在评价某部青春爱情动作电影,而横店影视城的某个分析师想看一看大家怎么看这部剧。他可以雇佣很多人把带有这部剧tag的微博都复制黏贴到一个表里,也可以用抓取技术自动操作。

因为网站五花八门,所以抓取也不是一个简单的工作。但是一般来说,抓取时要先获取要搜刮的网站的 URL 地址,下载所有的 HTML 代码,接着,要选择需要筛选的数据,然后打包下载,并以特定格式输出。

17岁高中生制作新冠追踪网站 被CDC表扬

抓取这个技术很常用,比如房产中介的网站就会用这个技术更新他们的房源。还有一些比较不同电商平台价格的网站和APP用的也是这种技术。当然,这个技术还被用于旧网站的信息搬运,或者社交媒体分析。

17岁高中生制作新冠追踪网站 被CDC表扬

一些数据分析和市场调研公司也会用这个技术建造他们的数据库,然后把数据库卖给其他有需要的公司。

比如,有个数据分析公司 hiQ 就曾经从领英获取失业人数的数据,然后卖给其他公司,结果它就被领英拉黑了。不过,2019年加州的上诉法院裁定,未经允许的情况下对公共领域的数据进行抓取的行为并不违法。所以说 Avi 小哥用抓取软件搞事情是不会进局子的。

17岁高中生制作新冠追踪网站 被CDC表扬

那他的编程是在哪儿学的呢?

他是自学的编程。7岁开始,他就在油管上观看编程的视频,然后制作了30多个网站。在做这个网站的时候,小哥也是边学边练,不懂就问谷歌。

17岁高中生制作新冠追踪网站 被CDC表扬

在这次的新冠网站之前,他在小学就做过一个类似的网站,这个网站会广播当地高中体育比赛的分数,还会展示火星的天气。

光会编程不算什么,为了网站好看又好用,他还自学了UI(用户界面)、UX(用户体验)设计以及3D建模。

17岁高中生制作新冠追踪网站 被CDC表扬

别看 Avi 编程玩得贼溜,他同学在学校里可不是什么优等生,而是个C等生,他的爱好其实就是编程。为了制作这个网站,他还翘了一周的课。

关于学校的学习,Avi 感到很无奈,“我想早点毕业,这样就能安心做网站了。有时候因为有数学考试,我的网站就耽搁了。”

但这并不意味着这个常拿C的少年不爱学习。在接受技术新闻网站 Geekwire 的采访时他说,他99%的空余时间都拿来学习新技术,现在在同时做10个项目。

17岁高中生制作新冠追踪网站 被CDC表扬

也有人觉得,这娃是不是要成为下一个小扎啊。在这个问题上,Avi 倒是很务实:“下一个扎克伯格不会建社交网络,下一个拉里佩奇也不会建搜索引擎。我要做我自己。”

他想把这个疫情追踪网站继续做下去,因为下一次疫情离人类并不遥远,而并不是所有人都必须要精通十八国语言才能读懂全世界。

他最喜欢的是乔布斯的那句话:“只有疯狂到认为自己能改变世界的人,才能真正改变世界”。