维基百科只覆盖不到5%的人类知识?

04.11.2015  20:01

文/James Titcomb 微信公众号:最天下(theveryworld)

维基百科的词条覆盖还非常不足,数百万重要的主题在其网页上无迹可寻。还有很多词条,包括一些非常重要的领域,都还没有达到较高的质量。

维基百科是互联网上最大的在线百科全书,也是人们半夜做功课时求助的对象。现在,维基百科上的英语词条已超过500万个。

11月1日,在介绍一种澳大利亚东部罕见的灌木植物Persoonia terminalis的词条发布后,维基百科宣布自己的词条数目达到了上述新高峰。在14年的时间里,维基百科积累了约30亿个单词、1800万个参考条目和30TB的数据(这相当于51万小时速度为每秒128kb的音频文件)。按每分钟300个单词的速度计算,要读完维基百科现在全部的词条,需要一刻不停地读上19年。

不过,据估算,维基百科要覆盖全部的人类知识还相差甚远。维基百科用户emijrp正在运营一个寻找评估相关数据方法的项目,他表示,要覆盖全部人类信息,需要至少1.04亿个词条。

相关数据

维基百科英文词条

词条数:500万

总词数:29亿

数据库大小:3000万兆字节

编辑人数:126,672人/月

页面阅览量:80亿次/月

最长词条:美国最高法院法官助理名单( List of law clerks of the Supreme Court of the United States)

编辑次数最多词条:小布什(George W Bush)(4.5万次编辑)

尽管如此,这一预计数字结果依然遗漏了大量的知识,如评估认为覆盖科学范畴的词条需要4470万条,但这个数字并没有包括物理学和气象学的知识。另外,很多文章只介绍了最基本信息,绝大多数材料都偏向西方社会,而且大多数词条的篇幅都非常短。

例如,据评估,仅覆盖航天就需要2500万个词条,而且这个数字还在不断增长。

维基百科社区认为:“维基百科的词条覆盖还非常不足,数百万重要的主题在其网页上无迹可寻。还有很多词条,包括一些非常重要的领域,都还没有达到较高的质量。

尽管如此,500万的词条数还是使维基百科成为了有史以来最大的百科全书。在维基百科出现之前,有记载的最大知识纪录是1408年编撰完成的《永乐大典》。这本百科全书耗时5年,囊括了22,937卷手写材料。

2006年,也就是维基百科创立5年后,英语词条数突破1百万。从那之后,维基百科的词条数一直维持着一个相对稳定的增长水平。

维基百科有里程碑意义的第500万个词条由澳大利亚志愿者卡斯·利贝尔(Cas Liber)创建,他也是Persoonia terminalis词条的作者。目前,他名下的词条数达到1500条,编辑次数达到14万次。