crowd-sourcing一词,中文译名“群众外包”,简称“众包”。前些年“外包”这一词汇及其概念在国内生物医药、软件制作、服务业等行业议论很多,被认为是互联网带来的一种全新的商业模式或生产组织形式。据不久前的《自然》杂志报道,越来越多的自然科学研究领域甚至应用科学已经或正在和“众包”搭上关系,从数学难题的破解、蛋白质分子结构的确定到台风预报、科技成果转化等都受益于“众包”这种机制。为帮助读者了解并关注这一科研动向,我们特编译了这组稿件。――编者
 

研究人员发现,在网上通过“众包”这种形式的合作,可以加快他们的工作效率

 

走向网络的数学研究

  2009年1月底,英国剑桥大学数学家蒂莫西·高尔斯(Timothy Gowers)开始了他后来所称的“我的数学生涯中最令人兴奋的六周。”受到在线公民科学运动的启发和激励,高尔斯在其博客上发布了一个深奥的数学定理,让他的读者们来证明这个定理――集众人之智慧来挑战这一难题。
 
  在“众包”中发挥你的专长吧,高尔斯的想法是,“如果能将一大批数学家的大脑连接起来,他们也许可以非常有效地解决一些问题。”
 
  事实证明他们可以。在问题发布后几个小时内,高尔斯的博客热闹非凡,数学家们发表着他们各自的观点和想法,你来我往,你争我辩,互不相让,好似一场头脑风暴大爆发。高尔斯原本希望能藉此获得一些对这个问题的新的见解,到了3月间,在有了近千条评论后,他宣布这条定理已经得到了证明。这令他惊讶万分,“非常意想不到的结果,这是一个解决问题的实用办法,此外还有这一过程带来的一波又一波的兴奋感觉。”他说。这个数学定理的证明最后以集体化名D·H·J·博学者的名义发表。
 
  数学通常被视为孤独寂寞的研究领域,数学家通常在几乎与世隔绝的情况下默默无闻地工作。高尔斯的做法似乎与学术界固有的文化氛围相悖,因为在通常情况下,这些研究人员只有在发表论文时才会与他人分享他们的想法。
 
  如今这种开放的研究态度已经在网上站住了脚跟,一个称为“博学者”的持续的众包计划在网上已初具形态。在“博学者”的专门网站上,人们可以就一些新的数学挑战问题发表看法,进行辩论,如果他们认为这个问题值得他们付出,就会提交自己的解决方案。组织协调“博学者”挑战问题之一的希伯来大学数学家吉尔·卡莱(Gil Kalai)说道,这种形式“对社会的影响甚至大于对科学本身的影响”。
 
  这些网络开放项目与商业企业的“众包”项目的运作有些相似,在网络上公开一些技术性问题或数据分析问题,寻找专业人才,以及他们对这些问题的反应。大部分被吸引的参与者都是出于对待解决问题的极大兴趣,以及想要获得一个社会认可机会的愿望。同样,作为发包方的公司也把通过这一过程发现优秀人才视为重要的收获。
 

“孪生素数猜想”的成功模式

  加州大学洛杉矶分校的数学家陶哲轩认为,起关键作用的是“博学者”在网上的快速反应。“我们可以对数学领域内的热门问题作出迅速反应。”例如,去年4月,新罕布什尔大学达勒姆分校的数学家张益唐称,他在解答素数理论中的一个重要的开放式问题上,已经迈出了一大步。这个问题就是“孪生素数猜想”,孪生素数是指两个相差为2的素数,例如,11与13,41与43,孪生素数猜想认为可能存在无穷对这样的素数,这样的“孪生素数”是否有无限多?张益唐虽然没有给出最后的答案,但已经将“孪生素数”的数目从无限多降低到了数百万。“博学者”对于想要接近问题答案的人来说,似乎是一个理想的工具。
 
  这个被命名为“博学者”8号问题的素数理论问题,是去年6月间由陶哲轩协调开始的。在短短几个月时间内,全世界的数学家开始对张益唐的论证进行细化,在“博学者”网站上讨论并回答彼此的问题,很快就将“孪生素数”的数目从数百万降低到了数千。到了11月,加拿大蒙特利尔大学的数学家詹姆斯·梅纳德(James Maynard)借这股东风将“孪生素数”的数目进一步降低到了600以内。
 
  “博学者”8号问题取得的进展是这种网络合作方式的胜利,陶哲轩说道,如果数学家以传统的方法(即发论文)来攻克这类问题,可能要经历多年时间才能走到目前这一步。
 
  然而,“博学者”一路走来并非每次都能取得这样的成功,有些挑战题目甚至未能激起一丝波澜。但在积累了五年的经验之后,主办者已经把握到了一些决定成功的特性。“如果是能引起许多数学家的兴趣,并且在他们理解范围之内的问题,”陶哲轩说道,“显然就会有大量的访问者。”这样的问题往往会吸引有丰富知识专业人员的广泛参与。
 
  也许最重要的经验教训是:建立和维持一个“博学者”的项目需要投入大量的心力。到目前为止,陶哲轩和高尔斯只启动了“博学者”其中的两个项目。“要引起人们的兴趣并非易事,”高尔斯坦承这一点。“需要有一个积极活跃的带头人,这个人要能够花费大量的时间和精力来组织讨论,引导并保持其向高效率的方向迈进,”陶哲轩说道,“否则,一开始轰轰烈烈的活动可能很快就会烟消云散,销声匿迹。”
 

保持吸引力的奖励机制

  在学术界,人们愿意花大量的时间为“荣誉”或为科学而奋斗――但只限于某种程度。曾参与过众包项目的伦敦大学学院宇宙学家托马斯·基钦(Thomas Kitching)认为,超过那个限度,“似乎金钱或奖金的激励还是很有必要的。”
 
  这就是支持众包项目的奖励机制,它为提出解决方案的专家提供经济奖励。这些举措中有些是政府主导的,如美国宇航局(NASA)的比赛实验室(NASA Tournament Lab)和cross-agency Challenge.gov网站。
 
  还有一些在网上发布一些纯属商业化行为问题的征答,其中做得最为出色的是提供技术挑战的创新中心(InnoCentive)网站,其挑战问题的范围从平凡而重要的到专业而深奥的,前者,如发展中经济形式的“应急厕所照明”或“头发长时间不洗保持清洁法”等,后者,如“寻求某化合物的类似物”或“稳定泡沫乳剂”等。这个网站的“问题解决者”注册用户超过30万人,这些人都有希望获得5 000美元至100万美元之间的奖励,如果他们的解决方案切实可行的话。
 
  另一个商业实例是美国加州旧金山的大数据分析众包平台Kaggle公司,Kaggle专门从事从石油和天然气勘探到靶向药物预测等数据分析。2012年,基钦带领的一个由天文学家组成的研究小组发起了一项Kaggle比赛,名为“观察黑暗世界”,要求利用物质的引力透镜效应对背景天体的作用,绘制出暗物质在星系中的分布图,名列前三名的最佳算法提供者将获得由总部位于伦敦的温顿投资管理金融公司提供资助的2万美元奖金。这次比赛对于相关各方都是一个成功:获奖作品给天文学家提供了对现有算法约30%的改进;温顿投资公司以通常广告和面试成本一小部分的代价,从竞争名单中挑选招募到了新的分析师。
 
  对这类项目的需求可能会增加,英国爱丁堡大学的天文学家、从这项比赛中产生的研究项目5的合作者之一大卫·哈维(David Harvey)说,“随着平方公里阵列射电望远镜、大口径综合巡天望远镜等新的天文望远镜的诞生,天文学家将面临数据处理和分析的一系列问题。”
 
 

资料来源 Nature

责任编辑 则 鸣