因为地处远离街道的一个角落里,旧金山SoMa区的全食超市婴儿食品区并没有太多的客流量。我瞥了一眼保安,然后伸手去拿苹果和西兰花柠檬泡芙。把它们放进我的空购物车中后,马上又把它们放回去了。“你拍到了吗?”我让我的同事用他的iPhone拍摄这一过程。这是我第一次带薪“表演”。我正在帮助训练软件,以便让未来的机器人能够帮助人们购物。
全食超市是一个不知情的参与者,这是一个德国-加拿大的创业公司Twenty Billion Neurons的项目。我悄悄地做了其他9个简单的动作,包括打开冰柜,从右向左推车,然后从左向右等等。然后我什么东西都没买就离开了。后来,我花了大约30分钟把视频剪辑到对方所需的2到5秒,并把它们上传到亚马逊的众包网站Mechanical Turk上。几天后, 我得到了3.5美元的报酬。如果Twenty Billion想要开发一个购物助手机器人软件,它将需要更多的数据。
在偷偷摸摸的环游全食超市的时候,我加入了一支无形劳动力队伍:他们的报酬很少,以推进人工智能的名义做一些奇怪的事情。你可能已经被专家或者媒体告知人工智能是技术的顶峰,但这些工人是是人类背后混乱现实的一部分。
支持者认为,生活和商业的每一个方面都应该由人工智能来调解。这是一场由Alphabet(谷歌母公司)等大型科技公司发起的运动,表明机器学习可以处理识别语音或图像等任务。但目前大多数机器学习系统,如语音助手,都是通过训练算法来构建的,这些算法有大量的标签数据,这些标签则来自于检查图像、音频或其他数据的承包商,他们会给出标注,比如那是一只考拉,那是一只猫,她说的是“汽车”等等。
现在,研究人员和企业家希望人工智能能够理解现实世界中的行动。因此,工人们需要在超市和家里进行“表演”。他们正在生成数据来训练人工智能算法。这就是为什么有一天早上,我会脸朝下趴在办公室地板上, 让粗糙的合成纤维挤压着我的脸。然后,我的同事拍了一张照片。把它上传到Mechanical Turk后,我从伯克利一家名为“Safely You”的八人创业公司那里获得了7美分的报酬。当我打电话给其首席执行官乔治·内舍尔(George Netscher)说谢谢时,他突然大笑起来,然后假装正经起来。“这是否意味着存在利益冲突?”(我写这篇文章所获得的6.30美元已经捐赠给 Haight Ashbury 免费诊所了。)
内舍尔的创业公司开发了一种软件,通过监控来自养老院的视频信息,来检测老人是否已经跌倒。老年痴呆症患者往往不记得他们为什么或怎么会倒在地板上。 在加州附近的11个设施中,Safely You的算法可以帮助工作人员快速找到一个视频中的位置, 从而揭开这个谜团。
Safely You正在收集像我这样的假摔数据,以测试它们的系统。该公司的软件主要是由护理设施中产生的老年人视频数据来进行训练,不过在训练前需要让员工或承包商进行标注。通过用其他地方(比如Mechanical Turk)搜集而来的数据进行训练,可以迫使机器学习算法扩大理解范围。
那家愿意为我在全食超市中表演付钱的创业公司,Twenty Billion Neurons,下的本钱更大,花费了大量的资金来获取数以百万计的人们表演数据,来训练算法。联合创始人兼首席执行官罗兰·梅瑟维奇(Roland Memisevic)认为,这是让机器获取物理世界常识的唯一实用途径,这是人工智能领域的长期追求。
像国际象棋和围棋这样的游戏,拥有有限的、严格的棋盘和明确的规则,非常适合计算机。在现实世界中,哪怕是一个孩子的常识是超越了计算机的。想要倒一杯咖啡,他可以毫不费力地抓住和平衡杯子和水瓶,并控制倒水的弧度。人们利用同样的根深蒂固的知识,以及对他人动机的理解,来解释自己在世界上所看到的一切。
如何让机器能够这样做是人工智能的一大挑战。一些研究人员认为,那些能有效识别语音或图像的技术不会有多大帮助,想要突破,需要有新的技术。梅瑟维奇从久负盛名的蒙特利尔学习算法研究所(MontrealInstitute of Learning Algorithms,MILA)离开,创办了Twenty Billion,因为他相信如果训练得当,现有的技术可以给我们带来更多的帮助。“它们工作得非常好,”他说。“为什么不通过强迫它们学习真实世界的东西,将其扩展到更微妙的现实方面呢?”
为了做到这一点,这家创业公司正在收集大量的视频数据,在这些视频中,众包演员们会表演不同的身体动作。其希望通过训练来让它们的算法能够“学习”物理世界和人类行为的本质。这就是为什么当在全食超市里表演时,我不仅从货架和冰箱里拿东西,而且还制作了几乎相同的视频剪辑片段。
Twenty Billion的第一个数据集现在已经开源发布了。它里面有超过10万个视频片段,描述了日常物品的简单操作,比如拿起鞋子,把遥控器放在一个硬纸盒里,然后沿着桌子推一个绿辣椒直到它掉下来等等。梅瑟维奇没有提起“制造一个能够帮助我们购物的机器人”的问题,而是说汽车应用是一个很好的领域,其已经与宝马合作过了。
我在Mechanical Turk上也看到了Twenty Billion的这个项目,目的是让汽车能够识别人们在汽车里做什么。人们被要求假装吃零食,打瞌睡,或者坐在车座上看书。能够检测到这些行为的软件可能会帮助半自动驾驶汽车来识别一个人是否准备好了驾驶,或者是他/她正在拿着饮料等等。
做这项工作的人是谁?其中一个是土耳其安卡拉的地质工程专业大三学生乌尔·布里亚特卡哈林(Uğur Büyükşahin),他是Twenty Billion系列任务中数百个视频的主角。他估计每周要在Mechanical Turk上花7到10个小时,赚的钱大概和他以前工作的餐馆的小费一样多。他说Twenty Billion是他的最爱之一,因为它报酬丰厚, 而且到账也很快。有时候会有一些奇怪的任务,但这并不妨碍他的热情。“有些人可能会羞于在超市里拍数百个视频,但我并没有这种感觉,”布里亚特卡哈林说。他的女友比较内向,起初对这个项目很谨慎,但看到他的收入后也开始做了,而且有些收入已经转化成了礼物,比如一套新的卷发钳。
布里亚特卡哈林和另一位Turker(指以Mechanical Turk为生的人)——31岁的凯西·考登(Casey Cowden) ,告诉我说,我的一些做法是错的。总之,我的10个视频为我赢得了大约4.60美元的小时工资。 他们通过在超市里呆上几个小时来完成Twenty Billion的任务,从而获得更多的报酬。
布里亚特卡哈林表示,他的个人纪录是在一个小时内完成110个超市视频。他使用万向架来拍摄高质量的视频,当必要时,他会以“这是一个大学的人工智能研究项目”来应对好奇的店员。根据考登的计算,他和他的一个朋友在当地的一家沃尔玛超市工作了两个半小时,每小时的工资是11.75美元。这比沃尔玛11美元的起步工资要高,也超过了考登的未婚妻在汉堡王赚到的7.75美元。
考登的工作也似乎比沃尔玛的员工更有趣。去年年初,在他工作的建筑公司倒闭之后,他开始成为一名Turker,这让他能够在家工作。在家工作意味着他可以在身边照顾他未婚妻患有老年痴呆症的母亲。他说,他最初被Twenty Billion的任务所吸引,因为只要有正确的方法,从中获取的收入要比Mechanical Turk上的数据录入工作要高。但他也对在技术前沿工作的想法感到满意。考登告诉我,他试图在不同的视频中改变背景,甚至是他穿的衣服。“如果你的视频看起来大同小异,你就不能用它训练机器人去超市购物了,”考登告诉我。“我试着去调整,这样一来,编程就能获得多样化的视角了。”
Mechanical Turk经常被称为是现代血汗工厂。最近的一项研究发现,其平均工资大约是每小时2美元。它也缺乏一个工作场所的公共氛围。这个网站将劳动力原子化,让世界各地的家庭或手机上工作的个人都能干活。
Twenty Billion雇佣了合同工人来审查人们上传的视频。不过,在Mechanical Turk上的一个常见策略是,这家创业公司有时候也会将审核的任务众包出去。我审查50个相关的视频后,得到了10美分的报酬。主要内容是审查人们是否按照既定的“脚本”去进行表演——“坐在座位上睡着了”,“从杯子里喝点东西,”或者“两手捧着东西”。
这项任务把我送到了卧室、休息室和浴室中。我也欣赏到了不同风格的表演。为了假装睡着, 一个赤膊的男人在黑暗的房间里轻轻地向后倾斜, 带着一种沉思的表情;一个女人似乎在一个壁橱里, 让她的头似乎像一个被切断线的木偶一样向前突然前倾。
其中一些人是孩子——这违反了亚马逊的规定,即要求员工至少年满18岁。一个穿着校服的9岁的亚洲男孩,从一张脏兮兮的塑料椅子上向外张望, 然后假装睡着了。 另一个亚洲男孩,年纪稍大一点,“用杯子或罐子喝水”,而另一个孩子则躺在他身后的一张床上。Twenty Billion的首席技术官英格·巴克斯(Ingo Bax)告诉我,该公司在最终的数据集上屏蔽了这类视频,但也有可能在排除这些视频之前,已经给他们付了钱。梅瑟维奇说,公司有防止系统支付这些视频的协议。
我在YouTube上也发现会有孩子出现在这些视频之中。在几十个被意外曝光的视频片段中,人们会根据脚本表演一些“一个人跑下楼梯,边笑边喝咖啡,而另一个人在修理门把手”之类的视频。
我在试图从“AI Indoors Project”中揭开Mechanical Turk表演工作背后的人的时候, 发现了这些视频。在论坛上,人们聚集在一起抱怨和交换信息,这表明了西雅图卡内基梅隆大学和艾伦人工智能研究所的合作。
像Twenty Billion一样,他们也收集了成千上万个视频,试图提高算法对物理世界和我们在其中所做的事情的理解。这个项目的研究生贡纳·阿特利·西古德森(Gunnar Atli Sigurdsson)回应了梅瑟维奇的说法,当我问他为什么要付钱给陌生人,让他们倒饮料或拿着手机下楼时。他说他想要算法来理解我们。“我们已经看到人工智能系统在一些非常狭窄、明确定义的任务中表现得非常出色,比如国际象棋和围棋,”西古德森说。“但我们希望在我们的公寓里有一个人工智能管家,让它了解我们的生活,而不是我们在Facebook上发布的那些无聊的东西。”
如果科技公司能够让人工智能征服日常生活,那么它将是机器学习专家的最新胜利。如果Twenty Billion的方法能解决问题,那么真相将会变得更加混乱和有趣。如果你曾经在超市里得到过机器人的帮助,或者乘坐一辆了解它的人在做什么的汽车,想想那些可能训练过它的人群。考登说,他喜欢Twenty Billion的任务,部分原因是他的母亲正在与骨癌作斗争。能够理解和干预我们世界的机器人和软件,可以帮助解决护士和家庭健康助理日益短缺的问题。如果他们所做的项目是成功的,那么这些众包演员可以改变世界——尽管他们可能是最后受益者之一。