人工智能之生命3.0:欧米茄与普罗米修斯(1)100万到10亿的危险游戏


 

欧米茄传奇

欧米茄团队是这家公司的灵魂。虽然该公司其他部门通过开发各种狭义人工智能(narrow AI)的商业应用赚得盆满钵满,让公司得以按部就班地运转下去,但欧米茄团队却一直秉承并追寻着公司CEO的梦想:建造通用人工智能(Artificial General Intelligence,简称AGI)。因此,其他部门的员工都亲切地称他们为“欧米茄”,并把他们视为一群不切实际的梦想家,因为他们似乎总是与自己的目标差着几十年的距离。但是,人们喜欢纵容这些人,因为欧米茄团队的前沿工作为公司带来了声望,他们为此感到高兴。同时,欧米茄团队偶尔会改进一些算法供其他部门使用,这让他们十分感激。

然而,其他部门的同事不知道的是,欧米茄团队之所以精心打造自己的形象,是为了隐藏一个秘密:他们马上就要启动人类历史上最勇敢无畏的计划了。那位极富个人魅力的CEO亲自挑选了这些人,不只是为了培养杰出的研究人员,还为了实现他帮助全人类的雄心壮志和坚决承诺。他告诫欧米茄团队,这个计划极端危险,如果被不怀好意的人发现了,他们就会不择手段地甚至实施绑架来制止这个计划,或者盗走他们的代码。但是,这些人已经全身心投入其中了。他们的理由和当年众多世界顶尖物理学家加入“曼哈顿计划”开发核武器的原因差不多:因为他们都坚信,如果自己不率先做出来,就会有其他不那么高尚的人捷足先登。

欧米茄团队建造的人工智能昵称叫“普罗米修斯”(Prometheus),它一天比一天强大。诚然,它的认知能力在社交技能等许多方面还远远落后于人类,但欧米茄团队竭尽全力让它在一个任务上表现超凡,这个任务就是编写人工智能系统。他们之所以选择这个计划,是因为他们相信英国数学家欧文·古德在1965年提出的“智能爆炸”理论。

古德说道:让我们给“超级智能机器”(ultraintelligent machine)下一个定义,那就是:一台能超越任何人(无论这个人多么聪明)的所有智力活动的机器。由于设计机器也属于这些智力活动中的一种,因此,一台超级智能机器就能设计出更好的机器;那么,毫无疑问会出现一种“智能爆炸”,到那时,人类的智能会被远远甩在后面。于是,第一台超级智能机器就会成为人类最后一个发明,只要它足够驯良,并告诉人类如何控制它就行。

欧米茄团队认为,只要他们能让这个不断迭代的“自我改善”过程持续下去,那么最终,这台机器就会变得非常聪明,足以自学其他有用的人类技能。

第一个100万美元

一个星期五的早晨9点钟整,欧米茄团队决定启动这个计划。在一间闲人免进的巨大空调房间内,层层叠叠的架子排成长列。普罗米修斯就在这一排排为它“量身定制”的计算机集群中嗡嗡鸣响。为了安全起见,它没有接入互联网。不过,它在本地存储着一份包含互联网大部分内容的副本作为训练数据,以便从中学习,这些数据来自各大知识汇集网站及社交平台数据库。欧米茄团队挑选这个时间点是为了可以不受打扰地工作:亲朋好友都以为他们参加公司的周末拓展活动去了。办公室的小厨房里塞满了微波食品和提神饮料。一切准备就绪。

启动伊始,普罗米修斯在编写人工智能系统上的表现还是比人类略逊一筹,但很快,这个缺点就被它极快的速度所弥补了。当欧米茄团队正猛灌红牛时,普罗米修斯也在以破竹之势解决着问题。如果换算成人类需要的时间,那得几千年之久。到早上10点钟,普罗米修斯已经完成了对自身的第一次迭代。这个2.0版本虽然比过去稍微好一点,但还是比不上人类。然而,到了下午2点钟,当普罗米修斯迭代到5.0版本时,欧米茄团队惊呆了:它已经大大超越了他们的预期,而且它进步的速度似有加快的迹象。夜幕降临时,他们决定用普罗米修斯10.0版本来启动计划的第二阶段:赚钱。

欧米茄团队的第一个目标是亚马逊的MTurk。这是一个众包网络市场,于2005年上线后,发展十分迅速,很快就聚集了成千上万来自全球各地的人。他们夜以继日地奏出了一支支“HIT”奏鸣曲——HIT指的是“人类智力任务”(Human Intelligence Tasks),范围十分广泛,从音频录制到图像分类和网页描述撰写,应有尽有,但它们都有一个共同点:只要你完成得足够好,没人在乎你是不是人工智能。对于其中大约一半的任务,普罗米修斯10.0版本完成得都还算可以。欧米茄团队让普罗米修斯用狭义人工智能设计出了一个简洁的软件模块,专门用于处理这些任务,但除此之外,这个模块什么也干不了。接着,他们把这个模块上传到了亚马逊的网络服务器上,这是一个可以运行虚拟机的云计算平台。在这个云平台上,他们租了多少虚拟机,就可以运行多少虚拟机。欧米茄团队在亚马逊云计算服务上每花费一美元,都能从MTurk上赚回超过两美元的价值。亚马逊一点儿也没发现,自己公司内部竟然存在着这样惊人的套利机会!

为了掩盖踪迹,在前几个月中,欧米茄团队小心谨慎地用假名创建了几千个MTurk账户。现在,普罗米修斯建造的软件模块正冒名顶替着这些账户的身份。MTurk的客户通常会在事后8小时左右付款。一旦收款,欧米茄团队又将这些钱用来购买更多的云空间,供给普罗米修斯使用。在这个过程中,普罗米修斯不断升级,它的最新版本写出来的任务模块也变得越来越厉害。由于欧米茄团队的钱每8小时就能翻一番,因此在MTurk上的任务很快便达到了峰值。同时,他们发现,如果不想引起过多的注意,最好把日收入控制在100万美元以下。不过,普罗米修斯已经为他们的下一步计划提供了足够多的钱,欧米茄团队已经无须向公司财务总监申请经费了。

危险游戏

启动普罗米修斯之后,除了在人工智能研究上取得突破之外,欧米茄团队最近还热衷于用它来赚钱:赚得越快越好。从本质上来说,整个数字经济的红利都是唾手可得的,但从哪里开始比较好呢?是开发计算机游戏,还是做音乐、电影或者软件?是写书、写文章,还是炒股,或者捣鼓和贩卖新发明?简单来说,这个问题归根结底是如何才能实现投资回报率的最大化,但一般的投资策略在欧米茄团队面前实属小巫见大巫:在通常情况下,如果年均回报率能达到9%,投资者就会很满意了;然而,欧米茄团队在MTurk上的投资达到了每小时9%的回报率,平均每天能赚到8倍多的钱。那么,他们的下一个目标是什么呢?

欧米茄团队的第一个想法是去股票市场大捞一笔,毕竟,许多对冲基金都在这上面砸了重金,而欧米茄团队中的几乎每个人都曾在人生中的某一时刻,拒绝过为对冲基金开发人工智能系统的高薪工作。你可能还记得,这也正是电影《超验骇客》(Transcendence)中的人工智能赚得第一桶金的方法。但是,前些年的一场股市崩盘促使政府对金融衍生品出台了一些规范措施,限制了他们的选择范围。很快,欧米茄团队就意识到,即便他们能够获得远高于其他投资者的回报,但这点利润比起销售自家的产品来说还是相差甚远。毕竟,当全世界第一个超级智能都在为你工作时,你显然最好投资自家的产品,而不是寄希望于别人家的。当然,例外也是可能存在的,比如,你可以用普罗米修斯超人的黑客技能来获取内幕消息,然后购买那些即将上涨的股票的看涨期权。但欧米茄团队认为,这可能会引来不必要的注意,因此不值得这么做。

于是,欧米茄团队将重点转向了那些可以研发和销售的产品,其中,电子游戏看起来是个很不错的选择。普罗米修斯很快就具备了极为高超的技能,能够设计出引人入胜的游戏,还能轻易地应对程序、平面设计、光线追踪等成品所必需的任务。此外,它还分析了网络上关于人们偏好的所有数据,知晓了哪一类游戏是玩家的最爱,据此发展出了一种根据销售收入来优化游戏的超能力。尽管不愿意承认,但欧米茄团队的许多成员都曾夜以继日地泡在游戏《上古卷轴5:天际》(The Elder Scrolls V:Skyrim)中。2011年,这款游戏在刚发布的第一星期,总销售额就超过了4亿美元。因此,欧米茄团队相信,在100万美元的云计算资源的支持下,普罗米修斯在24小时内一定能开发出一款像《上古卷轴》一样令人上瘾的游戏。他们可以在线销售这款游戏,并让普罗米修斯在博客圈里假扮玩家来大聊特聊,引爆热度。如果能在第一个星期入账2.5亿美元,他们就能在8天内将投资翻8倍,每小时的回报率高达3%,虽然比他们在MTurk上的表现略显逊色,但更具可持续性:假如普罗米修斯能每天开发出一款游戏,不久之后,他们就能赚到100亿美元,而不用担心游戏市场饱和。

但是,欧米茄团队中的一位网络安全专家坦率地表达了对这个游戏计划的不安。她指出,这个计划可能会带来一个可怕的风险:普罗米修斯可能会“逃脱”,并“抢夺自己命运的控制权”。过去,由于不清楚普罗米修斯的目标在自我提升的过程中会如何变化,因此为了安全起见,欧米茄团队决定不遗余力地将普罗米修斯“关起来”,囿于“盒”中,让它无法“逃”到互联网上。对运行在服务器机房中的普罗米修斯主机,他们采取了物理隔绝的手段:那里根本没有网络连接,普罗米修斯输出的所有数据都以信息和文件的形式传输给一台被欧米茄团队严格控制的计算机。

将普罗米修斯开发的复杂程序放到联网的计算机上运行,是一件风险很大的事情:欧米茄团队根本不清楚它会做什么,也完全不知道它会不会做某些事情,比如在互联网上像病毒一样扩散自己。在测试普罗米修斯为MTurk上的任务写的软件时,为了谨慎地提防这种情况的发生,欧米茄团队只在虚拟机中运行这些软件。虚拟机是一个模拟计算机的程序,比如,苹果电脑的许多用户会购买虚拟机软件,通过“欺骗”苹果电脑这是一台Windows电脑,来让它们运行Windows程序。欧米茄团队建造了自己的虚拟机,其昵称叫“潘多拉魔盒”。它模拟的是一台超级简单的机器,去除了计算机通常拥有的所有附件,没有键盘,没有显示器,没有音箱,也没有网络连接,什么都没有。举个例子,对于MTurk上的音频誊录任务,欧米茄团队对虚拟机进行了设置,只允许一个音频文件输入潘多拉魔盒,也只允许一个文本文件输出,即誊录好的文字。这些规则之于魔盒内部的软件,就好像物理定律之于身处宇宙中的人类一样:软件无法冲出魔盒的藩篱,就好比人类再聪明,也无法实现超越光速的星际旅行。除了上面所说的输入和输出单个文件之外,潘多拉魔盒内部的软件实际上就像被困在了一个拥有自己的计算规则的平行宇宙。欧米茄团队患有严重的“逃脱”恐惧症,因此,他们也在时间维度上加了枷锁,限制了不受信任代码的生存期限。比如,潘多拉魔盒中的誊录软件每完成一个音频文件的誊录,魔盒中的所有内存都会被自动抹去,程序会自动从零开始重新安装。这样,当它开始下一个誊录任务时,就不知道过去发生了什么,也就不能从过去中学习。

当欧米茄团队在MTurk项目中使用亚马逊的云服务时,他们能将普罗米修斯编写的所有任务模块都装进云端的潘多拉魔盒,因为在MTurk上输入数据和输出数据都非常简单。但是,对严重依赖图像的计算机游戏来说,这是行不通的。他们无法将游戏装进潘多拉魔盒,因为它们需要彻底访问玩家计算机上的所有硬件。此外,他们不想冒险,因为一些懂计算机的用户可能会分析游戏代码,从而发现潘多拉魔盒,并调查其中的秘密。“逃脱”风险不仅置游戏市场于危险当中,还可能会牺牲其他软件市场,而后者是规模巨大并且有利可图的,遍地都是千亿美元的机会。

第一个10亿美元

待续

 

技术变现,关注代码区

代码区软件项目交易网微信公众号


分享到