荀子

古代荀子也懂AI看当今AI如何学习

发布时间:2018/2/14 10:48:11   点击数:

西周的印纸造文、三国的木牛流马、希腊古城的黄金机器女仆,一下子将人工智能的历史拉到了年前……原来用机器替代劳动的想法古已有之,不得不说古代人民如此智慧!

那么智慧的古代劳动人民究竟是如何定义人工智能的呢?我们翻出国学经典,在荀子《正名》中就提出了“知有所合者谓之智、人知在人者谓之能、人有所合者谓之本正”,形象生动地将人工智能的精髓表达了出来。

今天,给大家介绍一下人工智能的发展历史,以及从人机博弈的角度看人工智能现在以及即将面临的一些挑战。一直以来,人类对人类以外的智能都怀有崇高的梦想。从西周周穆王的印纸造文到三国的木牛流马,再到希腊古城的黄金机器女仆……实际上,这三个都是人类自己幻想出来能够替代人类全部劳动的机械装置。事实上,自从人工智能在被写入国家规划的过程中,大家就都想了解中国的人工智能是从什么时候被提出来的。后来发现,原来中国的人工智能早在荀子时代,就已经提出来了。荀子在《正名》中有四句话表述了人工智能的脉络。

荀子说:“知之在人者谓之知”,这里的知就是咨询的意思。人有视觉、听觉、触觉、味觉和压力这些感知能力,我们会对身体所处的环境进行多通道、多模态的感知。

“知有所合者谓之智”,而感知得到的不同通道的多种类型的大数据,在大脑中形成概念,形成对象,就产生了智慧。这种智慧的来源,是我们人对大数据一种综合的思考得到的一种结果。“人知在人者谓之能”,这里讲的是人的一些本能。例如,在路上你碰到前面一辆疾驶而来的汽车,你马上就能感知出来并认知出来这是一辆汽车,而且快速向你冲过来,如果你不做避让的话,就可能吾命不久矣。那这个时候人们就会开始趋利避害。人类有一些本能,可以做到对感知或者认知的结果快速地做出处理。“人有所合者谓之本正”,就可以被理解为是现在我们说的人工智能。就是要把所有从前端感知得到的数据,激发出智慧,再形成与之相关的行动或者决策。这样来看,整个人工智能脉络就已经被清晰得勾勒出来了。这是我在中国古文中寻找出来的有关人工智能的蛛丝马迹。

在人工智能的历史上,了解和学习人工智能通常采用的三种方法。

第一种,用规则去教

也就是将所有的知识和规则以逻辑的形式编码成功。例如水利工程是工程的一种,三峡大坝是个水利工程,这样一个程序化的概念体就出来了。为了刻画三峡大坝,我们要说它的功能是什么,它的定位是什么,由于三峡大坝和葛洲坝都位于长江领域,所以彼此之间具有管调节的关系等。

如果我们知道这些知识的话,我们又知道旦布利水畔和达纳斯水畔都位于哥伦比亚这个河域,那我们就可以推理出来它们也具有反调节的关系。给定一些知识,我们基于一个强大的推理引擎,就可以不断地扩充这个知识体系中的概念、属性以及关系,不断地进行知识学习。

IBM的沃森就是很贴切的一个例子。

沃森是一个人机对话的系统,当时有人考了这样一个题目,这个题目是人类选手回答不出来的,请问哪个城市是美国的钢产量和铁产量平均量第一?

沃森通过一定的计算,很快回答出来是匹斯堡,后来从后台的程序发现沃森把美国所有的城市的钢产量和铁产量的数据都从互联网上找到了,要做的就是简单的累加并除二,然后做了一个排序,现在是匹斯堡排在第一位,于是就输出了匹斯堡这个答案。

很难想象,如果人类专家可以回答出这种问题,显然是不可想象的。因为人的大脑不可能记下这么海量的知识,而且这些知识可能与自身无关。通常情况下,很多知识,我们可能在平时要用的时候就去翻翻书,查查互联网就可以了,不会刻意地去记这种庞大的数据知识。

第二种,用数据去学

这个就是现在深度学习的一个大行其道的方法。因为我们很难去刻画一个概念,例如海盗船。你怎么用文字、逻辑去描述这个海盗船?答案是很难去描述。

于是我们就选择很多被标注成海盗船的图片,提供给计算机,让计算机不停地学习,学习之后计算机就会铭记海盗船图像像素点空间分布的模式,进而就学会了海盗船的这种模式。如果你再给它一张图片是海盗船的话,空间分布的模式和之前学习的模式是一样的,于是就可以自动识别为海盗船。这个就是大数据驱动,在大数据驱动的前提下,要把这个数据标注成它本身明确的语义,或者概念,才能做更好的学习与提高。

关于这方面有几个例子。

例子一,特斯拉第一次造成车毁人亡现象。

特斯拉的无人汽车上有非常多的传感器(例如雷达、视觉等)。在风和日丽的环境下,竟然发生了直接撞击相驰火车的事故,大家都觉得不可思议。

事后分析才发现,特斯拉汽车一直向前开的过程中,司机正在看《哈利波特》的VCD,因为眼睛离开了前方,手和脚也都离开了操作的仪器,一辆白色的箱式大货车在它的对象车道行驶时有一个左转弯,本来一般情况下是不会发生装车事故的,但这次却直接撞上去了。

分析整个过程,特斯拉前面配有雷达,这个雷达的电磁波就直接扫过去了。主要是由于白色箱式火车的底盘过高,雷达汇报前方无障碍物,同时摄像头在不断地捕获前方图像,捕获回来其实就是白色的背景,这样的视觉图像汇报,让系统误认为前方是白云,就直接撞上去了,从而发生了非常惨烈的事件。

例子二,是谷歌公司发布的一个叫做图像的标注的系统。

只要上传一张图片,就可以打标签,打上了标签就可以对这个图片进行一次搜索。因为很多时候我们需要用文本信息或者单词来进行搜索图片,一旦打标签的话,我们就可以更好地进行文搜图的体验。有这样的一件事情,一个黑人朋友上传了一张图片,却被打上了黑猩猩的标签,于是他就状告了谷歌公司,说对他是人格上的侮辱,谷歌公司花了很大一笔钱才把这个官司给平息。平息的过程中,谷歌就关闭了标注系统,不再打标签。过一段时间再开放的时候,就把黑猩猩从标注词典库里移除了,即使再上传的图片是黑猩猩,也不会被打上黑猩猩的标签。说明用数据驱动方法,实际在某些领域可以得到很好的应用,但可能在其它领域还会有很大的误读。

第三种,从经验中学

前面我们通过了用知识去教、用数据去学,第三种方法就是用问题引导学习,这就是我们经常说的强化学习。就是把一个智能体放到一个环境里面,它对这个环境做出一定的反应,这个环境对它奖励或者惩罚的一个结果。假如说我这里放了一台扫地机,它直接撞到一个桌子上,撞翻了,它就知道这是一个不可撞的东西,那它再做下一个调整的时候,它往左转、往右或往后走,它不停地从失败走向失败,最后又从失败走向了成功,它就对这种环境能够很好地感知到。

这种方法,我们叫做强化学习,或者是叫做从经验中学习,也就是没有任何知识和数据,就把它放在一个环境中进行感知以及认知。像波士顿公司的两轮机器人以及中国电科院提供的67架固定翼的集群系统,还有美军架的固定翼集群系统,就是在开放的环境中不停地进行感知和认知的学习,从而得到经验的提升。

这三种学习方法,并能够被判断为谁比谁好,谁要取代谁,其实它们彼此各有优点和不足。例如用规则教,确实和人的思维非常契合,逻辑很强,但我们确实很难把人类所有的规则和理念用来指导或者决策这个过程。用数据去学的方法一定要依赖于标注的大数据。如果我们对于某个概念不能提供给它一个表示的大数据的话,它就无法学习。如果可解读性不强,就算给它一张图片,它可以识别出是人脸,当你疑问知道它是人脸的原因,它同样也是无法得出,但是并不知道人脸的分布是否合适,例如说鼻子是对称的,眼睛是对称的,这样的知识在机器的学习系统中很难做到契合。最后一种方法似乎也很不错,没有知识和数据,只要放在环境中进行交互就可以了。但是我们可以想象一下,当一个智能体撞到墙的时候,它可以采取的策略是无穷多的,它可以发呆、发萌、哭泣、愤怒,也可以不工作,有几万种选择,那到底从几万种选择中选择哪一种来应对撞墙的行为,这又是一个很难的问题。

因此,这三种方法其实各有各的优点,也有它的不足,但它体现了从数据到知识,从知识到能力的过程,最终能力并不重要。我们界定一个人工智能程序是否成功,不在于提供给它的是1TB还是10TB的数据,不在于是10万条的知识还是0万条的知识,而在于它已经生成了一种能力,这种能力可以指导它去处理新的数据和知识,以及构成新的知识的能力,这是非常重要的。

----------END----------------

未来已来,科技引领世界,智能改变生活,Future智能与您同行,

敬请







































北京最好白癜风医院
白癜风前期


转载请注明:http://www.daoqicar.com/xzxw/14986.html

------分隔线----------------------------

热点文章

  • 没有热点文章

推荐文章

  • 没有推荐文章