什么是第三代人工智能，其发展趋势是什么？-HGZN

什么是第三代人工智能，其发展趋势是什么？

作者：Robot机器人网日期：2020.02.13

人工智能从1956年第一次提出，已经发展了64年，最初的第一代人工智能是用计算机来解决问题，第二代是以AlphaGo为标志的深度学习，但是深度学习是基于真正的大数据，在目前似乎也遇到了瓶颈，于是，科学家们提出了第三代人工智能，目前来看，还没有人真正明确第三代人工智能是什么，但其趋势是清晰的。

第一代、第二代人工智能

下面是清华大学人工智能研究院院长、中国科学院院士张钹在《迈向第三代人工智能的新征程》中对三代人工智能的诠释。

第一代人工智能提出符号模型，以知识经验为基础的推理模型，这是人工智能的第一个重大突破。这个突破后来产生了一个结果，就是这个理论提出时有个非常乐观的估计，1956年由西蒙提出，基于这种模型，十年之后机器可以打败所有棋手，二十年以后机器取代人类所有的工作。实际并不是这样，六十年以后机器才打败棋手，机器究竟代替人类的所有工作是什么时间，可能还很遥远，这也是人工智能的另外一个特点，往往被高估。

人工智能的第一代模型，有优点，但是也有很大局限性。这个优点是显然的，因为它是模仿人类的，它可解释，鲁棒性很强，但是它的局限性也非常大。因为最大的问题是人类的知识经验，很难准确表达，这就是产生的后来人工智能冬天的根本原因。当时的应用很有限，几乎没有推广，但是，有了大数据以后，这个问题得到了很大改善，特别是机器的能力提高以后，可以把大量的数据作为知识放在机器里，这就是最典型的沃森系统。

沃森系统可以做癌症的免疫治疗，这里面用多少知识呢？100万个医学杂志中抽取的2500个摘要，400万病人的数据，再加上1861年以前所有药物的专利，它有医学知识，并联的数据再加上药物知识，就可以做癌症的免疫治疗。当然，很多慢性病的治疗和管理，这个系统也做得很好，中国的国内也有大量这方面的工作在探索和研究。

第二代人工智能，一个最重要的成果就是深度学习。也就是说，第一代人工智能提出来，如果能够很好地利用人类的知识，就可以建立很好的人工智能系统，如果我们有充分的数据，也有可能建立起有用的人工智能系统。

深度学习为什么这么受重视？一个很重要的原因，当网络层次增加以后，它有两个重大变化：第一个变化，输入只要原始数据，不需要预处理。第二个是性能提高很多，这就造成了深度学习的重大突破。也就是说，它从一定意义上有通用工具，对领域的知识要求不高，同时能够处理大数据。

这就带来很大的变化，大家也看到了，语音识别，2001年时它的识别率停留在80%，也就是20%的误识别率；2016年误识率就降到了5.9%，达到专业速记员的水平，到了2017年，所有产品包括谷歌、微软，包括中国的讯飞、百度，用的全是深度学习。

变化更大的是图像识别。有一个标准的图像识别数据集 ImageNet，大家知道，2011年，它的误识率是50%，有一半认错了。但是四年以后，2015年就超过了人类水平，原因也是利用了深度学习。

最后一个，给大家印象最深就是AlphaGo，大家都知道了。因此就有很多估计，十年之内代替40%以上人类的工作，三五年里面，智能驾驶车就可以量产，等等，刚刚李院士说到了这个问题，他分析得很深刻。实际三五年里面不可能量产。

技术已经完全成熟，我们现在的研究不成熟，主要是应用问题。为什么在人工智能上往往产生乐观估计？主要原因有两个：一个是对发展人工智能的困难性估计不足，对取得的成果估计过高。一个估计不足，一个估计过高，就产生问题。另外一个很重要的原因，受历史事件的影响。过去我们发现，有了蒸汽机以后就产生了工业革命，有了电动机发动机以后就产生了电气革命，有了计算机以后产生了信息革命，大家很希望有一个东西出来以后引起人工智能的革命。

现在的问题是，有没有？至今为止，还没有发现人工智能里面的蒸汽机和计算机。曾经最开始寄希望于符号模型，结果发现符号模型也没有那么管用。第二次发现的是大数据+深度学习，以为大数据+深度学习就是人工智能的蒸汽机和计算机，为什么这样？

这不能不考虑到人工智能的特点，我们说深度学习根本不是AI的通用机。现在大家在寻找通用的人工智能，到底有没有，还有争论，不去管它，但至少深度学习不是人工智能。这个非常明显，第一代人工智能也好，第二代人工智能也好，它的应用场景必须满足以下五个条件。

从正面来讲，所有的应用场景，如果满足以下五个条件，计算机绝对能够战胜人类，不管这个问题多么复杂：具有丰富的数据或知识，完全信息，确定性信息，静态，单领域和单任务。

最明显的例子是围棋，围棋多么复杂，但是围棋满足这五个条件，所以计算机战胜在围棋上战胜人类是早晚的事情。所以从正面来讲，如果你满足这五个条件，不管多复杂，计算机绝对战胜人类。长远来看，如果你的应用场景不完全满足这五个条件，其中有些条件不满足，你这个工作就变成困难。自动驾驶为什么如此困难？根本的原因在这里。为什么我们难以做出廉价、可靠的自动驾驶呢？背后的原因就在这里，因为自动驾驶很多条件都不满足，它不是完全信息，它不是确定性信息，它不是静态的环境，或者是按照确定性规律演化的，它的很多东西是不可预测的，它也不是单领域的，里面有人驾驶的车、行人、其它车辆。所以刚刚李院士提出来专用道，就是把这些东西弄干净，变成单领域。所以我们一直说，如果有些条件是不符合这五条，你就需要下功夫。

现在人工智能能够在这些领域里面得到应用，换句话说，这些领域里面有很多应用产品符合刚才讲的五个条件。如果这些领域里面的应用场景符合五个条件，大家大胆去做，绝对会超过人。根据现在计算机强大的力量，是可以做到这一点的。但是，这些应用里面，也有大量不符合那五个条件的，大家必须下功夫，不能指望靠现在的第一代、第二代人工智能去解决它。

举个简单的例子，复合场景下的决策，完全信息条件下的决策或者完全信息下的博弈，计算机战胜人类是绝对的。下面一个问题，不完全信息的博弈及打牌，大家都知道，今年5月份对扑克牌这个问题也解决了。换句话说，6人无限注的德州扑克，计算机能战胜人类，这就意味着概率意义下的不确定性，机器也可以战胜人类。但是人类的决策环境都不符合前面两个条件。所以在复合环境下的博弈或者复杂环境下的决策，机器跟人类还差得比较远。从这里来讲，应用场景是极为重要的。

第二个，我们必须要重视的，用数据驱动的方法做出来的系统，有大量毛病，或者说这些毛病是根本性的，是极为危险的。这里面列出来的，简单举个例子，一个图像识别系统，都可以说它的识别率超过人类，但是这个图象识别系统跟人类的感知完全不同。

就是这样的系统，你给它噪声，它可以识别为知更鸟。你给它一个噪声，它可以识别为猎豹。换句话说，模式识别系统并没有达到人类认知的水平，只达到低等动物的水平，所以感知这个词翻译得非常好，感觉+知觉，低等动物只有感觉，没有认知。所以机器现在达到的水平是低等动物的水平，它可以分辨不同的物体，但是它本质上不认识这个物体。另外它非常脆弱，非常容易受攻击。

此外，缺少自我知识，这是非常重要的。计算机没有自知之明，人贵有自知之明，这是人类智慧的一个部分。怎么让机器有自知之明？这是很困难的事。

下一步，我们现在有个新的历史机遇，就是迈向第三代人工智能。第三代人工智能就要纠正前面说的两个局限性，建立可解释、鲁棒的人工智能理论，发展安全、可信、可用的人工智能技术，促进人工智能的创新应用。

第三代人工智能趋势

近日，AI2000人工智能全球2000位最具影响力学者榜单在清华大学发布，中国学者规模位列世界第二，但高水平学者集中的研究机构匮乏，人工智能领域的人才队伍亟待加强。

AI2000榜单由清华-中国工程院知识智能联合研究中心和清华大学人工智能研究院发布。AI2000人工智能全球最具影响力学者（200名）和提名学者（1800名）分布于全球不同高校和学术机构，美国有1128人次，中国171人次，欧盟有307人次上榜。

人工智能研究必须国际化

基础研究，尤其是人工智能领域的基础研究必须国际化，因为只有把全世界的研究人员共同团结起来、利用起来，才能够引领基础研究的发展。为什么目前人工智能领域大多由美国来引领，就是因为美国把全世界最优秀的人才利用了起来。

中国要想在基础研究上引领世界，必须走国际化道路。今天有很多外国留学生来华求学，这是一个好事儿，但我们还可以做一定平衡调整，吸引更广泛国家地区的优秀学生来华学习。

把数据驱动和知识驱动结合起来

人工智能的四大基础是：知识、数据、算法和算力，回顾历史，这四个因素都在不断地发挥作用。第一代人工智能也叫符号人工智能，比较强调知识对智能的作用，因为那时算法和算力都还没有跟上。

进入新世纪后，深度学习把大家的目标凝聚到了数据上，这时大数据的出现，再加上很好的算法，就形成了基于概念的深度学习，再加上云计算等手段，使以数据为基础的连接主义模型得到了极大推广和应用。

数据主义喊了许多口号，导致我们今天遇到一些困难，按照大数据建起来人工智能系统似乎不可信、不可靠、不安全、不易推广，这都是目前用深度学习进行人工智能研究带来的问题，也可以说是大数据遇到的挑战。怎么来解决这个挑战呢？唯一的办法，就是重新引入知识，把数据驱动和知识驱动结合起来，达成可信安全的第三代人工智能。

常识往往不在数据里

自然语言理解是人工智能领域最核心的问题。不管做机器翻译也好，做自然语言应用也好，都试图通过分析符号序列来理解相关内容，这是第一代人工智能所谓符号主义的核心做法。到了第二代人工智能，又走上深度学习的道路，这条路充满希望，但又非常危险，因为解决不了可信安全的问题。

机器翻译现在只能翻译不重要的东西，因为翻错了也没有关系，真正重要的场合还需要人力同声翻译。机器最大的问题，就在于它缺乏常识，根本不知道自己不知道，这是一个很大的问题。知识包含两方面，一是我知道什么，二是我不知道什么。一个有学问的人，不仅仅表现在他知道的多，更表现在他清楚自己不知道的更多。

所以常识是必要的，简单翻译几句话也需要大量尝试积淀，“说你行，不行也行”，机器没有常识，就很难理解这句话，人反而觉得很简单，这就是常识的重要性。但常识库的建立非常之难，现在没法从数据中去建立常识库，因为常识往往不表示在数据之中。

建立常识，必须下功夫去做，只有这个问题解决了，自然语言的理解才能达到目标。而自然语言理解，则是第三代人工智能的终极目标，这是一个艰巨的任务。如果这个问题解决了，人工智能的其他问题将会迎刃而解。

Note: The above article is reproduced in a third party and cannot represent the company's views. If it involves infringement, please contact the relevant rights holder to delete it.