人工智能

学科 | 计算机科学分支

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、 图像识别自然语言处理 和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”。人工智能可以对人的意识、思维的信息过程的模拟。人工智能不是人的智能,但能像人那样思考、也可能超过人的智能。

人工智能是一门极富挑战性的科学,从事这项工作的人必须懂得计算机知识,心理学和哲学。人工智能是包括十分广泛的科学,它由不同的领域组成,如 机器学习计算机视觉 等等,总的说来,人工智能研究的一个主要目标是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但不同的时代、不同的人对这种“复杂工作”的理解是不同的。2017年12月,人工智能入选“2017年度中国媒体十大流行语”。

概述

人工智能 人工智能的定义可以分为两部分,即“人工”和“智能”。“人工”比较好理解,争议性也不大。有时我们会要考虑什么是人力所能及制造的,或者人自身的智能程度有没有高到可以创造人工智能的地步,等等。但总的来说,“人工系统”就是通常意义下的人工系统。

人工智能在计算机领域内,得到了愈加广泛的重视。并在机器人,经济政治决策,控制系统,仿真系统中得到应用。

人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,主要包括计算机实现智能的原理、制造类似于人脑智能的计算机,使计算机能实现更高层次的应用。人工智能将涉及到计算机科学、心理学、哲学和语言学等学科。可以说几乎是自然科学和社会科学的所有学科,其范围已远远超出了计算机科学的范畴,人工智能与 思维科学 的关系是实践和理论的关系,人工智能是处于思维科学的技术应用层次,是它的一个应用分支。从思维观点看,人工智能不仅限于逻辑思维,要考虑形象思维、灵感思维才能促进人工智能的突破性的发展,数学常被认为是多种学科的基础科学,数学也进入语言、思维领域,人工智能学科也必须借用数学工具,数学不仅在标准逻辑、模糊数学等范围发挥作用,数学进入人工智能学科,它们将互相促进而更快地发展。

早期研究

在20世纪40—50年代期间,为了实现“制造具有某种人类智慧的聪明机器”的理想,人们至少提出了三种途径:

一是对环境适应。1948年,Wiener提出 控制论 ,强调 智能表 现为“对变化的外界环境的适应”。其关键是反馈,这个思想后被Ashiby发展为以微分方程定性理论为基础的控制理论,基于此,Ashiby写出了« 大脑设计 »的著作,这个思想在以后人工智能的发展中并没有起到主导作用,直到1991年,Brooks提出临场人工智能时,这个思想才进入人工智能的研究范畴。

二是神经信息处理。鉴于智能来自神经活动的信息加工过程,根据神经科学的研究结果,建立智能模型是一个合理的选择,这类研究与1943年Mcculloch与Pitts的 神经元 信息加工方式的模型,以及1948年Hebb的学习机制的研究有密切关系,建立模型的方法一般以统计学(优化)为基础。

三是认知科学。在人类行为层次建立智能模型,其最重要的研究是Turing实验,即一种根据行为判别机器是否具有智能的准则。1951年, Shannon 首先设计并实现了第一个计算机下棋程序,相对于神经信息加工的智能研究,它不介意行为产生的原因,且模型一般以符号推理为基础。

在“模拟与解释人类智能行为”研究的半个世纪中,“对环境适应”一直没有成为主流,除了“机器昆虫”之外,在理论与方法上,似乎并没有本质性的影响。基于认知科学(复杂信息处理)与基于神经信息加工两种实现智能行为的研究,交替引领着这类研究。

研究任务

人工智能的研究有两个相辅相成的任务,一是发展具有类似生物(人类)智能的计算系统(智能信息处理或智能系统),并以此来解决困难的实际问题。二是借助计算机模拟并解释生物(人类)的智能(认知科学),尽管有的研究者将后者划归为人工智能学科。但是,还是有很多研究者将人工智能的研究限制在前者的理论和方法上,这样,人工智能也就自然成为计算机科学的一个分支。

研究内容

人工智能学科的主要研究内容包括:知识表示,自动推理和搜索方法,机器学习和知识获取,知识处理系统,自然语言处理,计算机视觉,智能机器人, 自动程序设计 等方面。

研究进展

20世纪90年代以来,尽管人工智能学科的研究遇到的严重的困难,但还是出现了一系列至今对计算科学有重要影响的研究结果,其中最为重要的是,1991年,Minsky出版了他的著作,《Society of Mind(思维的社会)》,这本著作关于“智慧由一些小的无智慧的独立功能单元组合后产生”的建议,以及创造的新术语“Agent”,已引起理论与应用研究者的关注。Agent已成为计算机科学很多领域广泛使用的概念,据此还发展成为知识表示的方法论———本体论(Ontology)。

进入20世纪90年代,统计机器学习逐步开始引领人工智能研究的主流。这时,对人工智能十分重要的表示与推理的研究,由于基于优化的学习算法大多数采用给定基函数。因此,其表示变得单一,且由此导致推理成为计算模型函数的简单问题,表示与推理在统计机器学习中失去了研究价值。

统计机器学习在以后的20年间,并没有沿着BP的非线性算法的路线发展。反之,回归线性感知机是其特点,在Valiant的概率近似正确(Probability Approximation correct, PAC )学习理论意义下Vapnik提出了 支持向量机 (Support Vector Machine,SVM)。尽管统计方法在这个时期占据了主流地位,但是,人工智能的研究者并没有忘记“智能”的含义,因此,在这个时期,发展了大量不同的学习方式。这些方式大多来自对人类学习的研究,例如,流形学习、主动学习、 集成学习多示例学习 等。

这个时期,这类研究分为两个不同的研究路线:一是以PAC为基础,强调学习过程可以基于有限样本,并使得对误差的分析以1-δ概率成立,这个路线的最重要的贡献是强调建立模型的算法应该在线性空间设计。即,强调返回线性感知机,这是对BP算法设计的反叛。由此,导致至今还是重要的研究课题——— 核函数

另一个有趣的路线是遵循传统统计学理念。根据热力学的“系综(Enseble)”、神经科学的“集群(Enseble)”,以及统计学的重采样(Resampling)等原理发展了现在称为“集成学习(Enseble Learning)”的方法,其本质是,对实际问题随机采样并建立模型。采样次数进行多次,由此获得多个模型。然后,在这些模型张成的空间上建立实际问题的模型。在统计学上证明,如果采样次数趋于无穷,由此建立的模型的 均方差 与一次采样建立的模型的均方差相等。这就是已被广泛应用于各个不同领域的Bootstrap原理。与此同时,1991年人们证明了弱可学习定理,由此发展了算法 Boosting ,它与上述随机采样的区别:一是对给定样本集合的采样,二是下一次采样尽量包含上一次采样建立的模型不能准确描述的样本。因此,Boosting需要建立在PAC基础上。

此期间最广为人们所喜爱的研究结果是“最大间距(Margin)”算法,其误差界依赖样本集合两个闭凸集之间的距离(Margin)。即,距离越大,泛化性能越好。由于这个原理的几何解释十分清晰,由此设计的算法简单易懂。因此,被很多研究者所喜欢。

人工智能研究已经有50多年的历史,发展是曲折的。从制造具有智能的机器梦想来看,相距甚远。从计算机应用的角度来看,其成果甚丰。不夸张地说,它已经成为计算机应用发展的原始动力之一,甚至更长。

研究价值

人工智能 例如繁重的科学和工程计算本来是要人脑来承担的,如今计算机不但能完成这种计算,而且能够比人脑做得更快、更准确,因此当代人已不再把这种计算看作是“需要人类智能才能完成的复杂任务”,可见复杂工作的定义是随着时代的发展和技术的进步而变化的,人工智能这门科学的具体目标也自然随着时代的变化而发展。它一方面不断获得新的进展,另一方面又转向更有意义、更加困难的目标。

通常,“机器学习”的数学基础是“统计学”、“信息论”和“控制论”。还包括其他非数学学科。这类“机器学习”对“经验”的依赖性很强。计算机需要不断从解决一类问题的经验中获取知识,学习策略,在遇到类似的问题时,运用经验知识解决问题并积累新的经验,就像普通人一样。我们可以将这样的学习方式称之为“连续型学习”。但人类除了会从经验中学习之外,还会创造,即“跳跃型学习”。这在某些情形下被称为“灵感”或“顿悟”。一直以来,计算机最难学会的就是“顿悟”。或者再严格一些来说,计算机在学习和“实践”方面难以学会“不依赖于量变的质变”,很难从一种“质”直接到另一种“质”,或者从一个“概念”直接到另一个“概念”。正因为如此,这里的“实践”并非同人类一样的实践。人类的实践过程同时包括经验和创造。

这是智能化研究者梦寐以求的东西。

2013年,帝金数据普数中心数据研究员S.C WANG开发了一种新的数据分析方法,该方法导出了研究函数性质的新方法。作者发现,新数据分析方法给计算机学会“创造”提供了一种方法。本质上,这种方法为人的“创造力”的模式化提供了一种相当有效的途径。这种途径是数学赋予的,是普通人无法拥有但计算机可以拥有的“能力”。从此,计算机不仅精于算,还会因精于算而精于创造。 计算机学家 们应该斩钉截铁地剥夺“精于创造”的计算机过于全面的操作能力,否则计算机真的有一天会“反捕”人类。

当回头审视新方法的推演过程和数学的时候,作者拓展了对思维和数学的认识。数学简洁,清晰,可靠性、模式化强。在数学的发展史上,处处闪耀着数学大师们创造力的光辉。这些创造力以各种数学定理或结论的方式呈现出来,而数学定理最大的特点就是:建立在一些基本的概念和公理上,以模式化的语言方式表达出来的包含丰富信息的逻辑结构。应该说,数学是最单纯、最直白地反映着(至少一类)创造力模式的学科。

发展阶段

人工智能 1956年夏季,以麦卡赛、明斯基、 罗切斯特 和申农等为首的一批有远见卓识的年轻科学家在一起聚会,共同研究和探讨用机器模拟智能的一系列有关问题,并首次提出了“人工智能”这一术语,它标志着“人工智能”这门新兴学科的正式诞生。 IBM公司 “深蓝”电脑击败了人类的世界国际象棋冠军更是人工智能技术的一个完美表现。

从1956年正式提出人工智能学科算起,50多年来,取得长足的发展,成为一门广泛的交叉和前沿科学。总的说来,人工智能的目的就是让计算机这台机器能够像人一样思考。如果希望做出一台能够思考的机器,那就必须知道什么是思考,更进一步讲就是什么是智慧。什么样的机器才是智慧的呢?科学家已经作出了汽车,火车,飞机,收音机等等,它们模仿我们身体器官的功能,但是能不能模仿人类大脑的功能呢?到目前为止,我们也仅仅知道这个装在我们天灵盖里面的东西是由数十亿个神经细胞组成的器官,我们对这个东西知之甚少,模仿它或许是天下最困难的事情了。

当计算机出现后,人类开始真正有了一个可以模拟人类思维的工具,在以后的岁月中,无数科学家为这个目标努力着。如今人工智能已经不再是几个科学家的专利了,全世界几乎所有大学的计算机系都有人在研究这门学科,学习计算机的大学生也必须学习这样一门课程,在大家不懈的努力下,如今计算机似乎已经变得十分聪明了。例如,1997年5月,IBM公司研制的深蓝(DEEP BLUE) 计算机战 胜了国际象棋大师卡斯帕洛夫(KASPAROV)。大家或许不会注意到,在一些地方计算机帮助人进行其它原来只属于人类的工作,计算机以它的高速和准确为人类发挥着它的作用。人工智能始终是计算机科学的前沿学科, 计算机编程语言 和其它计算机软件都因为有了人工智能的进展而得以存在。

2019年3月4日,十三届全国人大二次会议举行新闻发布会,大会发言人 张业遂 表示,已将与人工智能密切相关的立法项目列入立法规划。

2021年7月,在 2021世界人工智能大会 开幕式上,工信部部长 肖亚庆 表示,中国人工智能产业发展取得了显著成效,图像识别、语音识别等技术创新应用进入了世界先进行列,人工智能发明专利授权总量全球排名第一,核心产业规模持续增长,已经形成覆盖基础层、技术层和应用层的完整产业链和应用生态。

2021年7月,美国政府问责署 ( the U.S. Government Accountability Office, GAO)对联邦机构及其他组织机构发布了人工智能(Artificial Intelligence, AI)问责框架,该框架分为治理(Governance)、数据(Data)、性能(Performance)和监测(Monitoring)四个部分。每部分都包含关键做法,关键问题和 问责程序 等内容。

2021年8月,全球专业招聘集团 瀚纳仕 日前发布了2021年《中国大陆科技行业报告》表示,中国在人工智能领域处于世界领先地位,拥有全球近60%大数据专家。然而随着产业不断细分,新赛道日新月异,人才的供给端与需求端存在差异,在AI赋能的跨界领域,人才竞争更是日益激烈。

2021年10月29日,由 国家网信办 、工信部、公安部、 国家广电总局 等联合主办,以“融新汇智,竞促发展”为主题的第三届中国人工智能大赛在京启动。

科学介绍

实际应用

机器视觉,指纹识别, 人脸识别 ,视网膜识别,虹膜识别,掌纹识别,专家系统,自动规划,智能搜索,定理证明,博弈,自动程序设计,智能控制,机器人学,语言和图像理解, 遗传编程 等。

技术研究

用来研究人工智能的主要物质基础以及能够实现人工智能技术平台的机器就是计算机,人工智能的发展历史是和计算机科学技术的发展史联系在一起的。除了计算机科学以外,人工智能还涉及信息论、控制论、自动化、 仿生学 、生物学、心理学、数理逻辑、语言学、医学和哲学等多门学科。人工智能学科研究的主要内容包括:知识表示、自动推理和搜索方法、机器学习和知识获取、知识处理系统、自然语言理解、计算机视觉、智能机器人、自动程序设计等方面。

研究方法

如今没有统一的原理或 范式 指导人工智能研究。许多问题上研究者都存在争论。其中几个长久以来仍没有结论的问题是:是否应从心理或神经方面模拟人工智能?或者像鸟类生物学对于航空工程一样,人类生物学对于人工智能研究是没有关系的?智能行为能否用简单的原则(如逻辑或优化)来描述?还是必须解决大量完全无关的问题?

智能是否可以使用高级符号表达,如词和想法?还是需要“子符号”的处理?JOHN HAUGELAND提出了GOFAI(出色的老式人工智能)的概念,也提议人工智能应归类为SYNTHETIC INTELLIGENCE,这个概念后来被某些非GOFAI研究者采纳。

大脑模拟

主条目:控制论和 计算神经科学

20世纪40年代到50年代,许多研究者探索神经病学, 信息理论 及控制论之间的联系。其中还造出一些使用电子网络构造的初步智能,如W. GREY WALTER的TURTLES和JOHNS HOPK INS  BEAST。这些研究者还经常在 普林斯顿大学 和英国的RATIO CLUB举行技术协会会议。直到1960,大部分人已经放弃这个方法,尽管在80年代再次提出这些原理。

符号处理

主条目:GOFAI

当20世纪50年代,数字计算机研制成功,研究者开始探索人类智能是否能简化成符号处理。研究主要集中在卡内基梅隆大学, 斯坦福大学麻省理工学院 ,而各自有独立的研究风格。JOHN HAUGELAND称这些方法为GOFAI(出色的老式人工智能)。 60年代, 符号方法 在小型证明程序上模拟高级思考有很大的成就。基于控制论或神经网络的方法则置于次要。 60~70年代的研究者确信符号方法最终可以成功创造 强人工智能 的机器,同时这也是他们的目标。

认知模拟经济学家 赫伯特·西蒙艾伦·纽厄尔 研究人类问题解决能力和尝试将其形式化,同时他们为人工智能的基本原理打下基础,如认知科学,运筹学和经营科学。他们的研究团队使用心理学实验的结果开发模拟人类解决问题方法的程序。这方法一直在卡内基梅隆大学沿袭下来,并在80年代于SOAR发展到高峰。基于逻辑不像艾伦·纽厄尔和赫伯特·西蒙,JOHN MCCARTHY认为机器不需要模拟人类的思想,而应尝试找到抽象推理和解决问题的本质,不管人们是否使用同样的算法。他在斯坦福大学的实验室致力于使用形式化逻辑解决多种问题,包括知识表示,智能规划和机器学习。致力于逻辑方法的还有 爱丁堡大学 ,而促成欧洲的其他地方开发编程语言PROLOG和逻辑编程科学。“反逻辑”斯坦福大学的研究者 (如 马文·闵斯基西摩尔·派普特 )发现要解决计算机视觉和自然语言处理的困难问题,需要专门的方案-他们主张不存在简单和通用原理(如逻辑)能够达到所有的智能行为。ROGER SCHANK 描述他们的“反逻辑”方法为 "SCRUFFY" 。常识知识库 (如DOUG LENAT的CYC)就是"SCRUFFY"AI的例子,因为他们必须人工一次编写一个复杂的概念。基于知识大约在1970年出现大容量内存计算机,研究者分别以三个方法开始把知识构造成应用软件。这场“知识革命”促成专家系统的开发与计划,这是第一个成功的人工智能软件形式。“知识革命”同时让人们意识到许多简单的人工智能软件可能需要大量的知识。

子符号法

80年代符号人工智能停滞不前,很多人认为符号系统永远不可能模仿人类所有的认知过程,特别是感知,机器人,机器学习和模式识别。很多研究者开始关注子符号方法解决特定的人工智能问题。

自下而上,接口AGENT,嵌入环境(机器人),行为主义,新式AI机器人领域相关的研究者,如RODNEY BROOKS, 否定符号 人工智能而专注于机器人移动和求生等基本的工程问题。他们的工作再次关注早期控制论研究者的观点,同时提出了在人工智能中使用控制理论。这与认知科学领域中的表征感知论点是一致的:更高的智能需要个体的表征(如移动,感知和形象)。计算智能80年代中DAVID RUMELHART 等再次提出神经网络和 联结主义 。这和其他的子符号方法,如模糊控制和进化计算,都属于计算智能学科研究范畴。

统计学法

90年代,人工智能研究发展出复杂的数学工具来解决特定的 分支问题 。这些工具是真正的科学方法,即这些方法的结果是可测量的和可验证的,同时也是人工智能成功的原因。共用的数学语言也允许已有学科的合作(如数学,经济或运筹学)。STUART J. RUSSELL和PETER NORVIG指出这些进步不亚于“革命”和“NEATS的成功”。有人批评这些技术太专注于特定的问题,而没有考虑长远的强人工智能目标。

集成方法

智能AGENT范式智能AGENT是一个会感知环境并作出行动以达致目标的系统。最简单的智能AGENT是那些可以解决特定问题的程序。更复杂的AGENT包括人类和人类组织(如公司)。这些范式可以让研究者研究单独的问题和找出有用且可验证的方案,而不需考虑单一的方法。一个解决特定问题的AGENT可以使用任何可行的方法-一些AGENT用符号方法和逻辑方法,一些则是子符号神经网络或其他新的方法。范式同时也给研究者提供一个与其他领域沟通的共同语言--如决策论和经济学(也使用ABSTRACT AGENTS的概念)。90年代智能AGENT范式被广泛接受。AGENT体系结构和认知体系结构研究者设计出一些系统来处理多ANGENT系统中智能AGENT之间的相互作用。一个系统中包含符号和子符号部分的系统称为 混合智能系统 ,而对这种系统的研究则是人工智能系统集成。分级控制系统则给反应级别的子符号AI和最高级别的传统符号AI提供桥梁,同时放宽了规划和世界建模的时间。RODNEY BROOKS的SUBSUMPTION ARCHITECTURE就是一个早期的分级系统计划。

智能模拟

机器视、听、触、感觉及思维方式的模拟:指纹识别,人脸识别,视网膜识别,虹膜识别,掌纹识别,专家系统,智能搜索,定理证明,逻辑推理,博弈,信息感应与辨证处理。

安全问题

人工智能还在研究中,但有学者认为让计算机拥有智商是很危险的,它可能会反抗人类。这种隐患也在多部电影中发生过,其主要的关键是允不允许机器拥有自主意识的产生与延续,如果使机器拥有自主意识,则意味着机器具有与人同等或类似的创造性,自我保护意识,情感和自发行为。

实现方法

人工智能在计算机上实现时有2种不同的方式。一种是采用传统的编程技术,使系统呈现智能的效果,而不考虑所用方法是否与人或动物机体所用的方法相同。这种方法叫工程学方法(ENGINEERING  APP ROACH),它已在一些领域内作出了成果,如 文字识别 、电脑下棋等。另一种是模拟法(MODELING APPROACH),它不仅要看效果,还要求实现方法也和人类或生物机体所用的方法相同或相类似。 遗传算法 (GENERIC  ALGOR ITHM,简称GA)和人工神经网络(ARTIFICIAL NEURAL NETWORK,简称ANN)均属后一类型。遗传算法模拟人类或生物的遗传-进化机制,人工神经网络则是模拟人类或动物大脑中神经细胞的活动方式。为了得到相同智能效果,两种方式通常都可使用。采用前一种方法,需要人工详细规定 程序逻辑 ,如果游戏简单,还是方便的。如果游戏复杂,角色数量和活动空间增加,相应的逻辑就会很复杂(按 指数式增长 ),人工编程就非常繁琐,容易出错。而一旦出错,就必须修改原程序,重新编译、调试,最后为用户提供一个新的版本或提供一个新补丁,非常麻烦。采用后一种方法时,编程者要为每一角色设计一个智能系统(一个模块)来进行控制,这个智能系统(模块)开始什么也不懂,就像初生婴儿那样,但它能够学习,能渐渐地适应环境,应付各种复杂情况。这种系统开始也常犯错误,但它能吸取教训,下一次运行时就可能改正,至少不会永远错下去,用不到发布新版本或打补丁。利用这种方法来实现人工智能,要求编程者具有生物学的思考方法,入门难度大一点。但一旦入了门,就可得到广泛应用。由于这种方法编程时无须对角色的活动规律做详细规定,应用于复杂问题,通常会比前一种方法更省力。

主要成果

人机对弈

1996年2月10~17日, GARRY KASPAROV以4:2战胜“深蓝” (DEEP BLUE)。

1997年5月3~11日, GARRY KASPAROV以2.5:3.5输于改进后的“深蓝”。

2003年2月GARRY KASPAROV 3:3战平“小深”(DEEP JUNIOR)。

2003年11月GARRY KASPAROV 2:2战平“X3D德国人” (X3D-F RIT Z)。

模式识别

采用 $模式识别引擎,分支有2D识别引擎,3D识别引擎,驻波识别引擎以及多维识别引擎

2D识别引擎已推出指纹识别, 人像识别 ,文字识别,图像识别, 车牌识别 ;驻波识别引擎已推出语音识别;3D识别引擎已推出指纹识别玉带林中挂(玩游智能版1.25)

自动工程

自动驾驶(OSO系统)

印钞工厂(¥流水线)

猎鹰系统(YOD绘图)

知识工程

以知识本身为处理对象,研究如何运用人工智能和软件技术,设计、构造和维护知识系统

专家系统

智能搜索引擎

计算机视觉和图像处理

机器翻译和自然语言理解

数据挖掘和知识发现

争议事件

2021年9月, 美国联邦法官 Leonie Brikema裁定:根据《专利法》,人工智能不能被列为美国专利的发明者。表示,法律仅允许“个人”(individual)拥有专利,人类属于“个人”,机器不是。该案由美国人工智能专家史蒂芬·L·泰勒(Stephen L. THALER)博士提起,其认为人工智能系统DABUS(Device for the Autonomous Bootstrapping of Unified Sentience,统一感知自动引导设备)产出了Neural Flame(一种以新颖且富有创意的方式闪烁以吸引注意力的 警示灯 )和Fractal Container(一种基于分形几何的饮料容器),应该允许其被列为专利中的发明人。

引用来源

中文名
人工智能
外文名
ARTIFICIAL INTELLIGENCE
提出时间
1956年
提出地点
DARTMOUTH学会
名称来源
雨果·德·加里斯的著作
简称