本书作者简介
梅拉妮・米歇尔(Melanie Mitchell)是美国波特兰州立大学计算机科学教授,圣塔菲研究所客座教授,研究领域涉及人工智能、复杂系统、认知科学等。她于 1990 年在印第安纳大学获得博士学位,导师是著名学者侯世达(Douglas Hofstadter),其研究成果在人工智能领域产生了广泛影响。著有《复杂》(Complexity: A Guided Tour)等书,《AI 3.0》是她的又一力作,以独特视角深入剖析人工智能,为读者清晰呈现人工智能的发展现状、技术原理、应用前景及面临的挑战,帮助读者全面理解这一前沿科技。
核心观点
- 人工智能的发展经历了多个阶段,包括符号人工智能、亚符号人工智能、机器学习和深度学习等,但目前仍面临着诸多挑战,如实现通用人工智能的困难、对常识的缺乏理解等。
- 深度学习在计算机视觉、游戏和自然语言处理等领域取得了显著进展,但这些系统在理解能力、抽象思维和迁移学习等方面仍存在局限性。
- 人类智能具有独特的特点,如直觉、模拟、隐喻、抽象与类比以及反思等,这些能力是人工智能目前难以企及的。
- 赋予人工智能核心常识、形成抽象概念和类比能力是实现人工智能进一步发展的关键,但目前的方法仍存在不足。
人工智能的发展历程
- 起源与早期阶段
- 1956 年达特茅斯会议标志着人工智能领域的正式确立,会议提出了 “人工智能” 这一术语,并设定了通过合成智能来研究智能属性的目标。
- 早期的人工智能研究主要集中在符号人工智能,试图用数学逻辑和符号推理来解决问题,如通用问题求解器。
- 亚符号人工智能受神经科学启发,以感知机为代表,试图模拟大脑的神经元处理信息方式,但早期发展遇到困难。
- 起伏与发展
- 20 世纪 80 年代,神经网络研究经历了起伏,联结主义兴起,强调构建合适的计算结构和从数据中学习,但随后因研究困难和资金问题陷入低谷。
- 机器学习作为一个独立分支逐渐发展,包括监督学习、无监督学习等方法,但在当时面临数据和算力的限制。
- 近期复兴
- 深度学习的出现带来了人工智能的新突破,尤其是在计算机视觉和语音识别等领域取得了显著成果,如 ConvNets 在 ImageNet 竞赛中的成功。
- 强化学习在游戏领域取得了重大进展,AlphaGo 等程序通过自我对弈学习,在围棋等复杂游戏中战胜人类选手。
视觉识别技术
- ConvNets 的工作原理
- ConvNets 模拟大脑视觉系统,由一系列模拟神经元层组成。输入图像后,通过卷积层对图像进行特征提取,每一层的单元检测不同层次的视觉特征,如边缘、形状等,最终通过分类模块输出对图像内容的预测。
- 网络通过大量训练样本学习权重,调整连接权重以提高识别准确率。
- 视觉识别的应用与挑战
- ConvNets 在目标识别等任务上取得了很大成功,广泛应用于图像搜索、自动驾驶、人脸识别等领域。
- 但仍面临挑战,如长尾效应导致对罕见情况容易出错,难以理解图像中的物体关系和场景意义,对图像的微小变化敏感,易受对抗样本攻击,且缺乏人类视觉的稳定性和可靠性。
游戏与推理能力
- 强化学习在游戏中的应用
- 强化学习通过智能体在环境中执行动作并获得奖励来学习,如 AlphaGo 通过自我对弈,利用深度 Q 学习和蒙特卡洛树搜索等方法,在围棋游戏中取得巨大成功。
- 其他游戏程序如 DeepMind 的雅达利游戏程序也展示了强化学习的能力,但这些程序在不同游戏间的知识迁移能力有限。
- 游戏程序的局限性
- 尽管游戏程序在特定游戏中表现出色,但它们缺乏真正的理解和通用智能,无法像人类一样将在一个游戏中学到的知识迁移到其他游戏或领域。
- 它们对游戏环境和规则的理解较为狭隘,不具备人类在游戏中所运用的抽象思维、策略规划和对复杂情境的适应能力。
自然语言处理进展
- 语言处理技术与应用
- 深度学习在自然语言处理中发挥了重要作用,如自动语音识别取得了显著成就,使得语音转录准确率大幅提高,但在理解语音含义方面仍存在不足。
- 机器翻译从早期的基于规则方法发展到统计机器翻译,再到如今的神经机器翻译,虽取得进步,但在处理语义理解、歧义语言和长文本时仍有困难。
- 情感分类、问答系统等自然语言处理任务也在不断发展,但在准确性和对语言的真正理解上仍有待提高。
- 面临的问题与挑战
- 自然语言处理系统难以理解语言的语义和语境,容易受到歧义、隐喻和隐含信息的影响。
- 缺乏常识和背景知识,导致在处理文本时容易出现错误或不合理的回答,如在阅读理解测试中难以达到人类水平。
常识与人工智能的挑战
- 人类理解的基石
- 人类天生具备核心知识,包括直觉物理学、直觉生物学和直觉心理等,这些知识构成了理解世界的基础,使人类能够快速理解和应对各种情境。
- 人类通过心智模型进行预测和模拟,理解情境的本质并想象可能的未来,这依赖于对世界的物理和因果关系的理解,以及抽象和类比能力。
- 人工智能获取常识的尝试与困境
- 一些项目如 Cyc 试图通过人工编码大量事实和逻辑规则来赋予机器常识,但面临诸多问题,如难以涵盖潜意识知识、缺乏抽象和类比能力,且进展缓慢,未对主流研究产生重大影响。
- 深度学习系统在获取常识方面也存在困难,尽管在数据驱动的任务中表现出色,但在理解抽象概念、进行因果推理和迁移学习等方面仍有很大差距。
应用案例
- 图像识别与分类:谷歌利用 ConvNets 实现图像搜索和标注,Facebook 用于人脸识别和照片标注,但这些应用在面对复杂场景和对抗样本时可能出现错误。
- 自动驾驶汽车:依赖计算机视觉和强化学习技术,但在复杂路况和长尾效应下仍面临安全和可靠性挑战。
- 语音助手:如 Siri、Alexa 等通过语音识别和自然语言处理技术回答用户问题,但在理解语义和处理复杂语境方面存在局限性。
对人工智能未来的思考
人工智能的未来发展充满挑战,实现通用人工智能仍需克服诸多技术难题,如赋予机器常识、提高理解能力、增强迁移学习能力等。同时,人工智能的发展也引发了一系列伦理和社会问题,如就业结构变化、隐私保护、算法偏见等,需要在技术发展的同时加以关注和解决。