知海寻津 | 从Deepseek到秧BOT:人工智能知多少
开源推理大模型Deepseek-R1
亮相春晚扭秧歌的宇树H1机器人
这些AI小伙伴于开年之际
就在朋友圈狠狠刷了一波存在感
你一定会好奇
AI们究竟是如何成长学习的呢?
我们一起来看看吧~
(图源:微博@包容万物恒河水)
人工智能(Artificial Intelligence,简称AI)是什么?
“在狭义上,人工智能可以认为是用机器来模仿人类的智能。在广义上,则可以视为对一切拥有智能行为的生命的模仿和学习。”
——《人工智能极简史》张军平
AI有哪些“成长”秘诀?
数据:就像人类通过观察和经验学习,AI需要“消化”大量的数据(文字、图片、音频等)来训练自己。
算法:这是一套预设的数学规则,指导AI如何从数据中提取模式。比如“如何识别一张图片里的猫”。
算力:在计算机这个“健身房”里,AI可以训练快速处理数据、实现复杂运算的能力。
(图源:pixabay)
AI的能力水平如何?
专用人工智能(Artificial Narrow Intelligence,简称ANI):为特定领域或问题而设计,专注于单一任务,如语音识别、图像识别、下棋、翻译等。
通用人工智能(Artificial General Intelligence,简称AGI):可灵活处理人类能完成的任何智力任务的“全能选手”,目前尚未实现。
AI是怎么发展起来的?
一、萌芽期
提及人工智能,就不得不追溯到1936年提出“图灵机”这一概念的计算机科学之父、英国科学家艾伦·图灵。1950年,他在期刊《心智》上发表论文《计算机器与智能》,这被认为是人工智能领域的开山之作。其中,他首次提出著名的“图灵测试”:若测试者无法分辨其交流对象是人还是机器,这台机器就被视为通过了测试,拥有了人类的智能。
二、初创期
1956年的达特茅斯会议,可视为人工智能启航的原点。自此,“人工智能”被正式命名,登上人类历史舞台,并引发了研究热潮。人工智能界在定理证明、棋类博弈、感知机、人机互动及通用移动机器人等方面获得不错的进展,早期人工智能的重要假设——物理符号系统假设也应运而生。但人们逐渐发现,算法在实验室预先设计好的简化问题上表现尚可,而在面对组合量数量级过大的“组合爆炸”问题时难以取得突破,加之算力不足、数据收集有限等原因,人工智能发展未能迅速实现预期目标。20世纪70年代,英国专家在评估报告中对人工智能发展前景持悲观态度,人工智能研究第一次陷入低谷。这一时期,相关研究仍在继续,基于符号主义、模拟专家决策过程的专家系统得到发展,在辅助医疗诊断、化学研究等方面较为成功,并孕育出知识工程这一分支研究方向。
三、成长期
20世纪80年代,人工智能迎来了第二次复兴。专家系统被应用于多个行业。新型训练方法突破了感知机的局限,激活了神经网络研究,使之成为人工智能领域的主力军。以统计学习为核心、以应用为驱动的机器学习,一度成为当时主要的研究与发展方向。90年代后期开始,人工智能创新迭出。1997年,IBM研发的超级计算机“深蓝”击败国际象棋冠军卡斯帕罗夫,在克服“组合爆炸”问题上更进一步。2006年,辛顿提出“深度学习”概念,并构建深度学习网络模型,为神经网络的复兴提供了理论支持。2009年,第一个真正意义上的大规模图像数据集ImageNet发布,之后被广泛运用于深度学习算法的训练。
(图源:pixabay)
四、第三次热潮
2010年左右,科研人员开始以形成更多可落地的科研成果为目标,在世界范围内掀起全方面的人工智能热潮。2012年,AlexNet深度模型在图像识别中大幅领先传统算法,深度学习崛起,成为主流技术。此后,无人驾驶汽车、谷歌AI系统阿尔法狗、波士顿动力公司研发的机器人系列、生成对抗网络、知识图谱等也成绩瞩目。2017年,Transformer架构问世,奠定了大模型的基础。除了大语言模型GPT系列的文本生成,生成式大模型往多模态方向发展,出现DALL-E、Stable Diffusion、Midjourney等图像生成模型、Suno音乐生成模型、Sora视频生成模型等,可处理图像、音频、视频等多种媒体形式。
机器大脑是如何运转的?
(图源:pixabay)
机器学习:让机器开始自我学习的方法。一个系统可以从数据或环境中改进其性能,通过执行某种过程在经验中学习。机器学习使AI可以进行预测、分类、推荐等。
学习方式
l 监督学习:使用标记的数据训练模型,像老师带学生做题,每个训练示例都是一个输入数据和一个标准答案。应用于垃圾邮件识别、文本挖掘等。
l 无监督学习:使用没有标注的数据进行学习,就像无导师模式,让AI自己发现数据中的规律。应用于异常检测、市场细分等。
l 强化学习:根据环境反馈,调整动作以获得奖励,在试错中学习回报最大化的决策。应用于机器人控制、自动驾驶等。(Deepseek-R1就是主要依靠强化学习训练“自学成才”的哦~)
(图源:小红书@滚筒复读机)
人工神经网络:模仿人脑神经元结构的机器学习方法,由输入层、一或两个隐藏层(每层有许多神经元组成进行计算)、输出层构成。
人脑神经元基本结构:
l 树突(输入端):接收其他神经元传入信息。
l 细胞核:加工处理信息。
l 轴突:传送信息到神经元的输出部分。
l 突触(输出端):将信息输送到其他神经元。
人工神经网络和人脑的功能类比:
深度学习:建立多层神经网络,使用更多隐藏层,模拟人脑进行学习和推理。应用于图像识别、语音识别、自然语言处理等。
(图源:unsplash)
延伸阅读

《人工智能极简史》
作者:张军平
索书号:TP18/584
《人工智能极简史》无公式与代码,以文字和漫画形式来讲述人工智能发展过程中的人物、技术与轶事,以及科研一线人员对人工智能近年来研究思路上的思考,和对未来人工智能发展的研判。全书内容简洁严谨且通俗易懂,兼具趣味性和故事性,是一本适合人工智能爱好者及科研工作者入门的科普读物。
《走进人工智能》
作者:吴飞
索书号:TP18-49/94