知海寻津 | 从Deepseek到秧BOT:人工智能知多少

发布时间: 2025-02-19 字体:

  开源推理大模型Deepseek-R1 

  亮相春晚扭秧歌的宇树H1机器人 

  这些AI小伙伴于开年之际 

  就在朋友圈狠狠刷了一波存在感 

  你一定会好奇 

  AI们究竟是如何成长学习的呢? 

  我们一起来看看吧~ 

    

  

(图源:微博@包容万物恒河水)

    

  人工智能Artificial Intelligence,简称AI)是什么? 

  在狭义上,人工智能可以认为是用机器来模仿人类的智能。在广义上,则可以视为对一切拥有智能行为的生命的模仿和学习。 

  ——《人工智能极简史》张军平 

  AI有哪些“成长”秘诀? 

  数据:就像人类通过观察和经验学习,AI需要“消化”大量的数据(文字、图片、音频等)来训练自己。 

  算法:这是一套预设的数学规则,指导AI如何从数据中提取模式。比如“如何识别一张图片里的猫”。 

  算力:在计算机这个“健身房”里,AI可以训练快速处理数据、实现复杂运算的能力。 

 

  

(图源:pixabay)

  AI的能力水平如何? 

  专用人工智能(Artificial Narrow Intelligence,简称ANI):为特定领域或问题而设计,专注于单一任务,如语音识别、图像识别、下棋、翻译等。 

  通用人工智能(Artificial General Intelligence,简称AGI):可灵活处理人类能完成的任何智力任务的“全能选手”,目前尚未实现。


  AI是怎么发展起来的? 

  一、萌芽期 

  提及人工智能,就不得不追溯到1936年提出“图灵机”这一概念的计算机科学之父、英国科学家艾伦·图灵。1950年,他在期刊《心智》上发表论文《计算机器与智能》,这被认为是人工智能领域的开山之作。其中,他首次提出著名的“图灵测试”:若测试者无法分辨其交流对象是人还是机器,这台机器就被视为通过了测试,拥有了人类的智能。 

  二、初创期 

  1956年的达特茅斯会议,可视为人工智能启航的原点。自此,“人工智能”被正式命名,登上人类历史舞台,并引发了研究热潮。人工智能界在定理证明、棋类博弈、感知机、人机互动及通用移动机器人等方面获得不错的进展,早期人工智能的重要假设——物理符号系统假设也应运而生。但人们逐渐发现,算法在实验室预先设计好的简化问题上表现尚可,而在面对组合量数量级过大的“组合爆炸”问题时难以取得突破,加之算力不足、数据收集有限等原因,人工智能发展未能迅速实现预期目标。20世纪70年代,英国专家在评估报告中对人工智能发展前景持悲观态度,人工智能研究第一次陷入低谷。这一时期,相关研究仍在继续,基于符号主义、模拟专家决策过程的专家系统得到发展,在辅助医疗诊断、化学研究等方面较为成功,并孕育出知识工程这一分支研究方向。 

  三、成长期 

  20世纪80年代,人工智能迎来了第二次复兴。专家系统被应用于多个行业。新型训练方法突破了感知机的局限,激活了神经网络研究,使之成为人工智能领域的主力军。以统计学习为核心、以应用为驱动的机器学习,一度成为当时主要的研究与发展方向。90年代后期开始,人工智能创新迭出。1997年,IBM研发的超级计算机“深蓝”击败国际象棋冠军卡斯帕罗夫,在克服“组合爆炸”问题上更进一步。2006年,辛顿提出“深度学习”概念,并构建深度学习网络模型,为神经网络的复兴提供了理论支持。2009年,第一个真正意义上的大规模图像数据集ImageNet发布,之后被广泛运用于深度学习算法的训练。 

 

  

(图源:pixabay)

 

  四、第三次热潮 

  2010年左右,科研人员开始以形成更多可落地的科研成果为目标,在世界范围内掀起全方面的人工智能热潮。2012年,AlexNet深度模型在图像识别中大幅领先传统算法,深度学习崛起,成为主流技术。此后,无人驾驶汽车、谷歌AI系统阿尔法狗、波士顿动力公司研发的机器人系列、生成对抗网络、知识图谱等也成绩瞩目。2017年,Transformer架构问世,奠定了大模型的基础。除了大语言模型GPT系列的文本生成,生成式大模型往多模态方向发展,出现DALL-EStable DiffusionMidjourney等图像生成模型、Suno音乐生成模型、Sora视频生成模型等,可处理图像、音频、视频等多种媒体形式。 

  机器大脑是如何运转的? 

 

  

(图源:pixabay)

 

  机器学习:让机器开始自我学习的方法。一个系统可以从数据或环境中改进其性能,通过执行某种过程在经验中学习。机器学习使AI可以进行预测、分类、推荐等。 

  学习方式 

  监督学习:使用标记的数据训练模型,像老师带学生做题,每个训练示例都是一个输入数据和一个标准答案。应用于垃圾邮件识别、文本挖掘等。 

  无监督学习:使用没有标注的数据进行学习,就像无导师模式,让AI自己发现数据中的规律。应用于异常检测、市场细分等。 

  强化学习:根据环境反馈,调整动作以获得奖励,在试错中学习回报最大化的决策。应用于机器人控制、自动驾驶等。Deepseek-R1就是主要依靠强化学习训练“自学成才”的哦~ 

 

 

(图源:小红书@滚筒复读机)

 

  人工神经网络:模仿人脑神经元结构的机器学习方法,由输入层、一或两个隐藏层(每层有许多神经元组成进行计算)、输出层构成。 

  人脑神经元基本结构: 

  树突(输入端):接收其他神经元传入信息。 

  细胞核:加工处理信息。 

  轴突:传送信息到神经元的输出部分。 

  突触(输出端):将信息输送到其他神经元。 

  人工神经网络和人脑的功能类比: 

 

 

  深度学习:建立多层神经网络,使用更多隐藏层,模拟人脑进行学习和推理。应用于图像识别、语音识别、自然语言处理等。 

    

  

(图源:unsplash)

    

延伸阅读 

 

《人工智能极简史》 

作者:张军平 

索书号:TP18/584 

  《人工智能极简史》无公式与代码,以文字和漫画形式来讲述人工智能发展过程中的人物、技术与轶事,以及科研一线人员对人工智能近年来研究思路上的思考,和对未来人工智能发展的研判。全书内容简洁严谨且通俗易懂,兼具趣味性和故事性,是一本适合人工智能爱好者及科研工作者入门的科普读物。 

 

    

 

《走进人工智能》 

作者:吴飞 

索书号:TP18-49/94 

        本书面向非专业人士,尤其是青少年群体,将硬核知识、技术方法与人文历史、人物故事有机融合,理顺人工智能纵向发展脉络与横向科学轮廓,厘清人工智能的核心技术方法,帮助读者看懂人工智能与其他学科交叉碰撞所引发的社会生活变化,从“成天下之才”的角度给读者提供学习建议。
 
 

相关信息

附件下载