×

什么是机器学习?街边氛围感

hqy hqy 发表于2025-03-03 17:45:02 浏览25 评论0百度已收录

抢沙发发表评论

今日,让我们一同来解读一下科幻电影中所展现的机器学习技术。

钢铁侠和美国队长因观点存在分歧而爆发了激烈的冲突。在冲突过程中,钢铁侠先是遭到攻击,随后它从之前累积的美国队长的战斗数据中进行搜索,试图探寻美国队长出拳的规律,最终成功扭转了局势。

这一神奇的技术,正是得益于钢铁侠战甲所具备的机器学习能力。

在《美国队长3》这部影片中,钢铁侠与美国队长因观念上的冲突而引发了内战。起初,钢铁侠不断挨打,借此积累了大量美国队长的战斗数据,接着对这些数据展开计算和分析,以找出美国队长的出拳规律,从而改变了不利的局面。

这种针对对战数据进行的深入分析,其本质就是钢铁侠拥有强大的机器学习能力。

机器学习是人工智能领域中一个重要的研究方向,它通过对已有的数据或者经验进行学习,从而实现算法性能的自动改进。其目的在于将人类思考、归纳经验的过程转化为计算机可执行的操作,即通过对数据的处理构建出相应的模型。

计算机得出的模型能够以近似于人类的方式解决众多复杂的问题。机器学习的核心在于运用算法来解析数据,通过一系列运算,从数据或经验中进行学习,进而对特定任务做出决策或预测,并对最终效果进行评估。

机器学习中的训练与预测过程,与人类的归纳和推测过程相对应。

基于这样的对应关系,我们不难发现,机器学习的思想其实并不复杂,它仅仅是对人类生活中学习成长过程的一种模拟。由于机器学习并非基于编程产生的结果,所以它的处理过程并非因果逻辑,而是通过归纳思想得出的相关性结论。

自20世纪50年代起,人们开始对机器学习展开研究,不同时期的研究途径和目标各不相同,大致可划分为四个主要阶段。

第一阶段是从20世纪50年代中叶到60年代中叶。这一时期的研究重点在于有无知识的学习。由于当时知识储备相对匮乏,距离实现真正的智能研究还相差甚远。

其中最具代表性的成果是1952年创建的第一个真正意义上的机器学习程序,也就是一个简单的棋盘游戏。

第二阶段是从20世纪60年代中叶到70年代中叶。此阶段主要致力于将各个领域的知识植入到系统中,目的是让机器模拟人类的学习过程。

在这个阶段,科研人员主要使用各种符号来表示机器语言,并将专家学者的知识融入系统之中,取得了一定的成效。

第三阶段为20世纪70年代中叶到80年代中叶。在这一阶段,研究从学习单个概念拓展到学习多个概念,开始将学习系统与各类应用相结合,并取得了显著的成功。

同时,专家系统在知识获取方面的需求极大地推动了机器学习的发展,自动知识获取成为机器学习应用的研究目标。

20世纪80年代中叶以后,机器学习发展进入第四阶段。此时,机器学习已成为新的学科方向,它综合运用了心理学、生物学、神经生理学、数学、自动化和计算机科学等多门学科知识,形成了机器学习理论的基础,融合了多种学习方法,并且朝着多样的集成学习系统的研究方向发展。

首先是数据的选择环节。这里的数据可划分为三部分,分别是用于训练的数据、用于验证的数据以及用于测试的数据。

有了数据之后,第二步便是对数据进行建模。具体操作是利用训练数据来构建设计相关特征的模型。

得到数据后,第三步是验证模型。即使用之前准备好的验证数据来检验所建立模型的效果。

第四步是调试模型。为了提升模型的性能,需要使用更多的数据、不同的特征来调整参数,这是整个过程中最耗时、最费力的一个环节。

当模型准备就绪后,第五步便是模型的部署。将训练好的模型应用于新的数据进行预测,最后还需要用测试用的数据来验证模型,并对模型的性能进行评估。

几十年来,机器学习的方法种类繁多,其中常见的、最为经典的方法可分为三类,即有监督学习、无监督学习和强化学习。

所谓有监督学习,通俗来讲就是我们通常所说的分类。它是指通过已有的信息获得一个最优的处理模式,再借助这个模式将所有输入信息处理成输出信息。计算机通过对输出信息的简单判断,将已有的信息划分成不同的类别。

如此一来,人工智能便具备了对未知数据进行分类的能力。

例如,家长经常教育孩子苹果是能吃的,石头是不能吃的。在这里,苹果和石头就是输入信息,而家长给出的“能吃”和“不能吃”的判断就是相应的输出信息。当孩子的认知能力达到一定程度时,就会逐渐形成一种模式。遇到类似石头的东西时,就知道它不能吃。有监督学习就是通过有标签的数据结合标定的结果进行直接反馈,从而来预测结果或未来。

与有监督学习不同,无监督学习并没有提供任何可供参考的样本或者已经分类的参考目标,给定的数据集也没有正确答案。在这种情况下,计算机需要直接对已有的数据建立模型,挖掘其中潜在的结构。

也许有人会疑惑,在没有样本的情况下,计算机如何自行建立模型呢?其实,在人类的思维过程中,无监督学习是时常发生的。

比如我们对音乐并不了解的情况下,不知道古典音乐和摇滚乐的区别,但我们依然能够自发地对其进行分类。这就是无监督学习,没有人给我们提供分类音乐的模型,但我们仍能区分不同类型的音乐。

当我们根据某种事物的特性将其归为一类时,使用的就是无监督学习中的聚类分析法。俗话说“物以类聚”,这里的“类”就是指具有相似元素的事物的集合。

聚类分析的目的是在相似的基础上收集数据并进行分类。

聚类分析的对象被称为描述数据,通过衡量它与不同数据源之间的相似性,就能把不同的数据源归到不同的类别中。例如,我们找到一种植物,发现它具有青菜的特征,只是颜色有所不同,那么我们就可以将其归类为蔬菜类。

还有一类机器学习方法叫做强化学习。它是AI在自己所属的环境中一边试错,一边寻找最合适行动的过程。

具体来说,首先要清楚地表现出自己的行动和状况;其次要明白在什么样的状况下采取什么样的行动,在该环境下会产生什么样的结果;然后从中学习并采取最优的行动。

学习的线索是获得的回报,而回报是相对结果的价值体现。例如在格斗游戏中让人类玩家和AI对战,开始时AI会毫无章法地出招,此时会回报人类玩家的体力有一定程度的减少。最初可能对玩家构不成什么伤害,但在反复的对战过程中,偶尔会对玩家造成伤害。AI就会记住场景,通过不断地对战,AI就能学会在什么情况下采取什么样的招式可以削弱对方的体力。

机器学习拥有巨大的潜力来改变和改善世界,我们正朝着真正的人工智能迈进。例如目前火热研发中的无人驾驶汽车,通过机器学习可以实现自动导航,并确保安全的驾驶。

举个例子,交通标志的传感器采用监督学习算法来识别和解析交通标志,并将其与一组标有标记的标准标志进行比较。这样一来,汽车就能够识别停车标志,并明白它实际上意味着要停车,而不是转弯单向行驶或者人行横道等等。