-
发展历程
机器学习是人工智能研究发展到一定阶段的必然产物。二十世纪五十年代到七十年代,人工智能研究处于‘推理期’,人们认为只要赋予机器逻辑推理能力,机器就具有智能。在那个时代,图灵发表了一篇划时代的论文,提出了著名的图灵测试:如果一台机器能够与人类展开对话而不能被辨别出其机器身份,那么称这台机器具有智能。后来出现了三大主流:分别为符号主义学习、连接主义学习以及统计主义学习,这几个主流研究的是从样例中进行学习。到现在为止,从样例中学习仍然是大趋势,目前很火的'sora','chatgpt','目标检测算法'等都是依靠从样例中学习,从而对模型的神经网络中参数进行调整,进而使模型达到智能的效果。
机器学习的三大发展阶段:
早期阶段(1950-1980):代表算法为感知机模型、最近邻算法;
中期发展阶段(1980-2010):代表算法为决策树和集成学习;
快速发展阶段:代表算法为神经网络,就是现在的深度学习。
纵观整个机器学习发展阶段,可以了解到机器学习就是使计算机具有学习,交流的能力。我们人是依靠大脑进行识别物体,记忆以及思考问题,建立机器学习模型便是构建神经元组成,它促使我们理解‘人类如何学习’,视觉,听觉,嗅觉在大脑形成并传递,那我们所形成的机器学习模型是否也能处理这些动作呢,一起看看吧!
-
机器学习的应用
机器学习是用算法指导计算机利用已知数据得出适当的模型,并利用此模型对新的数据给出判断预测。我认为,可以简单理解为大数据统计处理,目的是从数据中自动分析自然规律,并利用规律对未知数据进行预测,比较经典的机器学习算法应用应该是‘推荐算法’,该算法能够根据用户对事物的偏好,发现事物之间的相似度,发现与用户相似的用户群,进而为用户推荐一个期望的结果。
-
机器学习类型
机器学习有四种类型:有监督学习、半监督学习、无监督学习以及强化学习。
有监督学习:输入有标记的训练集,将预测结果与实际结果比较,直到模型达到预期的准确程度,主要用在分类和回归问题;
半监督学习:输入部分有标记,大部分无标记的训练集,主要用在标注成本高的问题;
无监督学习:没有目标变量,依靠数据本身去识别变量的内在特征,主要用在聚类和关联分析问题;
强化学习:以试错的方式进行学习,通过奖励指导行为使智能体获得最大奖赏或特定目的,主要用在机器人控制,计算机视觉,自然语言处理问题。
使用强化学习通关宝可梦:
使用强化学习训练AI玩宝可梦_哔哩哔哩_bilibili
模型学习的评估
我们需要知道的是,学习不是为了去提高你预测的准确性,而是尽可能地减小范化误差,因为大数据讲究的是全量而非抽样,机器学习同样应该在训练中提取到适用于所以潜在样本的‘普遍规律’,这样才能在遇到新样本时做出正确判别。当学习器把训练样本学得太好了,可能会把训练样本的本身特点当做潜在样本都具有的性质,导致范化性降低,这种现象称为‘过拟合’。但当学习器没有把训练样本学好时,又会产生准确性降低的现象,这种现象称为‘欠拟合’。下篇文章我将细讲模型精度与范化程度之间的关系,期待一下吧。
-
机器学习操作流程
主要分为三大阶段:准备阶段、训练阶段、预测阶段。
S1:准备阶段:数据采集与标注、数据预处理、特征优化;
S2:训练阶段:模型构建与训练、模型评估与调优;
S3:预测阶段:模型预测。
我们知道越来越多的公司使用了机器学习大模型,所以现在是一个机会去了解机器学习去应用到社会的什么东西,比如制造业的维护预测、销售行业的喜好检测等。