蜂群学习--一个分散的机器学习框架

684 阅读9分钟

传统的集中式机器学习方法在不同地点同时迅速产生大量数据的情况下有其局限性。为了应对这一挑战,人们需要分散的方法。蜂群学习,一种受自然启发的计算技术,正被解决方案的架构师们用来实现分散的机器学习系统。在这篇文章中,首先,我们将了解集中式学习技术的问题,然后我们将讨论分散式学习方法的好处。之后,我们将了解蜂群学习如何成为一个有效的分散式机器学习框架,解决集中式学习系统的挑战。文章中要涉及的主要内容列举如下。

目录

  1. 集中式/传统式学习技术的问题
  2. 分散式学习技术的预期解决方案
    1. 有效的
    2. 安全
    3. 保守隐私
  3. 蜂群学习
    1. 蚁群优化
    2. 粒子群优化
  4. 蜂群学习的应用

让我们从了解集中式学习技术所面临的问题开始讨论。

集中式/传统式学习技术的问题

在很多领域,我们看到数据的分布性越来越强,因为来自不同来源的数据正在迅速增加,这对集中式学习方法是一个挑战。让我们以自动驾驶汽车为例,其中激光雷达、雷达和视觉等传感器每天都会产生PB级的数据。这种数据是以前所未有的速度产生的。同时,由于汽车上有各种传感器,产生数据的位置也是分布式的。如果将这种数据集中存储在一个地方,那是很可怕的。

传统学习技术的第二个挑战是数据集中在一个地方,即数据的隐私和安全问题。大多数集中式机器学习算法需要整合数据,而这些数据接下来需要转移到不同的来源,这往往会导致数据的泄漏,许多行业,如健康行业,数据聚集了人们的个人信息,行为习惯,分散在许多来源中,会侵犯个人的隐私。

传统集中式ML模型的另一个限制来自于数据监管领域。我们看到大多数公司是他们自己数据的产生者,他们使用另一个实体来分析、清理和收集这些数据。这些实体有自己的基础设施来对数据进行上述的操作。这种将数据所有者和数据保管实体分开的做法,使得数据垄断,大量的数据利润进入了不同实体的口袋里。

去中心化学习技术的预期解决方案

正如我们刚刚讨论的集中式学习技术的缺点和问题。其中许多问题可以通过分散式学习技术来克服。为了理解它,让我们了解任何分散的机器学习方法的以下属性。

  • 有效

正如我们所知道的,无论我们对任何类型的数据所使用的ML都应该是准确的、高效的,而且还能够处理数据的高分布。由于更注重数据的分布,分散的学习算法需要更擅长处理高度分布的数据。利用他们分配工作负载的技术,连接同伴,我们应该在准确性和效率方面获得更高的结果。此外,这些学习技术应该有处理不平衡数据的选项。

  • 安全

正如我们已经谈到的关于集中式学习技术的安全问题。去中心化的ML具有安全功能,应确保只有受信任的参与者才能在学习过程中出现。这些可以被认为是区块链技术,只有受信任的参与者可以在当前进行修改,而且已经证明区块链与其他技术相比具有很高的安全性。

  • 保护隐私

去中心化的最佳特征之一是他们提供更好的隐私。ML的去中心化应该让所有者更好地控制他们在数据中呈现的敏感信息。

在上面的部分,我们已经看到了集中式学习技术的缺点是什么,以及我们如何使用分散式学习技术来克服它们。可以有各种分散的学习方法,蜂群学习是其中之一,我们利用它来利用分布式数据的力量。这种类型的学习实际上是通过一些自然或生物过程的启发。在文章的下一节,我们将讨论蜂群学习。

蜂群学习

蜂群学习是人工智能和机器学习研究的一部分,蜂群学习的主要重点是评估分散系统的行为,正如我们在文章的上述部分所看到的,我们在集中式学习技术方面存在各种问题,我们的大多数传统模型都依赖于这种技术。一个分散的系统可能有助于我们克服集中式学习方法的困难。这种学习的基本思想来自于蚁群或鸟群的运作方式。转化为计算上的智能系统。

以鸟群为例,为了到达目的地,每只鸟都参与其中,鸟的行动可以被认为是它在到达目的地的整体行动中的贡献。在蜂群学习中,一个全局系统被划分为代理人和他们的环境。代理人的互动行为导致了全局解决方案的行为。就神经网络而言,我们可以说这些相交的代理是神经元的群体,它们基本上是作为一个团队在寻找最佳位置。

我们可以说蜂群学习是通过两个主要的优化技术传播的。

  • 蚁群优化(ACO
  • 粒子群优化(PSO)

让我们详细了解这些技术。

蚁群优化

我们知道蚂蚁群是如何寻找食物的。我们经常看到蚂蚁排成一排或多排走向食物。同样,蚁群优化(ACO)是一种解决计算问题的技术,或者我们可以说ACO是一种概率技术,用于在图中寻找好的路径,这样可以导致问题的最优解决方案。而图是一个由不同的相关对象集组成的结构。人工姨妈和一些解决优化问题的启发式方法的结合可以被认为是图的优化的ACO方法,可以用于车辆路由或互联网路由中。

图片来源

上面的图片是选择两点A和B之间的最短路径的表示,其中图形被用来做最短长度的路径。这是一个定义蚁群方法的危险。根据不同的作者,ACO的定义是不同的。我们可以粗略地说,蚁群优化技术是一种人口密集的元启发式方法,每个解决方案都由一只在搜索空间移动的蚂蚁代表。下图是蚂蚁群从初始阶段到最后阶段寻找最短食物路径的表现。

图片来源

粒子群优化

正如我们所看到的,在蚁群优化中,我们使用图形来寻找问题的最佳解决方案。在这里,这也是一种优化技术,基本上取决于我们试图以迭代的方式改进候选解决方案,以找到任何问题的最佳解决方案的集合。候选解决方案的集合可以被认为是粒子,在搜索空间中移动这些粒子就可以得到问题的解决方案,在移动过程中,粒子的位置和速度都使用简单的数学函数。任何粒子的运动总是受到其在搜索空间中的最佳位置的影响,并通过移动引导粒子到该空间的函数。通过这些程序,预计将使蜂群向最佳解决方案移动。

图片来源

上面的图片是PSO的代表,其中粒子正在搜索一个函数的全局最小值。

这种优化技术也是一种元启发式的,因为它也不对问题做任何假设,而且使用这种方法我们可以搜索非常大的空间。

在上面,我们已经看到了什么是蜂群学习,以及我们如何能够接近蜂群学习下的不同优化技术。蜂群学习可以有多种应用,我们将在文章的下一节讨论蜂群学习的一些重要应用。

蜂群学习的应用

根据上述直觉,我们可以说,蜂群学习是一种执行分散式学习的方式,它可以被视为对我们面临集中式学习的挑战的补救措施。另外,蜂群学习有很多好处。它可以被用于各种不同的领域。而它发挥了重要作用的一些重要领域列举如下。

  • 蜂群学习可以被用于控制道路交通。其中一个切实可行的例子是美国军方,他们正在使用蜂群技术来控制无人驾驶车辆。
  • 同样在空间技术方面,也有蜂群学习的用途。欧洲航天局和美国国家航空航天局正在使用蜂群技术来解决有关空间技术的问题,其中美国国家航空航天局正在使用蜂群学习,并正在开发轨道蜂群的自组装和干涉测量。
  • 1992年,George A. Bekey讨论了使用群集学习来控制纳米机器人的可能性,这些纳米机器人将被用于人体,以杀死癌症肿瘤。而al-Rifaie和Aber则利用蜂群学习来帮助定位肿瘤。
  • 蜂群学习还可用于数据挖掘和聚类分析领域。

最后的话

在这篇文章中,我们看到了传统的集中式学习技术的问题,以及我们如何利用分散式学习技术克服这些缺点或集中式学习技术的问题。蜂群学习是一种去中心化的学习技术,有两种主要的方法,即蚁群优化(ACO)和粒子群优化(PSO)。我们还讨论了这些部分以及群集学习的应用。