【十大深度学习项目(2)】

303 阅读7分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

06.深度学习项目:音乐流派分类

人们每天都在听音乐。每个人对音乐都有不同的品味。使用机器学习构建音乐推荐系统很容易。但是,将音乐分为各种流派是不同的。要创建深度学习项目,您需要使用深度学习技术。此外,这个深度学习项目可以让你对音频信号分类有一个很好的了解。

可以使用多种方法来解决问题,例如 CNN、支持向量机、K 最近邻和 K 均值聚类。你可以使用任何你喜欢的东西。

深度学习项目使用GTZAN数据集。它包含2000-200年的各种歌曲。每首歌曲的长度为30秒。有十种流派可供选择,每首歌曲都有适当的标签。

接下来,您必须完成特征提取过程。每隔20-40ms将音乐分成更小的帧。然后检查噪声以使数据无噪声。该过程是使用 DCT 方法执行的。

导入深度学习项目所需的库。特征提取后,分析每个数据的频率。频率也将有助于确定流派。

使用适当的算法构建模型。使用KNN是最方便的。但是为了获得知识,让我们尝试使用CNN或RNN。

运行模型后,测试其准确性。

07.深度学习项目:旧黑白图像着色页免费可打印着色页

如今,我们看到的一切都是彩色图像。曾经有一段时间,只有黑白相机可用。当然,所有图像都是黑白的。然而,技术的进步使得为黑白图像添加RGB颜色成为可能。

深度学习使我们很容易做这些事情。你只需要了解基本的Python编程。您所要做的就是创建一个模型,如果您愿意,可以为深度学习项目创建一个GUI。这个深度学习项目对初学者来说非常有用。

image.png

我们使用 OpenCV DNN 架构作为基本模型。神经网络使用L通道的照片数据作为源,a和b流的信号作为目标进行训练。

为方便起见,让我们使用预训练的 Caffe 模型。创建一个单独的目录并添加所有必需的模块和库。

让我们阅读黑白图像并加载Caffe模型。如有必要,请根据您的深度学习项目组织图像并提高其准确性。

然后,我们修改预先训练的模型。根据需要添加层并处理要放置在模型中的 L 通道。

在训练集上运行模型。让我们通过坚持准确性和精确度使模型尽可能准确。

最后,让我们使用 ab 通道进行预测。再次观察结果并保存模型以供以后使用。

08.深度学习项目:驾驶员嗜睡检测

成千上万的人整天使用高速公路,日夜不停。出租车司机、卡车司机、公共汽车司机和长途旅行者都患有睡眠不足。因此,疲劳驾驶时是非常危险的。大多数事故是由驾驶员疲劳引起的。因此,为了避免这些崩溃,我们将使用Python,Keras和OpenCV来创建一个模型,以便在我们的工人疲惫时通知我们。

这个深度学习项目的目的是创建一个嗜睡监测传感器,用于监测一个人的眼睛何时暂时闭合。识别出困倦时,模型会通知驾驶员。

在这个Python深度学习项目中,我使用OpenCV从相机收集图片,并将它们放入深度学习模型中,以确定一个人的眼睛是睁开还是闭合。

这个深度学习项目中使用的数据集包含几个睁开和闭上眼睛的人的图像。每个图像都已标记。它包含7,000多张图片。

然后,使用 CNN 构建模型。在这种情况下,请使用 Keras。完成后,总共将有128个节点完全连接。

现在运行代码并检查精度。如有必要,调整超参数。我使用PyGame来编写GUI。

您可以使用 OpenCV 接收视频或改用网络摄像头。让我们来测试一下自己。闭上眼睛5秒钟,你会看到模型警告你。

09.深度学习项目:使用CIFAR-10数据集进行图像分类

一个值得注意的深度学习项目是图像分类。这是一个初学者级别的项目。以前,我们进行了各种类型的图像分类。但是,CIFAR 数据集是特殊的,因为它具有广泛的图像范围。在处理其他高级项目之前,您应该先执行此深度学习项目。分类的基础知识可以从中理解。让我们像往常一样使用python和Keras。

分类任务是将数字图像的所有元素分类为几个类别之一。事实上,它在图像分析中非常重要。

CIFAR-10数据集是一个广泛使用的计算机视觉数据集。该数据集已被用于各种深度学习计算机视觉研究。

该数据集由60,000张图片组成,由10个类标签隔开,其中包括6000张尺寸为32 * 32的图片。该数据集提供低分辨率照片(32 * 32),以便研究人员可以尝试新技术。

使用Keras和Tensorflow构建模型,并使用Matplotlib可视化整个过程。直接从 keras.datasets 加载数据集。

CIFAR数据集几乎是干净的。无需额外时间处理数据。您只需为模型创建所需的图层。使用 SGD 作为优化程序。

让我们用数据训练模型并计算精度。然后,您可以编写一个GUI来总结整个深度学习项目,并在任意图像而不是数据集上进行测试。

10.深度学习项目:年龄检测

年龄检测是一个重要的中级深度学习项目。计算机视觉是研究计算机如何以人类感知的方式查看和识别照片和视频。首先,缺乏对生物学观点的理解是最大的困难。

然而,有了足够的数据,这种缺乏生物视觉理解的现象就可以消除。这个深度学习项目也是如此。基于这些数据,将构建和训练一个模型。这样你就可以确定人们的年龄。

image.png

在这个深度学习项目中,我们需要使用DL从一张人脸照片中可靠地识别年龄。

由于化妆品,照明,障碍物和面部表情等因素,很难从数码照片中确定确切的年龄。因此,我们将此任务设置为分类任务,而不是回归任务。

在本例中,我们使用 Adience 数据集。它有超过25,000张图像,每张图像都正确标记。总空间几乎为 1 GB。

让我们使CNN层具有3个卷积层,总共512个连接层。我们使用数据集训练此模型。

让我们编写必要的Python代码来检测人脸,并在人脸周围绘制一个方形框。按照步骤在框上方标记年龄。

让我们创建一个 GUI,并使用具有人脸的随机图片对其进行测试。

完成

Reference

TOP 10 DEEP LEARNING PROJECT/文boudy-technology