全民AI计划:我在掘金社区的AI版图(图像领域篇)

1,869 阅读8分钟

大家好,我是掘金@TF男孩

在座的各位,有认识的,有不认识的,我是一个在掘金社区成长起来的人工智能开发工程师

下面我就来盘点一下,我在掘金社区的人工智能版图。

我希望下面的内容,能对大家有所帮助。我所期望的一个理想目标就是全民AI

开发者做好AI;

普通人用好AI;

在校生学好AI;

以下文章全部为我个人原创并首发于掘金社区,实战项目皆包含源码和详解。

一、科普篇

1.1 文章《十五分钟简介人工智能,以听懂为目的》

文章链接:十五分钟简介人工智能,以听懂为目的 - 掘金

内容简介

我从事人工智能相关的工作,有时候亲朋好友就问我,你那个人工智能到底是什么玩意?我一般不做解释,因为很难说清楚。后来,我碰到一个做演讲的朋友,他了解了我的困惑之后,他给我布置了一个任务:用十五分钟讲完,不用说很多,但是要求必须能听懂。

指标

指标数据
文字数量3300
配图数量10
阅读数量1.1w阅读、100点赞、100收藏
作用行业科普、浅层面忽悠和防忽悠

文章目录

  • 一、什么是人工智能?
  • 二、人工智能的应用
    • 2.1 图像领域
    • 2.2 自然语言领域
    • 2.3 更多领域
  • 三、人工智能的发展阶段
    • 3.1 弱人工智能
    • 3.2 强人工智能
    • 3.3 超人工智能
  • 四、我对人工智能的见解
    • 4.1 人工智能的机会
    • 4.2 人工智能的门槛
    • 4.3 人工智能的瓶颈

作者推荐

此文通俗地讲解了什么是人工智能,以及它能做什么。

本文被很多科技自媒体转载。也被很多高校、教研机构,用来给学生进行学科专业的科普工作。

有兴趣的可以点击阅读:十五分钟简介人工智能,以听懂为目的 - 掘金 (juejin.cn)

二、图像领域的人工智能

2.1 文章《自动批改口算题》

文章链接:

  1. CNN基础识别-想为女儿批作业(1):制作数据集 - 掘金
  2. CNN基础识别-想为女儿批作业(2):训练数字识别 - 掘金
  3. CNN基础识别-想为女儿批作业(3):整合结果 - 掘金

GIF20210903210108.gif

内容简介

本文讲解了从数据集制作到训练,再整合到项目中完整流程。本文完全可以写一套小册课程。事实也如此,这套方案已经被普及到各个平台,成为比较火爆的实操文。但是,此类型在掘金不火(一个项目分开几次写了)。

这个码龄为1年的小伙,转载这篇之后,实现了博客的突破。

2023-03-21_160726.png

其他在知乎、百度文库等,也是非常火爆。

指标

指标数据
文字数量8600
配图数量38
阅读数量9.5k阅读、60点赞、50收藏
作用OCR入门实战精品课程

文章目录

  • 一、数据集
    • 基本思路
    • 1.1 准备数据
      • 1.1.1 准备字体
      • 1.1.2 生成图片
  • 二、训练和预测
    • 2.1 训练数据
      • 2.1.1 构建模型
      • 2.1.2 卷积层 Conv2D
      • 2.1.3 池化层 MaxPooling2D
      • 2.1.4 全连接层 Dense
      • 2.1.5 训练数据
    • 2.2 预测数据
  • 三、项目集成
    • 3.1 切割图像
      • 3.1.1 投影大法
      • 3.1.2 根据投影找区域
      • 3.1.3 根据区域切图片
      • 3.1.4 循环可去油腻
    • 3.2 识别
    • 3.3 计算并反馈
      • 3.3.1 计算
      • 3.3.2 反馈

2.2 文章《智能照片一键归类器》

文章链接: 人工智能图像实战课:夏天照片归类器 - 掘金 (juejin.cn)

移动图片.gif

内容简介

空调、烧烤、海滩、蝉、赛龙舟、电风扇、雪糕、泳衣、西瓜、粽子……这个夏天你拍了多少类照片,让人工智能帮你分一分类。通过先对图片进行人工标记,训练数据,然后让它自动分类,实现图片的分类管理,一键整理到对应的文件夹中。

为了便于人工对数据进行标记,我还写了一个小工具,同样完全开源。

图片标注.gif

指标

指标比较惨,这是一篇浏览数没有字数多的文章。

指标数据
文字数量2800
配图数量8
阅读数量2.5k阅读、15点赞
作用图片分类实战入门

文章目录

  • 前言
  • 一、发现问题
  • 二、分析问题
  • 三、解决问题
    • 3.1 整理训练样本
    • 3.2 训练数据
    • 3.3 使用数据
  • 四、总结问题

2.3 文章《图像风格化:当兔子遇到年画》

文章链接: 兔年了,利用AI风格化实现剪纸兔、年画兔、烟花兔 - 掘金 (juejin.cn)

内容简介

本地手动搭建TensorFlow Hub实现图形风格化。让小兔子和年画、剪纸、烟花融合成新的图片。开源项目,操作简单,不管你是前端还是后端,都能上手实践。

指标

指标数据
文字数量5260
配图数量23
阅读数量3.5k阅读、42点赞
作用自我实践,搭建对外服务

文章目录

  • 一、图像风格化简介
  • 二、技术实现讲解
    • 2.1 TensorFlow Hub库
    • 2.2 加载image-stylization模型
    • 2.3 输入图片转为tensor格式
    • 2.4 tensor格式结果转为图片
  • 三、一切皆可兔图的效果
    • 3.1 年画兔
    • 3.2 剪纸兔
    • 3.3 烟花兔
  • 四、无限遐想

2.4 文章《AIGC原理,动漫头像生成》

文章链接: ChatGPT火了,我连夜详解AIGC原理,并实战生成动漫头像 - 掘金 (juejin.cn)

内容简介

AIGC可能会是人工智能的下一个时代。尽管很多人还不知道AIGC是什么。本文详解AIGC的原理,并且实战一个人工智能生成动漫头像的项目实例。

指标

指标数据
文字数量5123
配图数量15
阅读数量5.2k阅读、83点赞
作用AIGC入门

文章目录

  • 一、AIGC:人工智能的新时代
  • 二、AIGC实战:智能生成动漫头像
    • 2.1 自动生成的意义
    • 2.2 自动生成的原理
    • 2.3 数据准备
    • 2.4 生成器
    • 2.5 鉴别器
    • 2.6 训练数据
    • 2.7 自动生成
  • 三、我们对AIGC该有的态度

2.5 关于图形图像的其他知识

专栏

专栏链接:AI实战课:CV图像识别 - TF男孩的专栏 - 掘金 (juejin.cn)

123.png

基础知识

什么叫膨胀?哪个叫腐蚀?二值化、边缘检测、透视变换……传统的图形图像处理基础操作与应用,在此展现无疑。

文章链接:opencv基础:文档倾斜矫正 - 掘金 (juejin.cn) img3.gif

文章链接:opencv基础:文档透视(扭曲)矫正 - 掘金 (juejin.cn)

1633524057570.gif

工具

搞图像领域,标注是个问题,有时候缺少数据素材,有时候缺少数据集。自己写一些小工具也是一门必修课。

文章链接:公交快到站了,我赶紧写了个图像样本采集器 - 掘金 (juejin.cn)

小团队搞算法,需要多面手,等同当个厨子要从买菜到炒菜,一直到端给顾客,还要劝顾客多吃,以便好收拾盘子。因此,在上班前,我手写了一个图像裁剪工具。

演示2.gif

文章链接:代码生成OCR训练集,老板:没有数据?你new一个 - 掘金 (juejin.cn)

老板陷入了沉思,突然眼镜一闪:哎,你让程序员new一个出来,你们连老婆都能new出来。我连忙解释:那是对象。

2022-07-16_001029.png

行业运用

图形图像在行业中究竟怎样?

很多企业领导,看到人工智能很恐惧。哎呀,我们公司的员工,连正常的业务逻辑都写不好,交付个系统一堆Bug。现在需要人工智能,怎么办?买一个吧。不买难道自己做吗?这个情况,还真得具体分析。

文章链接:一文讲通OCR文字识别原理与技术全流程 - 掘金 (juejin.cn)

本文的作者在教育行业搞OCR识别工作,教育领域的OCR比较复杂,除了文字外,还有图片、表格、公式等等。即便同样是公式,在数学里要斜体,在化学里要正体,这都是行业规范。本文综合讲解企业实际应用的案例。

  • 一、好话说在前头,谁适合读本文?
    • 1.1 公司领导:节省成本,沉淀技术
    • 1.2 产品经理:了解过程,融会贯通
    • 1.3 初级小白:解疑答惑,入门行业
  • 二、OCR识别的全流程(科普版)
    • 2.1 预处理图片
      • 2.1.1 光影的预处理
      • 2.1.2 倾斜的预处理
      • 2.1.3 扭曲的预处理
    • 2.2 切割字符
      • 2.2.1 投影法实现分割
      • 2.2.2 切行
      • 2.2.3 切列
      • 2.2.4 切字
    • 2.3 识别字符
    • 2.4 文本后处理
      • 2.4.1 版面还原
      • 2.4.2 文本校正
  • 三、总结
    • 3.1 OCR的投入:自己开发 vs 调用第三方?
    • 3.2 OCR的重点在哪里?

得了,已经超过2500字了。再多了大家就不喜欢看了。其他领域的,以后再发布吧。

三、下集预告

除了深耕图像领域,我在其他领域我也有地,并且也写下了专栏。后期,我将逐步讲解下面的内容。

3.1 文本实战领域

AI实战课:NLP自然语言 - TF男孩的专栏 - 掘金 (juejin.cn)

456.png

3.2 音频实战领域

AI实战课:声音和音频 - TF男孩的专栏 - 掘金 (juejin.cn)

789.png

3.3 理论和知识点

AI知识点精讲细讲 - TF男孩的专栏 - 掘金 (juejin.cn)

999.png

大家好,我是掘金@TF男孩。别只看我的代码人生类文章,技术文我也有写。

本文正在参加 人工智能创作者扶持计划