TensorFlow 简介：机器学习技术使用入门丨 Google 开发者大会 20182018 年 9 月 20 日

Google 开发者大会 (Google Developer Days，简称 GDD) 是展示 Google 最新开发者产品和平台的全球盛会，旨在帮助你快速开发优质应用，发展和留住活跃用户群，充分利用各种工具获得更多收益。2018 Google 开发者大会于 9 月 20 日和 21 日于上海举办。👉Google 开发者大会 2018 掘金专题

2018 年 9 月 20 日 Laurence Moroney（Google 开发者技术推广工程师）与付弋真（Google Brain 的软件工程师）带来一场《TensorFlow 简介：机器学习技术使用入门》的演讲，本文将对演讲做一个回顾。

机器学习与传统编程

TensorFlow 是一个采用数据流图（data flow graphs），用于数值计算的开源软件库。节点（Nodes）在图中表示数学操作，图中的线（edges）则表示在节点间相互联系的多维数据数组，即张量（tensor）。它灵活的架构让你可以在多种平台上展开计算，例如台式计算机中的一个或多个CPU（或GPU），服务器，移动设备等等。TensorFlow 最初由Google大脑小组（隶属于Google机器智能研究机构）的研究员和工程师们开发出来，用于机器学习和深度神经网络方面的研究，但这个系统的通用性使其也可广泛用于其他计算领域。

Laurence Moroney讲述了他所经历的变革：

网页的变革从程序员的角度上来说，网页改变了人们所有的一切。通过网页，程序员们可以写出让上亿的用户接触到的程序。这场变革带了新的商业模式，比如谷歌、百度、淘宝等等。
智能手机也带来了一场变革，同样也带来了像滴滴和 Uber 这样的商业体验。
我们正在面临下个变革，也就是机器学习的变革。

如上图所示，Laurence Moroney认为人工智能正处在技术萌芽触发期与期望膨胀顶峰期之间。

运动检测APP场景

在借助手机速度传感器的帮助下，我们可以获取当前用户的速度，然后再使用代码进行判断。

speed < 4 定义为步行，
4 <= speed < 12 定义为跑，
speed > 12 定义为骑车。

一些简单的运动场景可以通过上述类型的方式进行检测，倘若像用户在打高尔夫这种复杂的运动场景是无法被检测出来，而机器学习可以帮我们解决在这个问题。

传统编程方式是设定规则和数据，从而给出答案。通过Java、Python、C++等语言来编写规则，在输入一些数据之后打包编译成程序，给出答案，简单运动检测APP就是这样实现的。

机器学习需要程序员提供答案和数据，给答案打上标签，在数据的配合之下，机器会自己研究出规则。

在机器学习的环境下，程序员们需要提供上述所示数据和标签，机器自己会找出数据之间的关联，从而得到规则，而不再需要程序员自己去定义复杂的规则。这样会变得更加智能化，在能检测简单的运动状态的同时，也能够检测出向打高尔夫这样难以用规则去判断的复杂的运动状态。

在学习新的事物时，我们的大脑往往是先得到答案和数据，从而总结出经验规律，这也是机器学习所想要实现的。在玩井字棋（如下图所示），一开始我们只是了解这个游戏的规则和玩法，但是如何赢得比赛就需要数盘的游戏经历，从中总结出经验。

机器学习就是在模仿人类，通过大量的数据和标签，得到规则，从而解决问题。让机器像人一样学习，这是机器学习所要走的第一步。

在机器学习的程序设计中，第一个阶段为训练阶段，程序员需要提供数据和答案（标签），从而得到模型。第二个是推理阶段，给模型提供数据，它会做出相应的预测。

代码实践( 付弋真主讲 )

数字之间关系

下面有两列数字，X 和 Y 之间存在关系。将数字提供给机器，希望机器像人脑一样学习，从而给出数字之间的关系。

有一定数学基础的同学，应该很快能够给出 X 和 Y 之间的关系为：2x - 1 = y。我们在看到这些数字之后，大脑会尝试去找出一些规律，利用我们所拥有的数学经验，进行猜测，猜测的验证结果是正确，所以得到了这个方程式。那通过机器学习如何做到这一点呢？

from tensorflow import keras
import numpy as np

model = keras.Sequential([keras.layers.Dense(units = 1, input_shape = [1])])
model.compile(optimizer = 'sgd', loss = 'mean_squared_error')

xs = np.array([-1.0, 0.0, 1.0, 2.0, 3.0, 4.0], dtype = float)
ys = np.array([-3.0, -1.0, 1.0, 3.0, 5.0, 7.0], dtype = float)

model.fit(xs, ys, epochs = 500)

print(model.predict([10.0]))

结果如下：

通过机器学习我们得到值为18.976957，而并不是 19，因为神经网络存在很多种可能性，机器给出的是一个预测的结果而不是一个准确无误的结果。

识别不同的衣服

上图中有8中不同的衣服，作为人类我们可以分辨每个衣服的种类。那机器能否做到这一点呢？

Fashion-MNIST是一个替代MNIST手写数字集的图像数据集。它是由Zalando（一家德国的时尚科技公司）旗下的研究部门提供。其涵盖了来自10种类别的共7万个不同商品的正面图片。Fashion-MNIST的大小、格式和训练集/测试集划分与原始的MNIST完全一致。60000/10000的训练测试数据划分，28x28的灰度图片。

通过 Fashion-MNIST 数据集，可以对我们的模型进行训练，不断地优化，从而提高识别准确率。

import tensorflow as tf
from tensorflow import keras
import numpy as np

# Import the Data
fashion_mnist = keras.datasets.fashion_mnist
(train_images, train_labels), (test_images, teat_labels) = fashion_mnist.load_data()

# Normalize the data 
train_images = train_images / 255.0
test_images = test_images / 255.0

#Define the model
model = keras.Sequential([
    keras.layers.Flatten(inport_shape = (28,28)),
    keras.layers.Dense(128, activation = tf.nn.relu),
    keras.layers.Dense(10, activation = tf.nn.softmax),
])

model.compile(oprimizer = tf.train.AdadeltaOptimizer(),loss = 'sparse_categorical_crossentropy',metrics=['accuracy'])

#Train the model
model.fit(train_images, train_labels, epochs = 5, verbose = 2)

predictions = model.predict(test_images)

print(test_images[4560])
print(np.argmax(predictions[4560]))

运行结果如下：

在设置5次迭代的前提下，本模型的成功率为 71% 。神经网络可以通过更多的训练，从而提高准确率。

以上就是本次演讲的全部内容，希望对大家有所帮助。阅读更多 Google 开发者大会 2018 技术干货

TensorFlow 简介：机器学习技术使用入门 丨 Google 开发者大会 2018

机器学习与传统编程

运动检测APP场景

代码实践( 付弋真主讲 )

数字之间关系

识别不同的衣服

TensorFlow 简介：机器学习技术使用入门丨 Google 开发者大会 2018