用顶点AI在谷歌云中托管TensorFlow Hub模型训练ML模型过程中最耗时和最麻烦的部分之一是收集和策划数据来训练

聪明的软件开发者会使用别人的机器学习模型。

如果你以前训练过ML模型，你就会知道这个过程中最耗时和最麻烦的部分之一是收集和策划数据来训练这些模型。但是对于很多问题，你可以跳过这一步，而是使用别人的模型，这些模型已经被训练成你想要的样子--比如检测垃圾邮件，将语音转换为文本，或者标记图像中的物体。如果这个模型是由那些能够接触到大数据集、强大的训练设备和机器学习专业知识的人建立和维护的，那就更好了。

找到这些类型的 "预训练 "模型的一个好地方是TensorFlow Hub，它承载了大量由谷歌研究院建立的最先进的模型，你可以免费下载和使用。在这里，你可以找到用于执行图像分割、超级分辨率、问题回答、文本嵌入等任务的模型。不需要训练数据集。但是，如果你想在你的应用程序中使用这些大型模型，那么问题就变成了在哪里托管它们，可以快速、可靠和可扩展。

谷歌的新顶点人工智能平台正好可以解决这一问题。可以从TensorFlow Hub下载一个模型，并将其上传到Vertex的预测服务，它将在云中托管这一模型，并通过REST端点进行预测。这是一种无服务器的方式来服务机器学习模型。这不仅使应用程序的开发更容易，还可以利用GPU等硬件和Vertex内置的模型监控功能。

从TensorFlow中心下载一个模型

Download a model

在tfhub.dev/，你会发现很多处理音频、文本、视频和图像的免费模型。抓取最受欢迎的Hub模型之一，通用句子编码器。这个模型将一个句子或段落作为输入，并返回一个矢量或 "嵌入"，将文本映射到空间中的点。然后，这些嵌入可用于从句子相似性到智能搜索到构建聊天机器人的所有方面（阅读更多相关信息）。

Model Formats

在Universal Sentence Encoder页面，点击 "下载"，以TensorFlow的SavedModel格式抓取模型。你会下载一个压缩文件，其中包含一个目录，格式是这样的。

-universal-sentence-encoder_4

      -assets    
      
      -saved_model.pb

      -variables

              - variables.data-00000-of-00001

              - variables.index

在这里，saved_model.pb 文件描述了保存的神经网络的结构，而variables 文件夹中的数据包含了网络的学习权重。

在模型的中心页面，你可以看到它的使用实例。

Universal Sentence

给模型输入一个句子数组，它就吐出一个向量数组。

还可以通过使用TensorFlow的SavedModel CLI来了解该模型支持哪些输入和输出。如果安装了TensorFlow，在你下载的Hub模型的目录下，运行。

saved_model_cli show --dir . --tag_set serve --signature_def serving_default

对于这个模型，该命令输出。

The given SavedModel SignatureDef contains the following input(s):
  inputs['inputs'] tensor_info:
      dtype: DT_STRING
      shape: (-1)
      name: serving_default_inputs:0
The given SavedModel SignatureDef contains the following output(s):
  outputs['outputs'] tensor_info:
      dtype: DT_FLOAT
      shape: (-1, 512)
      name: StatefulPartitionedCall_1:0
Method name is: tensorflow/serving/predict