8 月 22 日晚 20:00，如何使用 NVIDIA TAO Toolkit 5.0 进行 OCR 模型的快速训练与优化

光学字符识别（OCR）技术是一种将纸质文档、PDF文件或图像中的文本转换成机器可识别格式的技术。它在许多领域都有广泛的应用，工业应用，比如产品外包装的文本检测、二维码自动识别；商业应用，如自动化数据输入、图片搜索、智能客服；个人应用，如文档扫描、名片识别，或者在工作中将图片的文字识别并提取到文本中。然而，尽管 OCR 技术的应用广泛，但构建和优化 OCR 的 AI 模型并非易事。它需要深厚的计算机科学知识，精细的编程技巧，以及对 AI 模型优化的深入理解。

NVIDIA TAO 是一款强大的 AI 模型训练和优化工具，它旨在帮助开发者快速搭建和训练 AI 模型，无需复杂的编程和算法调整。它提供了一套完整的工具和 API，以及预训练的模型和模型脚本，大大减少了手动编写和微调模型的工作量。开发者可以使用预训练模型作为基础，并根据自己的需求进行修改和优化，无需从头开始构建模型。利用 NVIDIA TAO, 您还可以自动进行模型剪枝、量化和量化感知训练，以减小模型的体积和计算量，同时保持较高的准确率。NVIDIA 近期发布了 TAO Toolkit 5.0，带来了 AI 模型开发方面的突破性功能提升。

本次在线研讨会推荐有视觉 AI 开发需求的从业者参加，将探讨如何使用 NVIDIA TAO Toolkit 5.0 进行 OCR 模型的快速训练与优化。

您将可以了解到：

光学字符识别（OCR）技术：了解 OCR 的基本原理、功能以及在各种业务场景中的实际应用；
NVIDIA TAO Toolkit 5.0 的最新特性和功能；
如何利用 NVIDIA TAO 训练一个 OCR 模型, 并对模型进行剪枝和优化；
代码示例：OCR 模型训练脚本和训练数据集。

活动时间

2023/08/22 星期二 20:00 - 21:30

本期技术专家

何琨.jpg

何琨，NVIDIA企业开发者社区高级经理

拥有多年的 GPU 和人工智能开发经验。自 2017 年加入 NVIDIA 开发者社区以来，完成过上百场培训，帮助上万个开发者了解人工智能和 GPU 编程开发。在计算机视觉，高性能计算领域完成过多个独立项目。并且，在机器人和无人机领域，有过丰富的研发经验。对于图像识别，目标的检测与跟踪完成过多种解决方案。

微信扫码，立即报名

0822 Webinar报名页.png

微信扫码小助手，备注0822加入直播交流群

小助手NVChina02.jpg