专为高效文档转换设计,Granite-Docling-258M 小体量干大事成为文档处理「小助手」

79 阅读1分钟

Granite-Docling-258M 是由 IBM 于 2025 年 9 月推出的轻量级视觉语言模型,专为高效文档转换设计。模型能将文档转换为机器可读格式,同时完整保留布局、表格、公式等元素。模型仅含 258M 参数,性能卓越,成本效益高,支持多语言(包括阿拉伯语、中文和日语)处理。模型使用 DocTags 格式精准描述文档结构,避免信息丢失。Granite-Docling-258M 能与 Docling 库无缝集成,提供强大的定制化和错误处理能力,适用企业级文档处理,是文档处理领域的强大工具。

教程链接:go.openbayes.com/8a6FN

使用云平台:OpenBayes
openbayes.com/console/sig…

登录 OpenBayes.com,在「公共教程」页面,选择一键部署 「Granite-docling-258M:轻量多模态文档处理模型」教程。

image.png

页面跳转后,点击右上角「克隆」,将该教程克隆至自己的容器中。

image.png

在当前页面中看到的算力资源均可以在平台一键选择使用。平台会默认选配好原教程所使用的算力资源、镜像版本,不需要再进行手动选择。点击「继续执行」,等待分配资源。

image.png

image.png

待系统分配好资源,当状态变为「运行中」后,点击「API 地址」边上的跳转箭头,即可跳转至 Demo 页面。

image.png

进入模型后,首先点击「Upload Image」上传一张图片,然后对图片提出问题,模型就会做出对应的回答。

image.png