Go-Excelize API源码阅读(三)——OpenReader()

460 阅读2分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第3天,点击查看活动详情

Go-Excelize API源码阅读(三)——OpenReader()

一、Go-Excelize简介

Excelize 是 Go 语言编写的用于操作 Office Excel 文档基础库,基于 ECMA-376,ISO/IEC 29500 国际标准。可以使用它来读取、写入由 Microsoft Excel™ 2007 及以上版本创建的电子表格文档。支持 XLAM / XLSM / XLSX / XLTM / XLTX 等多种文档格式,高度兼容带有样式、图片(表)、透视表、切片器等复杂组件的文档,并提供流式读写 API,用于处理包含大规模数据的工作簿。可应用于各类报表平台、云计算、边缘计算等系统。使用本类库要求使用的 Go 语言为 1.15 或更高版本。

二、OpenReader()

func OpenReader(r io.Reader, opt ...Options) (*File, error)OpenReader 的作用是从 io.Reader 读取数据流。

func OpenReader(r io.Reader, opt ...Options) (*File, error) {
	b, err := ioutil.ReadAll(r)
	if err != nil {
		return nil, err
	}
	f := newFile()
	f.options = parseOptions(opt...)
	if f.options.UnzipSizeLimit == 0 {
		f.options.UnzipSizeLimit = UnzipSizeLimit
		if f.options.UnzipXMLSizeLimit > f.options.UnzipSizeLimit {
			f.options.UnzipSizeLimit = f.options.UnzipXMLSizeLimit
		}
	}
	if f.options.UnzipXMLSizeLimit == 0 {
		f.options.UnzipXMLSizeLimit = StreamChunkSize
		if f.options.UnzipSizeLimit < f.options.UnzipXMLSizeLimit {
			f.options.UnzipXMLSizeLimit = f.options.UnzipSizeLimit
		}
	}
	if f.options.UnzipXMLSizeLimit > f.options.UnzipSizeLimit {
		return nil, ErrOptionsUnzipSizeLimit
	}
	if bytes.Contains(b, oleIdentifier) {
		if b, err = Decrypt(b, f.options); err != nil {
			return nil, ErrWorkbookFileFormat
		}
	}
	zr, err := zip.NewReader(bytes.NewReader(b), int64(len(b)))
	if err != nil {
		if len(f.options.Password) > 0 {
			return nil, ErrWorkbookPassword
		}
		return nil, err
	}
	file, sheetCount, err := f.ReadZipReader(zr)
	if err != nil {
		return nil, err
	}
	f.SheetCount = sheetCount
	for k, v := range file {
		f.Pkg.Store(k, v)
	}
	f.CalcChain = f.calcChainReader()
	f.sheetMap = f.getSheetMap()
	f.Styles = f.stylesReader()
	f.Theme = f.themeReader()
	return f, nil
}

ioutil.ReadAll(r)先从 io.Reader 读取整条数据流,newFile()创建一个 Excel 工作薄。

f.options.UnzipSizeLimit: UnzipSizeLimit指定了打开电子表格时的解压大小限制,以字节为单位,这个值应该大于或等于 UnzipXMLSizeLimit,默认的大小限制是16GB。

f.options.UnzipXMLSizeLimit:UnzipXMLSizeLimit指定解压工作表和共享字符串表的内存限制,单位为字节,当文件大小超过此值时,工作表的XML将被解压到系统的临时目录中,此值应小于或等于UnzipSizeLimit,默认值为 16MB。

UnzipSizeLimit = 1000 << 24 StreamChunkSize = 1 << 24

然后判断读取的数据流中是不是包含oleIdentifier = []byte{0xd0, 0xcf, 0x11, 0xe0, 0xa1, 0xb1, 0x1a, 0xe1}这是OLE 程序标识符,具体查看微软文档:docs.microsoft.com/zh-cn/offic…

zip.NewReader返回一个从bytes.NewReader(b)读取的新的阅读器,它被赋值为给定的字节大小int64(len(b))。

f.ReadZipReader(zr)中ReadZipReader通过给定的选项提取电子表格。给定的选项主要是密码等:

type Options struct {
	MaxCalcIterations uint
	Password          string
	RawCellValue      bool
	UnzipSizeLimit    int64
	UnzipXMLSizeLimit int64
}

后面和新建文件API差不多NewFile(),给 f 结构体的成员赋值。

三、结语 这里是老岳,这是Go语言相关源码的解读第三篇,我会不断努力,给大家带来更多类似的文章,恳请大家不吝赐教。