1.问题描述
在李沐的《动手学深度学习V2》15.4 「自然语言推断与数据集」一节中,第一个 代码 Cell 就报错:
# 加载一个数据集
d2l.DATA_HUB['SNLI'] = (
'https://nlp.stanford.edu/projects/snli/snli_1.0.zip',
'9fcde07509c7e87ec61c640c1b2753d9041758e4')
# download_extract() 下载文件、解压并返回解压文件夹路径。
data_dir = d2l.download_extract('SNLI')
2.问题原因
是SNLI数据集的压缩文件snli_1.0.zip里面有两个路径为snli_1.0\Icon\r和__MACOSX/snli_1.0/._Icon\r的文件,导致无法解析此路径进而导致整个文件无法解压。
3.解决方案
- 手动把数据集
snli_1.0.zip解压到当前文件夹
即 \data\ 下
- 然后把
data_dir赋值为数据集解压后的路径
把
data_dir = d2l.download_extract('SNLI')改为data_dir = " ..\data\snli_1.0",其它用到了的方法也要记得改