imdb_dataset.zip 上传者:wxlcs_dn 2021-04-21 12:27:48上传 ZIP文件 57.48MB 热度 48次 该数据集为imdb的文本二分类数据集,从keras下载之后,将句子都还原为了英文单词,并将训练集和测试集都保存为了pickle格式,命名为imdb_train_rawtext.pkl和imdb_test_rawtext.pkl; 原始的keras上下载的数据集每个词都直接用序号表示,不适合使用BERT等预训练模型来处理,因此发布了该版本; 压缩包中同样包括了原始的imdb数据集,便于网速不好的同学直接下载使用; 下载地址 用户评论 更多下载 下载地址 立即下载 用户评论 发表评论