gpt 2 output dataset:GPT 2输出的数据集用于研究检测偏差等源码

Name: gpt 2 output dataset:GPT 2输出的数据集用于研究检测偏差等 源码
Rating: 4.5 (70 reviews)
Author: verge4545

上传者：verge4545 2021-04-24 17:15:29上传 ZIP文件 263.95KB 热度 70次

gpt-2-输出数据集该数据集包含: WebText测试集中的250K文档对于每个GPT-2模型(在WebText训练集上进行训练),使用Top-K 40截断生成250K随机样本(温度1,无截断)和250K样本我们期待使用此数据进行的研究! 下载对于每个模型,我们都有250K个生成示例的训练拆分,以及5K个示例的验证和测试拆分。所有数据都位于Google Cloud Storage的gs://gpt-2/output-dataset/v1 。在那里,您将找到文件: webtext.${split}.jsonl small-117M.${split}.jsonl small-117M-k40.${split}.jsonl medium-345M.${split}.jsonl medium-345M-k40.${split}.jsonl large-762M.${

下载地址

用户评论

更多下载

下载地址

立即下载

用户评论

: 码姐姐匿名网友 2025-03-24 00:35:14

这个文件为研究人员提供了一扇窗口，让我们更深入地探究GPT-2的输出，并对其进行评估和改进。

: 码姐姐匿名网友 2025-03-23 20:32:28

这个文件收集了GPT-2输出的数据集，可以帮助我们更好地理解其中的偏差和问题。

: 码姐姐匿名网友 2025-03-24 03:30:58

这个文件对于研究者来说是一个很有价值的资源，可以用来分析GPT-2输出的潜在问题和优点。

: 码姐姐匿名网友 2025-03-23 16:12:27

这个数据集提供了关于GPT-2输出的宝贵资源，有助于进行深入研究和检测工作。

gpt2output dataset GPT2输出的数据集用于研究检测偏差等源码

gpt-2-输出数据集该数据集包含: WebText测试集中的250K文档对于每个GPT-2模型...

大小：264KB | 2021-04-24 17:15:29
gpt2gpt2源码

状态:存档(代码按原样提供,预计不会更新) gpt-2 论文代码和模型。您可以在我们的, 和阅读有...

大小：26KB | 2021-04-04 13:00:32
GPT2OpenAI GPT2的PyTorch实施源码

GPT-2 PyTorch实施目录介绍该项目是OpenAI GPT-2模型的PyTorch实现...

大小：153KB | 2021-04-07 11:19:27
Apple2orange Dataset数据集

Apple2Orange数据集包含1261个Apple的照片和1267个Oranges的照片。这两个...

大小：74.59MB | 2021-04-19 04:18:31
csv格式的数据集《GPT模型》资源下载

本文提供了一个csv格式的数据集《GPT模型》，该数据集适用于研究和应用GPT模型。通过下载该数据集...

大小：989.67KB | 2023-07-05 02:23:56
gpt2app用于使用GPT2生成文本的Flask Web应用源码

Flask Web应用程序,用于使用生成文本 GPT-2是一种非常庞大的语言模型,被认为过于危险而无...

大小：847KB | 2021-02-17 00:07:03
Python OpenAI对GPT2WebText数据集的开放式克隆

OpenAI对GPT-2 WebText数据集的开放式克隆

大小：14KB | 2020-08-07 01:29:18
Dataset Java用于作业的Java数据集源码

Dataset-Java:用于作业的Java数据集

大小：498KB | 2021-04-07 14:00:34
gpt2clientwriting_hand_light_skin_tone gpt2client易于使用的TensorFlow包装器适用于GPT2

gpt2-client 适用于GPT-2 117M,345M,774M和1.5B变压器型号的易于使用...

大小：185KB | 2021-02-17 00:07:06
银行搜索数据集bankresearch dataset_2

数据介绍：Apre-classifieddatasetcontaining11,000webpage...

大小：0B | 2020-05-18 11:15:56
人脸检测数据集_faces_dataset

kaggle2017年人脸检测数据集，共31024张灰度图，包括训练集（2430张人脸图，4549张...

大小：0B | 2019-05-05 14:03:20
皮肤检测数据集_Face_Dataset

已标注的基于像素的皮肤检测数据集，图片收集自网络名人图，包括32张单人原图和46张多人原图，以及各自...

大小：0B | 2019-04-18 01:37:07
TextGeneration GPT2bert2bert源码

自述文件基于pytorch / transformers和pytorch_lightning 火车...

大小：22KB | 2021-04-08 18:43:21
yolo人员检测数据集2

自己用来检测人物识别的一个视频，也是从网上找了好久才找到，感觉现在国内的资源不太多，清晰度一般，时间...

大小：674KB | 2020-07-23 17:34:25
gpt2_summ_rl基于gpt2的增强模型训练的总结模型源码

gpt2_summ_rl:基于gpt-2的增强模型训练的总结模型

大小：13.2MB | 2021-04-24 17:15:38
GPT2chitchat中文chitchat的GPT2中文闲聊的GPT2模型实现了DialoGPT的MMI思想源码

GPT2,用于中文聊天更新2020.01.09 添加50w闲聊语料与预训练模型的GoogleDri...

大小：73KB | 2021-02-06 15:38:02

gpt 2 output dataset:GPT 2输出的数据集用于研究检测偏差等 源码

gpt 2 output dataset:GPT 2输出的数据集用于研究检测偏差等源码