1. 首页
  2. 游戏开发
  3. 其他
  4. 大型语言模型领域垂直性能评估数据

大型语言模型领域垂直性能评估数据

上传者: 2023-11-30 19:50:45上传 CSV文件 63.75KB 热度 62次

在评估大型语言模型在特定领域的垂直性能时,我们需要依赖验证基础能力的数据集。自从ChatGPT发布以来,大量大型模型团队和产品纷纷涌现。作为开发者,我们经常需要进行性能测试,常见的方法是通过一些提示语,将它们的输出与ChatGPT的标志性结果进行横向对比。通过实际实践,我们整理了以下用于验证大型语言模型基础能力的数据集。

下载地址
用户评论