Easy Dataset
Github
简体中文
简体中文
  • 产品简介
  • 安装和使用
  • 基础功能
    • 项目
      • 任务配置
      • 模型配置
      • 模型测试
    • 文献
      • 文献处理
      • 领域标签
  • 问题
    • 问题生成
    • 问题管理
  • 数据集
    • 数据集生成
    • 数据集管理
    • 数据集导出
    • 数据集广场
  • 评估
    • 微调效果评估
  • 进阶使用
    • 文本分块策略
    • 自定义提示词
    • 蒸馏数据集
  • 博客
    • 更新日志
    • 社区教程
  • 知识科普
  • 更多
    • 常见问题
    • 隐私协议
    • 联系我们
Powered by GitBook

Copyright © 2025 Easy Dataset

On this page
  • 生成单个数据集
  • 批量生成数据集
  • 数据集生成配置

Was this helpful?

Edit on GitHub
Export as PDF
  1. 数据集

数据集生成

Previous数据集Next数据集管理

Last updated 6 days ago

Was this helpful?

生成单个数据集

点击单个问题上的魔法棒🪄图标,为单个问题生成答案(构造数据集):

问题生成答案后,将在右侧展示已经生成答案的数量(单个问题可以生成多个答案):

Easy DataSet 会根据问题 + 问题对应的文本块 + 领域标签来一起生成答案,来保障答案和文献本身的相关性。

当右上角选择的是推理模型时,将保留模型推理过程中的思维链(COT):

可以筛选已生成答案、未生成答案的问题:

批量生成数据集

可以多选、全选问题,批量生产答案:

可以查看批量任务的进度:

当批量任务进行中,关闭、刷新当前页面都会中断任务,可以开一个新页面到数据集管理查看已经生成的答案。

数据集生成配置

在任务设置 - 问题生成设置中的并发任务数量,依然可以控制批量生成数据集的最大并发数量:

最大并发数量越大,数据集生成任务越快,反之越慢,注意模型提供商最大并发限制。