Easy Dataset
Github
简体中文
简体中文
  • 产品简介
  • 安装和使用
  • 基础功能
    • 项目
      • 任务配置
      • 模型配置
      • 模型测试
    • 文献
      • 文献处理
      • 领域标签
  • 问题
    • 问题生成
    • 问题管理
  • 数据集
    • 数据集生成
    • 数据集管理
    • 数据集导出
    • 数据集广场
  • 评估
    • 微调效果评估
  • 进阶使用
    • 文本分块策略
    • 自定义提示词
    • 蒸馏数据集
  • 博客
    • 更新日志
    • 社区教程
  • 知识科普
  • 更多
    • 常见问题
    • 隐私协议
    • 联系我们
Powered by GitBook
On this page
  • 单个文本块生成问题
  • 批量生成问题
  • 问题生成配置

Was this helpful?

Edit on GitHub
Export as PDF
  1. 问题

问题生成

Previous问题Next问题管理

Last updated 6 days ago

Was this helpful?

Copyright © 2025 Easy Dataset

从分割好的文本块中提取问题,并为问题建立领域标签。

单个文本块生成问题

任务完成后,可在文本块中查看已经生成好的问题。

可对已生成问题的文本块、未生成问题的文本块进行筛选:

批量生成问题

可批量、全选文本块,并批量构造问题:

可以实时查看批量任务的进度:

当批量任务进行中,关闭、刷新当前页面都会中断任务,可以开一个新页面到问题管理查看已经生成的问题。

问题生成配置

每个文本块生成多少问题,是由 「项目设置 - 任务设置」 里的生成问题的最大长度决定的,默认设置是每 240 个字符生成一个问题,大家 2000 字符左右的文本块生成了 8 个问题,大家可以根据自己文献的信息密度来灵活调整:

还可以控制生成的问题中消除 ?的比例(默认将消除 60%)。

在实际问答任务中,用户的问题并不总是会携带 ?消除一定比低的 ? 有助于提升微调效果

可以控制批量任务中的最大并发数量,(默认最大并发 5 个任务)。

注意,部分模型提供商会对最大并发数量进行限制,调整过大的值可能导致批量任务失败,建议灵活测试调整。