Easy Dataset
Github
简体中文
简体中文
  • 产品简介
  • 安装和使用
  • 基础功能
    • 项目
      • 任务配置
      • 模型配置
      • 模型测试
    • 文献
      • 文献处理
      • 领域标签
  • 问题
    • 问题生成
    • 问题管理
  • 数据集
    • 数据集生成
    • 数据集管理
    • 数据集导出
    • 数据集广场
  • 评估
    • 微调效果评估
  • 进阶使用
    • 文本分块策略
    • 自定义提示词
    • 蒸馏数据集
  • 博客
    • 更新日志
    • 社区教程
  • 知识科普
  • 更多
    • 常见问题
    • 隐私协议
    • 联系我们
Powered by GitBook

Copyright © 2025 Easy Dataset

On this page
  • Q:升级至 1.3.x 版本后历史数据丢失
  • Q:如何生成英文的数据集?
  • Q:模型配置里未找到想要的模型提供商和模型?
  • Q:模型测试没问题,但是生成问题、数据集时报错
  • Q:批量任务处理速度太慢
  • Q:批量任务突然中断,在某个节点开始快速完成
  • Q:问题、数据集未按照期望风格输出

Was this helpful?

Edit on GitHub
Export as PDF
  1. 更多

常见问题

Previous知识科普Next隐私协议

Last updated 5 days ago

Was this helpful?

Q:升级至 1.3.x 版本后历史数据丢失

同时打开历史数据目录(Open Data Directory(History))、当前数据目录(Open Data Directory)

将历史数据目录下的所有文件夹移动至当前数据目录:

重启客户端,将弹出数据迁移弹框,点击开始迁移

迁移成功后,可在新版本使用历史数据。


Q:如何生成英文的数据集?

系统会根据当前用户选择的语言决定最终生成数据集的语言,目前支持中、英两种语言。当前默认语言环境为中文,如果需要生成英文数据集,需要手动切换至英文。


Q:模型配置里未找到想要的模型提供商和模型?

目前支持 OpenAI 标准协议 的模型接入,兼容 Ollama,系统只是内置了一些常见的模型配置,如果未找到可以自定义模型提供商、 模型名称、API地址、密钥 。


Q:模型测试没问题,但是生成问题、数据集时报错

系统在很多情况下会要求模型按照规定 JSON 格式输出,如果模型本身的理解能力、上下文长度不足,则输出可能不稳定,建议更换参数量较大、上下文长度较大的模型。


Q:批量任务处理速度太慢

任务的处理速度大部分情况下取决于选择的模型本身的处理速度,如果是本地模型,请检查资源利用率;如果是远程模型,建议更换更快更稳定的平台。


Q:批量任务突然中断,在某个节点开始快速完成

很有可能触发了模型的限流策略、常见于未充值的硅基流动、免费的 OpenRouter 模型,可以手动将任务配置里的并发处理数量调小,目前默认是 5 。


Q:问题、数据集未按照期望风格输出

可以在项目配置 - 提示词配置增加自定义提示词进行主动干预。