# 数据集生成

### 生成单个数据集

点击单个问题上的魔法棒🪄图标，为单个问题生成答案（构造数据集）：

<figure><img src="/files/XFw0UxljstAkqdN949QA" alt=""><figcaption></figcaption></figure>

问题生成答案后，将在右侧展示已经生成答案的数量（单个问题可以生成多个答案）：

<figure><img src="/files/CnZ0BT2PAtJAbpkcgfxa" alt=""><figcaption></figcaption></figure>

{% hint style="info" %}
Easy DataSet 会根据问题 + 问题对应的文本块 + 领域标签来一起生成答案，来保障答案和文献本身的相关性。
{% endhint %}

当右上角选择的是推理模型时，将保留模型推理过程中的思维链（COT）：

<figure><img src="/files/l7e453hijZIISKrCfRxG" alt=""><figcaption></figcaption></figure>

可以筛选已生成答案、未生成答案的问题：

<figure><img src="/files/q2XeroHlvcC50MbEmk6x" alt=""><figcaption></figcaption></figure>

### 批量生成数据集

可以多选、全选问题，批量生产答案：

<figure><img src="/files/bs34JIUvVkmf0g8cAqh0" alt=""><figcaption></figcaption></figure>

可以查看批量任务的进度：

<figure><img src="/files/Iq6asPjRHSAgC7zN1vWs" alt=""><figcaption></figcaption></figure>

{% hint style="info" %}
当批量任务进行中，关闭、刷新当前页面都会中断任务，可以开一个新页面到数据集管理查看已经生成的答案。
{% endhint %}

### 数据集生成配置

在任务设置 - 问题生成设置中的并发任务数量，依然可以控制批量生成数据集的最大并发数量：

<figure><img src="/files/PFgoZPq6HH0HxfGZ8fD8" alt=""><figcaption></figcaption></figure>

{% hint style="info" %}
最大并发数量越大，数据集生成任务越快，反之越慢，注意模型提供商最大并发限制。
{% endhint %}


---

# Agent Instructions: Querying This Documentation

If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter:

```
GET https://docs.easy-dataset.com/shu-ju-ji/shu-ju-ji-sheng-cheng.md?ask=<question>
```

The question should be specific, self-contained, and written in natural language.
The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.
