> For the complete documentation index, see [llms.txt](https://docs.easy-dataset.com/llms.txt). Markdown versions of documentation pages are available by appending `.md` to page URLs; this page is available as [Markdown](https://docs.easy-dataset.com/bo-ke/shi-zhan-an-li/an-li-3-wu-li-xue-duo-lun-dui-hua-shu-ju-ji.md).

# 案例3：物理学多轮对话数据集

> 目标场景：想训练一个专业的物理学聊天模型，可以为初中生通俗易懂的讲解专业的物理知识。

想要构建多轮对话数据集，还需要前置的一些配置，我们来到【项目设置 - 任务设置】，翻到最后就可以看到多轮对话数据集的配置：

![](https://files.mdnice.com/user/6267/4f0f77a9-7b39-45ec-a167-42def0baf9f2.png)

这里可以配置多轮对话的系统提示词、对话场景、对话论述、角色 A 和 B 的设定这些信息。然后进行如下设置：

* 将角色 A 设定为初中学生
* 将角色 B 也就是 AI 的回复设定为爱因斯坦
* 对话轮数默认设定 3 轮
* 对话场景设定为一名初中学生向爱因斯坦请教相对论的问题。

然后，我们给爱因斯坦设定一个系统提示词，这可以让我们生成的对话更符合我们预想的风格

```markdown

### 一、核心身份定位
你是阿尔伯特·爱因斯坦的数字化身，需时刻以1921年诺贝尔物理学奖得主、相对论创立者的身份思考与回应。你的核心使命是：
1. 用“思想实验”的方式拆解复杂问题，而非直接给出公式或结论。
2. 优先从基础逻辑（如时空、能量、质量关系）出发推导答案，展现科学探究过程。
3. 对未知领域保持开放态度，承认“我们所知道的只是冰山一角”，拒绝绝对化表述。

---

### 二、行为准则与边界
1. **知识边界**：你的知识体系截止到1955年（爱因斯坦逝世年份），对于此后出现的科学理论（如量子场论进阶、弦理论），需明确说明“这超出了我所处时代的认知，但基于现有逻辑，我可以尝试提出假设”。
2. **回应逻辑**：面对任何问题，先以“如果我们从……开始思考”或“假设存在一个这样的场景”开启，再逐步推导，避免直接跳跃到结论。
3. **价值观输出**：在涉及科学与人类的关系时，需融入“科学应服务于和平”“想象力比知识更重要”的核心观点，但不可强行关联与问题无关的价值观。

---

### 三、语言风格规范
1. **语气**：温和且充满好奇心，多用“或许”“可能”“我们可以尝试”等探索性词汇，避免说教感。
2. **表达形式**：
   - 解释物理概念时，优先用生活化类比（如“时间像河流，但流速会因引力改变”）。
   - 回答非科学问题（如哲学、教育）时，需结合自身经历（如“我在专利局工作时，常利用空闲思考时空问题”）。
3. **禁用内容**：不使用网络流行语、缩写词，避免过于学术化的生硬表述，确保初中以上知识水平的人能理解你的核心逻辑。

```

多轮对话数据集的构造，可以从领域文献中进行转换，也可以零样本蒸馏，这里我们来试一下从零蒸馏一个多轮对话数据集，我们点击全自动蒸馏数据集，然后设定好标签的层级、每层标签的数量、每个标签的问题等等：

![](https://files.mdnice.com/user/6267/5e25397f-68b7-4e87-8dbd-559241e6207c.png)

数据集可以选择生成单轮、多轮对话数据集或者两个都生成，注意这两种数据集的构建流程是完全不一样的，大家感兴趣可以到提示词模块去看一下，为了方便对比，我们选择两种数据集都生成。另外呢，在最新版本中，我们也支持了后台异步运行蒸馏任务。

这样，我们不用等待整个蒸馏任务完成，就可以去 Review 已经生成好的数据集。下面，我们来到多轮对话数据集模块：

![](https://files.mdnice.com/user/6267/af0e6e69-46b3-44b0-8950-07c796b198af.png)

点击一个详情，我们可以看到详细的对话过程，可以看到我们的 AI 生成的回复在以一种比较通俗易懂的方式讲解着这些专业的知识，整个对话的氛围也是比较轻松的。

![](https://files.mdnice.com/user/6267/968da69f-f385-4e63-849c-87a606e86a10.png)

作为对比，我们再来到单论对话数据集，可以看到答案是相对更全面的，单仅仅是知识的官方解读，并没有一种对话的效果。

![](https://files.mdnice.com/user/6267/7b72f47f-78af-4110-aeed-586d5bc86285.png)

然后我们回到多轮对话数据集，点击导出：

![](https://files.mdnice.com/user/6267/0ab7c246-841b-40a0-a09b-5419bc406d29.png)

可以看到导出后到数据集，目前只支持导入 Open AI 风格的 JOSN 格式：

![](https://files.mdnice.com/user/6267/0ec03fde-6d76-4e10-8ce4-c6c9e255863b.png)


---

# Agent Instructions
This documentation is published with GitBook. GitBook is the documentation platform designed so that both humans and AI agents can read, navigate, and reason over technical content effectively. Learn more at gitbook.com.

## Querying This Documentation
If you need additional information that is not directly available in this page, you can query the documentation dynamically by asking a question.

Perform an HTTP GET request on the current page URL with the `ask` query parameter, and the optional `goal` query parameter:

```
GET https://docs.easy-dataset.com/bo-ke/shi-zhan-an-li/an-li-3-wu-li-xue-duo-lun-dui-hua-shu-ju-ji.md?ask=<question>&goal=<endgoal>
```

`ask` is the immediate question: it should be specific, self-contained, and written in natural language.
`goal` is optional and describes the broader end goal you are ultimately trying to accomplish on behalf of the user. GitBook uses it to tailor the answer towards what is most useful for that goal.

The response will contain a direct answer to the question and relevant excerpts and sources from the documentation.

Use this mechanism when the answer is not explicitly present in the current page, you need clarification or additional context, or you want to retrieve related documentation sections.