更新日志
Last updated
Was this helpful?
Last updated
Was this helpful?
🔧 修复
修复数据集优化过程中意外生成 COT 的问题
修复文本处理页上传时已移除文件仍被处理致报错的问题
⚡ 优化
将本地文件存储重构为本地数据库存储,大幅优化大量数据下的使用体验
随机取出问题中的问号(支持配置)
优化多项功能使用体验
✨ 新功能
领域树灵活管理模式
新增/删除文献时支持三种模式:
修订模式:仅修正新增/删除文献相关的领域树节点,最小化影响现有结构
完全重建模式:基于所有文献目录重新生成领域树(现有逻辑)
锁定模式:固定当前领域树,新增/删除文献不触发更新
多种文本分块策略
Markdown分块:根据文档标题自动分割,保持语义完整性(适用于结构化Markdown)
自定义分割符递归分块:按优先级递归尝试多级分隔符(可配置),适合复杂文档
自定义分割符固定长度分块:按指定分隔符切分后组合为固定长度(可配置)
Token分块:基于Token数量分块(非字符数),适配模型输入要求
程序代码智能分块:根据编程语言语法结构智能分割,避免语法断裂
可视化自定义分块
支持通过图形界面手动调整分块边界,实时预览分块效果
客户端工具增强
新增本地日志存储,可一键打开日志目录排查问题
新增清除缓存功能,支持清理历史日志和数据库备份文件
本次更新在修复系统问题的基础上,对存储方式进行了重大优化,将本地文件存储重构为本地数据库存储,为提升大量数据下的使用体验带来大幅改进。由于此次改动较大,特发布 beta 版本供大家体验。如果大家在使用本版本过程中遇到任何问题,欢迎通过 Issues 提交反馈,帮助我们进一步完善产品。
🔧 修复
修复数据集优化过程中意外生成 COT 的问题
修复了文本处理页上传时已移除文件仍被处理致报错的问题
⚡ 优化
将本地文件存储重构为本地数据库存储,大幅优化大量数据下的使用体验
随机取出问题中的问号(支持配置)
优化多项功能使用体验
✨ 新功能
客户端新增本地日志存储,可打开日志目录排查问题
客户端新增清除缓存功能,可清理历史日志文件和备份的数据库文件
🔧 修复
修复第一次配置模型报错的问题
修复 Docker 打包镜像报错的问题
⚡ 优化
使用 OPEN AI SDK 对模型交互接口进行重构,提升兼容性
✨ 新功能
支持视觉模型配置
支持使用自定义视觉模型解析 PDF,准确率更高
模型测试支持发送图片,对视觉模型进行测试
数据集详情页支持查看所属文本块
支持用户自己编辑文本块
支持下载和预览查看解析好的 Markdown 文件
⚡ 优化
增强模型默认最大输出 Token 限制
去除更新失败弹窗
去除部分干扰错误日志输出
✨ 新功能
支持一键打开客户端数据目录
支持模型温度、最大生成 Token 数量配置
支持两种 PDF 文件解析(基础解析、MinerU 解析)
支持数据集导出 CSV 格式
🔧 修复
修复领域树视图下无法选中问题、删除问题失败的 Bug
修复升级新版本链接可能不准确的问题
⚡ 优化
去除答案和思维链中多余的换行符
去除更新失败弹窗、更新下载最新安装包地址
✨ 新功能
文献管理支持已生成、未生成问题的筛选
🔧 修复
修复文本块排序不准确的问题
⚡ 优化
下调默认并发量为 3 (解决触发部分模型限流问题)
优化问题生成提示词,提升问题生成质量
下调最小分割字符数为 100,上调最大分割字符数为 10000
当模型未按标准格式输出时,日志增加原始输出信息
✨ 新功能
支持编辑问题、自定义问题
支持数据集直接在 LLaMa Factory 中使用
支持配置用户自定义提示词
🔧 修复
修复 extractThinkChain 报错的问题
修复 NPM 依赖弃用问题
修复问题筛选,全选联动的问题
⚡ 优化
优化上传多个文献时删除文献后重新构建领域树的操作
客户端打开后默认最大化,不再全屏
优化思维链内容,去除参考文献的话术
🔧 修复
修复缓存导致的项目列表为空的问题
修复问题分割字数配置不生效的问题
修复部分特殊文件名导致的报错问题
修复部分 Loading 状态失效的问题
⚡ 优化
客户端内打开外部链接,默认跳转浏览器
继续优化数据集结果生成的成功率
大量问题下领域树展示性能优化
✨ 新功能
新建项目时可选择复用其他项目的模型配置
单个项目支持上传多个文件(共享领域树)
问题管理增加已生成/未生成数据集的筛选
支持 docx 类型文件上传