在深度学习和图像生成领域,数据集的标签编辑至关重要。BooruDatasetTagManager v2.4.1便是一款功能强大且操作便捷的标签编辑器,专门用于编辑训练超网络、嵌入、LoRA 等模型所使用的数据集,尤其适用于 booru 风格标记数据,当然也可用于其他类型的数据集。
![图片[1]-BooruDatasetTagManager v2.4.1:一站式数据集标签编辑神器 - 搜源站-搜源站](https://www.souyuanzhan.com/wp-content/uploads/2025/03/daf67b33fc20250326015410-1024x635.webp)
一、软件功能概述
(一)便捷的数据集加载
使用时,您需准备好数据集。如果想从头建立标签,也可指定一个不含文本文件的数据集。在程序中,通过选择 “文件 -> 加载文件夹”,指定包含数据集的目录即可完成加载。
(二)灵活的标签编辑与管理
加载数据集后,在软件界面中,面板会显示数据集中的图像。您可以在标签页对图像进行标签编辑。软件支持一次选择多张图片进行操作,编辑完成后,选择 “文件 -> 储存所有变更” 就能保存修改。此外,还可以使用内置服务(interrogator_rpc)生成标签,为编辑工作提供了更多便利。
(三)丰富的设置选项
通过 “设置” 菜单,您能打开设置窗口来自定义应用程序。在设置中,不仅可以调整预览图像大小、字体、颜色方案等常规 UI 设置,还能设置热键,方便操作。比如,您可以根据自己的习惯设置适合的键位布局。同时,在标签翻译方面,选择翻译语言和翻译服务(如 Google 翻译)后,就能使用标签翻译功能。目前,手动翻译过滤器仅用于标签自动完成(需在设置中启用该选项) 。
(四)强大的自动标签生成功能
软件自带自动标签生成器(interrogator_rpc),您可以直接在程序中为图像生成标签。启动服务有多种方式,若在纯 Python 环境中执行服务遇到问题,可尝试使用 anaconda 或 miniconda。例如,安装 anaconda 后,在控制台创建新的 conda 环境并安装必要依赖项:
- 创建新环境:
conda create -n bdtm python=3.10.9
- 激活环境:
conda activate bdtm
- 安装依赖项:
pip install -r requirements.txt
- 运行服务:
python main.py
启动服务后,在编辑器中,您可以通过 “工具” 菜单为所有图像生成标签,也能使用特定图标为选定的影像生成标签,还可在 “自动标记器预览窗口” 标签页单独生成标签。在自动标签生成器的设置中,您可以选择不同的模型,如 BLIP 系列、DeepDanbooru、wd – v1 – 4 系列等,并且能指定多个结果合并方法、排序模式以及设置置信度阈值。
(五)支持外部标签导入
该应用程序支持从「A1111 的 Booru 标签自动完成」使用的 csv 格式文件载入标签。软件会将其转换为自身格式并加载数据,进一步丰富了标签来源,提高了工作效率。
二、软件使用场景与优势
在深度学习模型训练过程中,准确且丰富的标签对于模型的性能至关重要。BooruDatasetTagManager 为数据标注工作提供了极大便利。无论是专业的机器学习从业者,还是深度学习领域的爱好者,在处理图像数据集时,都能借助这款工具高效地完成标签编辑任务。它简化了标签编辑流程,减少了人工标注的工作量,同时提高了标注的准确性和一致性,为后续的模型训练奠定了坚实基础。
暂无评论内容