|
|
本帖最后由 NoobNeo 于 2019-10-27 13:29 编辑
tesseract进阶参数:
进阶参数位于程序目录 APP/tessdata 文件夹中, 如果不了解不建议调整!
用文本编辑器打开 'config' 文件
| tessedit_char_blacklist | tesseract识别中被排除的字符 | | unrecognised_char | 无法识别的字符用此字符替代, 默认为无 | 其他参数安装tesseract后 用 "tesseract --print-parameters" 查看
0.0.1-3 - alpha 版本及以上部分已失效, 可忽略, 程序中部分按钮悬停可查看描述
=====================================================================================
软件说明
主界面部分按钮(从上至下, 从左至右):
| Open [CTRL+O] | 打开 COCR 文件 | | Video | 打开视频文件 | | Save [CTRL+S] | 保存为 COCR 文件 | | Save As [CTRL+SHIFT+S] | 保存为 ASS 文件 | | Export | 导出 PNG 文件 | | Filter | 滤镜, 需要打开一个视频才能进入 | | Del&Merge | 删除/合并字幕, 需要勾选 "Manager Mode" | | OCR | 图片字幕识别 | | Profile | 偏好设置 | | BAT | 批量处理 | | Manager Mode | 管理模式 | | F | 当前打开文件的文件名 | | FC | 视频文件的总帧数 |
BAT(批处理)界面部分按钮(从左至右)
| Number of SIMUL tasks | 同时处理任务数量, 默认为1 |
Process(滤镜处理流程) 界面与 Param Settings 对应(从上至下, 从左至右)
其他界面比较简单, 不一一说明.
软件内各种参数说明 标题格式 [窗口] - [区域标题]
Video Filter - Region:
| TL X | 字幕区域左上角 X 轴坐标, 一般为 0 | | TL Y | 字幕区域左上角 Y 轴坐标 | | BR X | 字幕区域右下角 X 轴坐标, 一般为视频宽度 | | BR Y | 字幕区域右下角 Y 轴坐标
|
Param Settings - Morphology Parameter: (形态学变化)
| MedianBlur Kernel | 中值滤波核尺寸, 只能是奇数, 一般设定为1或3 | | Fixed Min Threshold | 固定二值化的阈值 | | Adaptive Block | 自适应二值化核尺寸, 只能是奇数, 其他参数固定时, 应尽可能调大 | | Adaptive Constant | 自适应二值化常量, 可以为负数, 其他参数固定时, 应尽可能调小 | | Dilate Kernel Width | 背景腐蚀核尺寸 - 宽度, 尽可能调大, 不要出现大黑块, 不调整用默认值也没问题 | | Dilate Kernel Height | 背景腐蚀核尺寸 - 高度, 同上 | | Close Kernel Width | 闭运算核尺寸 - 宽度, 在确保文字区域没有被抹除的情况下, 尽可能调大 | | Close Kernel Height | 闭运算核尺寸 - 高度, 同上 |
Param Settings - CCL Area & Pixel Count (连通区域过滤):
| Max CCL Area | 最大连通区域 (方形), 确保文字没有被抹除的情况下, 应尽可能调小, 通常设定为 2000~4000 左右 | | Min CCL Area | 最小连通区域 (像素点), 去除形态学中无法过滤的小噪点, 不宜过大, 容易把汉字中的"丶"过滤掉 | | Min Pixel Count | 字幕图片中像素数量, 小于此数值的会被判定为无效字幕, 单独一个 "一" 字大概在500上下, 不宜过大 |
Param Settings - Similarity Profile (去重):
| Min SSIM Threshold | SSIM算法阈值, 高于此数值判定为重复, 不建议低于默认值, 更不建议设置小于0.9的数值, 容易误判 | | Min Psnr Threshold | Psnr算法阈值, 高于此数值判定为重复, 不建议低于默认值, 如果误判严重, 建议调大, 或选用SSIM | | SSIM OR Psnr | 两者都是机器视觉, 与人类视觉不同, 当我们觉得两张图一样时, 机器不一定认为一样, 通常SSIM的表现优于Psnr |
Param Settings - Binarization Type: (二值化类型)
| Fixed Binarization | 固定二值化, 颜色波动小时建议用这个, 速度快, 性能优 | | Adaptive Binarization | 自适应二值化, 颜色波动大时建议用这个, 速度慢, 效果好 |
Param Settings - Adaptive Method: (自适应算法)
| Mean | 核内区域计算均值 | | Gaussian | 核内区域计算加权均值 (高斯函数) |
Param Settings - Storage Policy: (去重保存策略)
| Min pixel count in stack | 保存堆内像素总量最少的 | | Max pixel count in stack | 保存堆内像素总量最多的 | | Med pixel count in stack | 保存堆内像素总量中位数 | | First frame in stack | 保存堆内第一个 帧 | | Last frame in stack | 保存堆内最后一个帧 |
Profile - : (偏好设置)
| Caption Default Style | Default 字幕样式 | | Digital container format | 视频容器格式, BAT中根据这个来判定是否为有效视频; 打开视频对话框内快速筛选格式; FFmpeg 支持的容器 | | Editor Font Size | 编辑框字体大小 | | Frame interval | 提取字幕时帧间隔, 精度越高越耗时 | | Count Pre Page | 每次加载字幕图片的数量 | | OCR Language | OCR 识别目标的语言, 支持混合语言 |
滤镜参数中建议调整顺序:
字幕区域 > 均值滤波 > 二值化类型 > 二值化类型对应参数, 其余参数基本不用动
|
|