图像文本分割工具
上传图片,自动识别和分割文本行
使用提示
使用说明
- 选择要上传的图像文件(支持JPG、PNG和GIF)
- 根据需要调整二值化阈值(根据图片的明暗调整)
- 如需按固定尺寸分割,勾选”按固定尺寸分割”选项,并设置目标宽度和高度
- 点击”上传并处理”按钮,等待处理完成
- 处理完成后,您可以预览、下载单个分割后的图像或整个ZIP压缩包
参数说明
- 二值化阈值:将图像转换为黑白二值图时的阈值。灰度值低于此值的像素被视为黑色,否则被视为白色。对于浅色文本,降低此值;对于有噪声的图像,提高此值。
- 检测方法:选择使用二值化方法或传统方法进行处理。二值化方法通常效果更好。
- 按固定尺寸分割:启用后可指定输出图片的固定宽度和高度。系统会在空白行附近智能分割,确保不会切断文字,同时保持输出尺寸一致。特别适合需要规格统一的图片输出场景。
- 目标宽度与高度:设置输出图片的尺寸。宽度为0则保持原图比例;高度决定每个分割块的高度,系统会智能选择最接近此高度的空白行进行分割。
- 自动计算DPI:开启此选项后,系统会根据您上传图片的实际像素宽度和设定的目标宽度自动计算适合的DPI值,确保输出图片的实际尺寸符合您的要求。无需再手动调整DPI值。
空白行检测与分割机制
本插件采用精确像素统计方法,检测每一行的黑色像素。通过黑像素阈值参数,您可以控制空白行的判定标准:
- 当黑像素阈值为0时,只有完全没有黑色像素的行才会被判定为空白行
- 增大黑像素阈值,可以允许行内包含少量黑色像素的行也被判定为空白行
- 这对于处理含有轻微噪点的图像特别有用,可以避免因少量噪点而错过空白行
图像分割特点:
- 精确中间点分割:系统会准确计算空白行区域的正中间位置进行分割,确保分割的精确性和一致性
- 分割过程保留原图中的所有像素,不会删除任何内容
- 分割后的所有图片可以完美拼接回原始图像
- 按固定尺寸分割时,系统会智能寻找接近指定高度的最佳空白行,确保文字内容完整
- 当一页装不下最后一行文字时,自动向上查找最近的空白行作为分割点,确保整行文字被保留在前一页
- 智能处理连续无空白行的长区域:当连续文本超过设定高度太多时,会直接在设定位置切割,避免页面过长
- 分割逻辑优先考虑文本的完整性,避免在非空白区域进行分割
- 当实在无法找到合适的空白行时,系统会自动采用备用分割方法,确保处理过程不会中断
- 适合需要保持精确布局的场景,如文档处理、教材分割等
常见问题
- 图像没有被正确分割:尝试调整二值化阈值。对于浅色文本,降低阈值;对于背景有噪点的图像,提高阈值。
- 处理大图像时失败:尝试将大图像分割成几个小图像后再处理,或者使用图像编辑软件降低图像分辨率。
- 分割结果丢失了部分文本:这可能是因为文本间距太大,系统误判为空白行。请使用图像编辑软件调整文本间距后重试。
针对扫描文档的建议
- 确保扫描图像对比度清晰
- 将二值化阈值调整到合适的水平(通常在110-160之间)
- 对于质量不佳的扫描,可先使用图像编辑软件增强对比度后再处理