Umi-OCR v2.1.5 开源Windows/Linux文字识别软件,支持批量截图OCR、文档、二维码识别

Umi-OCR是一款免费开源的文字识别软件,其高效提取图片文字的能力令人称赞。它支持批量处理,非常适合用于从大量图片中提取文本,如处理扫描件、截图、PDF文件等,让您能迅速获取可编辑的文本。此外,它还能精准识别影视、游戏中的对白内容,排除水印、按钮等界面元素,只保留关键信息。无论是整理Galgame(视觉小说)的游戏文本,还是一键截屏OCR识别,它都能轻松应对,导出txt、md、jsonl等多种格式的文本。
English

Umi-OCR 三周年撒花~~

Umi-OCR v2.1.5 开源Windows/Linux文字识别软件,支持批量截图OCR、文档、二维码识别

v2.1.5 主要更新:

  • 新增:日志机制。在命令行中启动 Umi-OCR 可查看实时日志。指定级别以上(默认为ERROR)的日志被保存到 Umi-OCR/UmiOCR-data/logs 目录中,保存级别可以在全局设置标签页中更改。
  • 新增:大部分标签页能手动切换左右/上下双栏模式。 (#789)
  • 新增:Esc键隐藏主窗口。 (#652)
  • 新增:调整二维码生成相关参数后,自动刷新二维码生成。 (#690)
  • 新增:命令行指令 --reload ,用于重新加载配置文件。 👉 文档
  • 修复:文档识别提取PDF自带的文本内容时,未考虑页面旋转的影响。 (#785)
  • 修复:文档识别生成单层PDF时,未写入原PDF自带的文本内容。
  • 修复:OCR结果展示列表的一些显示Bug和鼠标划选Bug。
  • 修复:调整标签页顺序或删除标签页后,未及时保存顺序信息。
  • 修复:HTTP接口 /api/doc/download 参数 ignore_blank 的错误。
  • 修复:Linux版本截图时,系统任务栏推移顶层窗口,导致截图位置偏移。 (#778)
  • 修复:Linux版本截图后,主窗口的位置与操作前不一致。
  • 优化:图片/文档的异步加载机制。现在可以流畅地加载含有数万个子文件的文件夹,且能预览加载进度。 (#710)
  • Windows 版本更新第三方依赖库:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
  • 新增UI语言:俄语 Русский ,译者:Вячеслав Анатольевич МалышевMuhammadyusuf Kurbonov。泰米尔语 தமிழ் ,译者:தமிழ்நேரம்

Windows 下载

不同版本仅OCR引擎插件不同,其它功能完全一致,附带多国语言识别库。.7z.exe为自解压包,可以用压缩软件打开,也可以在没有安装压缩软件的电脑上直接双击解压。

Paddle 引擎插件版

(性能好,速度快,占用率高,适合高配机器。不兼容奔腾、赛扬、凌动CPU

重要提示:如果执行OCR时报错 0xc0000142[Error] OCR init fail,大概率是CPU不兼容Paddle,请换用Rapid版本。

Umi-OCR_Paddle_v2.1.5.7z.exe (128MB)
SHA256: abe00248d6e68dda75029739751ad7258f0ecc14d720b19240a844f5341859b2

Rapid 引擎插件版

(速度稍慢,内存占用低,适合低配机器,兼容性好)

Umi-OCR_Rapid_v2.1.5.7z.exe (98.5MB)
SHA256: 659c55896c32a5e019dc7bde1713d0e5c73186a2c653bed84c4480fa1795b722

更多下载途径: 蓝奏云 | SourceForge | Scoop

Linux 下载

Umi-OCR_Linux_Paddle_2.1.5.tar.xz (264.5MB)
SHA256: 7ff32e5dc818d67171820545100433c86e7e71155f9bad0851fad2ced9588f9b

首次运行请在命令行中执行 ./umi-ocr.sh ,随后可在全局设置中创建桌面/开始菜单快捷方式,便于日常使用。

Docker 部署

本文来自投稿,不代表开心电脑网立场,如若转载,请注明出处。

(0)
上一篇 2025年4月18日
下一篇 2025年5月23日

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注