1. 首页
  2. 考试认证
  3. 其它
  4. cbrTekStraktor 一个从漫画书中自动提取文本的应用程序。 开源

cbrTekStraktor 一个从漫画书中自动提取文本的应用程序。 开源

上传者: 2024-08-18 11:38:23上传 ZIP文件 6.75MB 热度 2次

cbrTekStraktor 是一个应用程序,用于从漫画书阅读器文件 (CBR) 中存在的文本气泡或语音气泡中自动提取文本。它的主要目标是对漫画书的文本进行分析,然而,cbrTekStraktor 也可用于扫描或类似目的。该应用程序还支持手动定义 CBR 文件中的文本区域,并包括一个简单的图形编辑器,用于进一步处理提取的文本。

文本提取是通过统计和图形处理操作的结合来实现的。具体来说,它基于以下三种主要算法:

  • 彩色图像的二值化(Niblak和其他方法)

  • 连接组件

  • K-Means聚类

提取的文本通过Apache Tesseract进行光学字符识别(OCR),这也是目前广泛应用于各种场景的技术之一。对于对 OCR 技术感兴趣的用户,可以通过光学字符识别了解更多细节。

该应用程序的后续版本将与翻译软件集成,以提供漫画文本的自动翻译翻译文本的重新插入。这将极大地提升漫画爱好者的阅读体验。如果你想进一步探索 cbrTekStraktor 的技术细节或获取相关源码,可以参考cbrTekStraktor一个自动从漫画书中提取文本的应用程序开源

下载地址
用户评论