cbrTekStraktor:一个自动从漫画书中提取文本的应用程序。 开源
cbrTekStraktor是一个应用程序,可从漫画阅读器文件(CBR)中显示的文本气泡或语音气球中自动提取文本。 它的主要目标是对漫画文本进行分析。 但是,cbrTekStraktor也可以用于扫描或类似目的。 该应用程序还可以手动定义CBR文件中的文本区域。 该应用程序包括一个简单的图形编辑器,用于进一步处理提取的文本。 文本提取是通过统计和图形处理操作的组合来实现的。 它基于以下3种主要算法-彩色图像的二值化(Niblak和其他方法)-连接的组件-K-Means聚类Apache Tesseract用于对提取的文本执行光学字符识别。 该应用程序的后续版本将与翻译软件集成,以提供漫画文本的自动翻译和翻译文本的重新插入。
下载地址
用户评论