EncodingDetect Java编码识别工具
纯 Java 写的文本编码检测工具,EncodingDetect.java
没有依赖任何第三方库,适合嵌入老项目或者网络环境受限的场景。识别常见编码还挺准的,比如 UTF-8、GBK、ISO-8859-1 这些常用的它都能搞定。
核心逻辑用的是字节头部的特征判断,代码也不复杂,几百行左右,一眼能看懂。适合你想自己改改逻辑,比如加个日志、限制某些编码什么的,伸缩性比较强。
我自己在一些旧系统接口时,用它来判断文件上传的编码,挺省心的。尤其是用户啥也不说,丢个 txt 过来,编码五花八门——这个类能帮你自动兜底,不至于乱码。
顺手贴几个相关资料,有空可以看看:
如果你项目用得比较老、不方便加依赖库,这个类你可以直接拷进去就用,挺方便的。建议测试时手头备几个不同编码的样本文件,对比下效果更直观。
下载地址
用户评论