首页 > 电脑科技 > 实战“厦大简繁文本智能转换系统”
2015
04-06

实战“厦大简繁文本智能转换系统”

2014年11月,我写了一篇有关由厦门大学牵头完成的《汉字简繁文本智能转换系统》的简评博文。那时只是简单地测评了一下,并没有严格意义上的实战。尽管如此,还是发现了诸多问题。这两天,借助我写就的一篇繁体字论文来实际操作了一把。初步检查了一遍,发现问题不少。以下为论文中实际出現的文本:

1. 遣使徃答其意

2. 五月去舟纔還

3. 他卻在其論著中

4. 扵是日本王良懷禮遇載䓁

5. 趙孟頫

6. 衣綿繻布

7. 海上峯峦红日近

8. 録

9. 幾夜吟窓月影西

以下为(1)使用简繁体智能转换word插件转换的结果;(2)MS Word自带工具的转换结果;(3)正确的转换结果。

实战“厦大简繁文本智能转换系统” - 半省堂 - 1

亮色文字标示出来的都是错误的转换文字。从表中可以看出,厦大智能转换有9个错字,MS Word转换有7个错字。我这篇论文共29529字,其中正文是19819字,而这些转换出错的字全部来自正文,所以其错误率大致在4.5/10000,而官方宣称是1/10000。因为我研究是中国历史,文中引用了一些不太常见的繁体字,照理来说,这个错误率还算可以接受,但是问题是:这个智能转换系统可能比MS Word自身所带的免费工具错误率还高,而且实际操作中还出现了两个奇葩错误:

(1)转换“趙孟頫”和“繻布”两词时,系统无法识别,结果弹出了这样的结果。然后,这两个词后面所有的文本都不能再转换了。要想继续进行,只能绕过这两个词,从后面的部分再重新操作进行转换。

实战“厦大简繁文本智能转换系统” - 半省堂 - 2

(2)不能转换也就罢了,竟然出现了自动删除注释的情况,而且没有任何的提示。删除注释的情况是发生在上述识别错误之时,也就是说,智能系统若遇到不能识别的情况时,它还会自动改变文档内容。删除注释的情况极其隐秘,幸亏我整篇文章重新核对了一下,不然损失太大了。

以上是今天实际操作中所出现的具体问题。俺只阐述实情,不抒发感情。。。

实战“厦大简繁文本智能转换系统” - 半省堂 - 3
最后编辑:
作者:马光
这个作者貌似有点懒,什么都没有留下。

实战“厦大简繁文本智能转换系统”》有 19 条评论

                  马光的回复 取消回复

                  你的email不会被公开。