Office2007 MODI 繁体字幕识别

最近用大显示器看电影有个问题:所有vobsub字幕基本不可用了。因为都是图片,定位都是按标清分辨率来的,到了高分辨率时候全在画面中左上方显示出来,破坏了主要画面,大小也不可调。于是着手把那些sub字幕转成srt或ssa的。

idxSubOcr不错,小巧,网友自己写的,用的是微软Office套件的ocr接口,需要Office 2007安装Document Imaging和ocr部分。但运行读取繁体字幕,则还需要下载一个繁体识别组件,网上到是有下打包好的office2003的rar包。但copy完一用,总会出现一个kernel32的错误,导致应用崩溃,但用英文语言去识别就没这个问题(但识别出来肯定是一堆乱码了)。后来用微软自己的document imaging打开繁体tiff也是一样,ocr了一半,mspview程序崩溃,错误相同。

网上查了一下,类似都是针对office2003的sp更新问题,应该无关。再把这个错误简单调试看了一下,似乎是twrecc.dll抛出Unknown Exception导致。估计是office 2007不兼容的问题。网上又找了半天,发现微软带的ocr组件其实来自清华,还有个cajviewer用的也是清华的那套,于是乎把cajviewer最新版给下了,果然里面有一堆类似文件。按照前面下的office2003繁体包里的文件把cajviewer里面的版本复制过去,再把出问题的twrecc等类似的文件也给替换了。再运行,一切正常,字幕转换成功搞定。

One thought on “Office2007 MODI 繁体字幕识别”

Leave a Reply to 小E Cancel reply

Your email address will not be published. Required fields are marked *

This site uses Akismet to reduce spam. Learn how your comment data is processed.