8

使用Google Docs翻译漫画

注意到Google Docs带有OCR(Optical Character Recognition)功能,遂想起了之前的用OCR机器翻译漫画的想法。立即动手,试试看Google OCR的效果如何吧。

*你可能需要使用代理才能访问本文的链接。

首先试验已经翻译好的中文漫画。目前Google Docs的OCR的中文只有简体而没有繁体,简体漫画在我硬盘里还真是稀有物种……

Google Doc

可以看到识别并不十分准确,只有字大的识别率比较高,大概是竖向排版的影响。下面更换成横版文字,识别率提高了不少:

Google Doc

下面试试日文,这里直接用横版文字了。

Google Doc

结果也不比中文好到哪里去。现在的都是白底黑字,那么换成彩色图片会如何呢?

Google Doc

结果也还是差不多,不过也许是这张上面的文字较大而且行距够大,反而比上面好一点点。

最后试试英文,英文漫画就基本不存在竖版问题了。

Google Doc1 | Google Doc2

结果是……最差的一项。试了几张,都没法识别大部分英文,大概是因为漫画中英文字号普遍较小且密集,识别困难。

结论:

漫画中普遍存在竖排文字,字体较小且排列密集,OCR一般难以识别。想要机器翻译,还路漫漫其修远兮……有兴趣的同学可以再用其他OCR软件进行实验。

分享到:

相关日志

Google社交网络的悲剧之处
Google社交网络的悲剧之处

新的社会化网络
新的社会化网络

GoldenGate——用WP向Picasa相册上传图片
GoldenGate——用WP向Picasa相册上传图片

6000+ Unread
6000+ Unread

佐天的能力是?
佐天的能力是?

让你的Picasa畅通无阻 - Picasa相册排毒手记
让你的Picasa畅通无阻 - Picasa相册排毒手记

拍手

无力吐槽,就来拍下手吧~
现在已有6次拍手,平均拍手3次。

“使用Google Docs翻译漫画”有 8 条吐槽

Google Chrome 9.0.597.98 Google Chrome 9.0.597.98 Windows 7 Windows 7
2011-03-01 at 22:22

机器翻译一些和谐本本的工口文表示压力很大

Safari 5.0.3 Safari 5.0.3 Mac OS X 10.6.6 Mac OS X 10.6.6
2011-03-01 at 22:39

今天看到Twitter上一张图片,感觉google docs的OCR还差很远啊orz

朗~
Opera 11.01 Opera 11.01 Windows XP Windows XP
2011-03-01 at 23:23

起码还有个盼头

Chromium 9.0.597.94 Chromium 9.0.597.94 Ubuntu 10.04 Ubuntu 10.04
2011-03-01 at 23:58

OCR对DPI高于300的图片识别率很高,针对英文来说。漫画因为灰度变化比较缓,OCR的效果一般确实很一般。不过中文和日文的OCR,就不奢望了。当时有一本600DPI的自扫书,做了一遍OCR后再手动校稿,结果用时和手工录入其实差不了太多,也就不对这玩意抱希望了。

Firefox 4.0b12 Firefox 4.0b12 Windows 7 Windows 7
2011-03-02 at 00:44

看了楼上,我会乖乖学英文算了

Delete
Google Chrome 9.0.597.98 Google Chrome 9.0.597.98 Windows 7 Windows 7
2011-03-02 at 12:16

且不说OCR如何,机器翻译神韵全无啊。

看到了第一张漫画_____“剑弓虽”_____记得当年在仔细的时候看完了11区生肉版___毫无压力___画风很不错___然后最后一个,女仆新娘____画风更喜欢~

Firefox 3.6.4 Firefox 3.6.4 Windows 7 Windows 7
2011-03-18 at 12:16

两部都是很棒很实用的作品w

吐个槽吧

如果失去你,会有人伤心。为什么你就是不明白。那些想要守护你的人又该何去何从?
晓美焰