Китайско-английский Гоголь-моголь

Китайцы все-таки молодцы. Когда я отсканировал года этак четыре-пять назад Мертвые души на китайском языке, найти его в китайском интернете было невозможно. А сейчас глянул, уже есть. Единственное, пришлось искать его в текстовом файле, потому что распознанный китайцами PDF упорно не хочет открываться, мотивируя это отсутствием шрифтов. Хотя виндовс у меня стоит не усеченная, и Акробат тоже, однако ж на тебе. Причем уже не первый раз такое случается. Насколько я понимаю, китайцы никогда в PDF не импортируют шрифты, но проблем с чтением файлов не испытывают. Если кто сможет прояснить ситуацию, как это им удается, буду премного благодарен. А пока выкладываю, помимо моего графического файла Мертвых душ в переводе 解怀思, и тот файл, который мне удалось найти у китайцев. Переводчик там уже другой.

Вот сравните два куска, первый из скана, второй от китайцев:

省会 NN 市的一家旅馆的大门口, 跑进了一辆讲究的、软垫子的小小的篷车,这是独身的人们,例如退伍陆军中佐、步兵工等大尉、有着百来个农奴的贵族之类 — 句话,就是大家叫作中流的绅士这一类人所爱坐的车子。车里面坐着一位先生,不很漂亮,却也不难看;不太肥,可也不太瘦,说他老是不行的,然而他又并不怎么年青了。他的到来,旅馆里并没有什么惊奇,也毫不惹起一点怎样的事故;只有站在旅馆对面的酒店门口的两个乡下人,彼此讲了几句话,但也不是说坐客,倒是大抵关于马车的。«你瞧这轮子 — 这一个对那一个说,- 你看怎样,譬如到莫斯科,这还拉得到么? » – «成的» 那一个说,«到凯山可是保不定了,我想。»– «到凯山怕难。»那一个回答道。谈话这就完结了。

一辆漂亮的轻便马车赶进省会N市一家旅馆的院里,马车车身不大,却装有弹簧底盘.坐这种车的一般是单身汉:退役的中校啦,上尉啦,家有一百来个农奴的地主啦,等等,总之,全是些被称为中等绅士的人. 马车里坐着一位先生,虽不是美男子,可也还算英俊;不太瘦可也不很胖,不能说他太年轻,可也不能说他老. 此人的来临在市里并没有引起什么异常变化,也没有带来任何轰动,仅有两个俄国乡下人站在旅馆对面的酒店门口发了几句议论,可是他们议论的与其说是车里的乘客,倒不如说是那辆马车. 他们一位对另一位说:“伙计,瞧那轱辘! 如果上莫斯科,这车轱辘能不能拉到?“ 那另一位伙计答道:“能拉到.” “如果上喀山呢,我看,够拉到的吧?”“上喀山可拉不到” ,另一位答道.

Единственное, что есть нехорошо, китайцы практически никогда пропущенный через OCR текст не вычитывают, потому неправильно распознанные иероглифы неизбежны. Поэтому если попадется странный текст, списывайте это на программу распознавания. Одновременно, добавил еще и английский перевод, который попутно тоже нашел у китайцев.

Ссылки в твиттере.



К записи 2 комментария

«распознанный китайцами PDF упорно не хочет открываться, мотивируя это отсутствием шрифтов.»

Adobe Acrobat Reader вкупе с потрясающей глючностью и тупливой монстроидальностью для отображения распознанных PDF документов на восточных языках требует наличия в системе собственных Font Packs: http://www.adobe.com/support/downloads/product.jsp?platform=windows&product=10

Хотя правильнее, IMHO, использовать вместо Acrobat’а альтернативный просмотрщик (например Free PDF-Xchange viewer).

P.S. ifolder так и не захотел отдать мне файл, намного проще и быстрее оказалось эту байду нагуглить 🙂

Установка шрифтов не помогает.

Добавить комментарий