Google Docs стал распознавать китайский язык

В Google Docs появилась функция распознавания графических китайский текстов, пока только в упрощенном начертании. Для этого достаточно загрузить файл в формате JPG или Адоб ридер, проставить распознавание и выбрать язык. Распознается текст достаточно качественно, хотя не без погрешностей. Вот результаты эксперимента по распознаванию прилагаемой страницы из книги:

凡 例
I- 本字典供查阅简化字与繁体字对照关系之用,只识简 化字的读者可以从中查出相应的繁体字, 只识繁体字的读者 也可以从中查出相应的简化宇。
2- 本字典收入联简化字总表>娅眺6 年版) 中的全部简化 字, 共2235 个° «第一批异体字整理表)中的勰个选用宇习 惯上枝看作简化字,本字典也全部收入。
3- 本字典以简化字为字头, 横线后列出相应的繁体字。 字典解说用简化宇。
4- 字典正文按汉语拼音音序排列。正文前面有汉语拼音 音节索引. 同音字按笔画数多少排列, 少的在前,多的在后. 笔画数相同的,按起笔笔形横、竖、撇、点、折的顺序排列.正文 前面还有笔画检字索引,包括两部分= 从简体查繁体,从繁体 查简体。
5- 宇头右上角标 1 的,表示该字属于(简化字总表)第一 表,是不作简化偏旁的简化宇;标 2 的,表示该宇属于<简化字 总表>第二表,是可作简化偏旁的简化字;标 3 的 ,表示该 字属 于<简化字总表>第三表, 是按照偏旁类推方法得出来的简化 字;标0的,是从<第一批异体字整理表》申摘录出来的宇°
6- 简化字字头在本字典中出现不止一次的,从前到后在 右下角用 1、2、3 等标明。 —
7. 每个字条下分两大部分,中间用〇隔开。 圆圈的前面 是注音和释义, 圆的后面是简化方法的说明。 有的条目附 有[注意]°
8- 注音使用汉语拼音和注音字母。多音字按照实际的读 音分列在有关的音节中, 在条目的最后指明另见某音。 有的 多音字只列现代常见的读音。 有的宇注明»统读某% 意思是 这个字不论用在哪个词语中部渎这个音° 释义力求简明, 主


Ранее в этой же рубрике:


Добавить комментарий