技术支持站: 電腦玩物最新文章●Google Docs OCR 文字辨識pdf,圖檔34種語言，中文有簡無繁

2011年3月1日星期二

電腦玩物最新文章●Google Docs OCR 文字辨識pdf,圖檔34種語言，中文有簡無繁

Posted: 28 Feb 2011 09:50 PM PST

來自Google官方部落格的消息「Optical Character Recognition (OCR) in 34 languages」，Google Docs文件服務內建的「OCR文字辨識」功能，新增了29種語言辨識能力，目前可以辨識的PDF、圖片檔內文字來到了34種之多，而且這次包含了簡體中文，可惜尚未有針對繁體中文辨識的支援。

我們只要在Google Docs中選擇上傳新檔案，就可以在上傳介面中看到「將 PDF 檔案或圖片檔案中的文字轉換為 Google 文件。」的選項，勾選它！然後在下拉選單裡選擇相應要辨識的語言即可。

透過這種方式上傳的PDF、圖片檔案，會直接轉換成Google Docs文件格式（也就是不會佔用Google Docs總容量），而文件裡會包含原始檔案的每頁截圖，以及辨識出來的純文字內容，方便用戶進行對照！