超長圖形檔案的文字辨識 -- OCR (光學字元辨識)

先前,曾經跟大家介紹過一個文字辨識工具 – Google Keep。

由於辨識文字的圖檔來源,不被局限在特定 App 中,使得它的使用彈性就變得無限寬廣!
建議大家多多使用。

不過,在一次使用過程中,既然發現到這程式的使用限制 -- 超長圖形檔案的文字無法辨識!!
本篇文章將說明,如何處理此一特殊情況!

所謂“超長圖形檔案”的外觀,如下:(要觀看資料內容,就要將圖形放大好幾倍,才能看得清楚)

image

首先,請讀者先下載範例檔案,方便逐步操作學習。
使用的範例檔案,來自妥拉坊:《過了篇》妥拉 (第10篇-過了篇-引言),或是點擊《這裡》下載範例檔案。

一、開啟圖檔 10-1.jpg  -- 【小畫家

image

二、調整列印版面的設定!

image

image

三、指定輸出報表的印表機 – 【PDFill PDF & Image Writer

image

經由上述的操作後,原本的圖檔:10-1.jpg,就會被列印、轉成三個圖檔。(一個 A4 版面,存成一個圖檔名稱;列印過程,檔名會自動生成。)

image

接下來的操作,就是之前跟大家介紹過的 Google Keep 使用。

不過,在這裡要跟大家說個小技巧!

以這個圖檔為例,你是不是要做三次的字元辨識,再將結果結合起來呢?
有沒有更好的方法?可不可以一次性處理?

答案是:可以。但是,你要如何確保辨別出來文字,有“正確地”先後關係?
答案是:只要放入 Google Keep 的圖形,先後次序正確;轉換出來的文字就會正確。
同樣的問題又來啦,難不成要 10-11.jpg 先存放,再來 10-12.jpg 、10-13.jpg 嗎???

image

將點選後的檔案,拖拉到 Google Keep 中,等待所有的圖檔上傳好,就可以執行文字辨識了。

沒有留言: