什麼是 OCR?
OCR 意即光學字元辨識。這項技術能讓使用者將各種類型的文件轉換成可供搜尋的數位格式。
根據 IDC (國際數據資訊公司) 預測,全球資料量將於 2025 年超過 175 皆位元組 (zettabyte)。然而,儘管資料是帶動數位轉型的一大驅動力,所有商業資料量中卻有 80% 以上屬於非結構化格式。這類格式不外乎為手寫內容、印刷文件、電子郵件、數位影像及 PDF 檔。這些文件都必須經過人工處理,轉換成例如純文字檔等較為結構化的格式,才能用來編譯或搜尋。
此時便是 OCR 程式大顯身手的時候。OCR 會自動化處理非結構化格式轉換成機器可讀取、搜尋的文字的流程。例如,假設您曾將發票掃描存入手機載具,便已使用到這項技術。對企業而言,OCR 大幅加快了從紙本到電子資料登錄的過程。
OCR 技術的應用範圍極廣。起初 OCR 看似只能處理一些簡單事務,然而它所能發揮的用處實則相當深遠。從個人運用到小型企業,乃至超大型企業,OCR 在當今數位化世界中皆占有舉足輕重的地位。
OCR 具有哪些效益?
OCR 光學字元辨識技術在自動化軟體領域占有不可撼動的利基。只要能夠在業務工作流程的某個環節運用到 OCR,便足以推進任何產業的業務流程。不僅如此,OCR 對於任何事業層級的組織皆可貢獻相當實質的效益:
速度
OCR 軟體最大的效益在於資料登錄過程與資料處理上的極速表現。速度最快的打字高手一分鐘可打 216 個字。相較於此,安裝在合宜電腦上最快速的 OCR 軟體,每秒可辨識超過 1500 個字元。
準確性
另一個效益是準確性。若以人工進行資料登錄、資料處理、資料擷取,每一道人力介入的環節,都有可能產生人為錯誤。單就基礎軟體部分而言,OCR 的準確度約為 98%。若搭配 AI 技術,例如深度學習演算法、自然語言處理 (NLP)、智慧字元辨識 (ICR) 以及其他辨識軟體,其準確度將更為提升。
功能性
手寫文字雖無需透過光學字元辨識即可轉變成數位影像及掃描文件,但 OCR 功能更能讓這些文件便於用來編排索引、編輯與搜尋。如果您曾接收到單純掃描圖檔轉成的 PDF 檔,必定能體會無法編輯文字的苦惱。而今後無論是要處理掃描後的紙本文件、名片、手寫筆記,乃至於商店收據,OCR 都將為您分憂解勞。
成本
現在只要動動手指便能掌握天下事,因此有越來越多的企業不斷將各種資訊雲端化與數位化。然而以人工進行資料登錄、處理及擷取的成本不容小覷。與其雇用人員進行資料擷取、複製、列印等,不如選擇 OCR 來幫助您省下這些龐大的人事成本。
空間
OCR 能夠迅速且準確地協助您將全公司堆積如山的書面文件,轉成電子化歸檔且分門別類的資訊,達到無紙化的境界。拋開以往塞滿紙本檔案夾的笨重文件櫃,取而代之的是一台簡潔的伺服器平台,讓您輕鬆即可找到組織內部的任何資訊。
可編輯性
如前所述,收到純為圖檔而無法編輯文字的 PDF,實在令人頭痛。要解決這個問題,只要使用 OCR 將所有的文件轉換成 Word 等所需的檔案格式即可。如此讓文件內容更易於更新,不再需要花大把的時間進行複製、貼上及編輯。
OCR 常應用在哪些領域?
OCR 技術可在幾乎任何一種產業中實際運用於許多商業用途,尤其善於解決有關資料不正確與資料毀損的問題。
以下提供幾個範例:
銀行業
銀行是前幾批導入自動化技術與 OCR 的地方,且銀行業至今仍擁有最龐大的使用者群。資料擷取讓銀行作業流程更為簡便、快速且更有效率。
ATM 是銀行自動化與 OCR 技術的首要案例,其中最新的一項應用便是行動支票入金功能。OCR 技術品質已脫胎換骨,如今可透過電腦讀取支票,且準確辨識出帳號、簽名與金額之間的差異。事實上,支票下方的帳號字型已特別改為更適合供機器讀取。
OCR 亦能讓銀行從其他業務領域準確地擷取資料,例如抵押貸款申請書、工資單及一般貸款申請書。
保險
保險公司每天都需要應付大量的文書作業。保單建議書、新保戶建檔、保險契約更新及索賠處理全都需要文書作業。若要動用人工將全部的必備文件電子化,相關的薪資與勞動成本未免過於龐大。
OCR 軟體能讓保險業的日常工作在自動化資料擷取下加速完成。每當填妥新的保險文件,便能夠經過掃描而納入系統。新保戶現在「存在」於系統中,且於保險契約有效期間內持續存在。這表示當保戶有保單上的問題、想要變更保單內容,或者需要申請索賠時,保險公司可隨時調出其相關資訊。
醫療保健
每年處理的醫療索賠案件以數百萬計。於是便產生繁重的文書作業、繁雜的人工處理,以及繁多的錯誤 - 這對於最講求準確性的醫療業乃為大忌。病歷記錄遺失只是這個充斥著書面文件的產業中常見的問題之一。這些錯誤是促進醫療記錄數位化的最大推力。
導入 OCR 可將浩如煙海的記錄更輕鬆地轉成電子格式。它能消除人工層面的弊端,減少錯誤、加快歸建病歷記錄的過程並增加資訊的可存取性。舉凡各種醫療書表、處方記錄、臨床筆記及其他醫療文件,如今皆可視需要隨時取得。
零售
OCR 技術讓零售產業在出貨處理與接收資訊方面尤其得心應手。最常運用在擷取裝箱單上的資料、掃描訂單、發票數位化、追蹤庫存等。
OCR 程式無須假使用者之手,便能自動產生成千上萬份發票範本。搭配相機使用,可將庫存量單位 (SKU)、價格及產品名稱轉換成數位格式。
OCR 軟體還可讓顧客享有更具彈性的獎勵計畫及優惠券。透過 OCR,顧客只需掃描手中的優惠序號即可進行折抵。
人力資源
人力資源是公司架構中不可或缺的部分,其負責的業務也是數一數二耗時。預先選拔應徵者便是個很好的例子。招聘人員聘用一位新員工平均需花 3 天的時間。
OCR 軟體如何派上用場?OCR 軟體可讓招聘人員批次處理求職申請。透過程式處理,自動擷取相關資料並加以分類。招聘人員便可使用這些經過擷取的資料,依照職務要求與應徵者進行配對。
如此能為 HR 提供不少利多。其一,讓招聘人員節省寶貴的時間。其二,協助維護性別與種族平等,除了必要資格以外的條件一律排除。無意識偏見與主觀認知不再是問題。其三,招聘過程更為快速,求職者不必漫長等待結果通知,在招聘之初便為公司建立起較正面的印象。
房地產
商用與住宅房地產公司專門辦理文書作業。房地產購置、各項費用、維護記錄、賣據等,全都需要簽署並歸檔備存。而歸檔後的資料必須可供方便存取。
採用自動化技術的電子檔案櫃能自動進行分類、整理並建立必要的文件封包,在效率與速度上是任何人工檔案系統皆無法匹敵。OCR 與文件管理系統整合後,無論是影像或文字文件,任何文件都能任意搜尋。
關於 OCR 的常見問答集
OCR 是一種商業解決方案,能夠從各種來源自動擷取資料,不必透過人工登錄資料。所擷取的資料會轉換成機器可讀取的數位資訊、可編排索引且供資料處理之用。
將內容準確轉換的能力相當重要。以頁為層級進行測定的結果,大多數的 OCR 解決方案皆展現出 98-99% 的高準確率。亦即一頁 500 個字元中有 490 到 495 個字元皆正確轉換。
如此的準確性在多數情況下已非常足夠,然而高階 OCR 系統在智慧文件處理 (IDP) 的輔助下,讓準確性更臻完美。IDP 為 OCR 增添了一道人工智慧技術,以確保更高的準確性。
雖然各個 OCR 軟體多少有其差異,但就自動化流程而言基本上相同:
預處理:將紙本文件或影像檔案掃描到 OCR 軟體中加以數位化。軟體會適當地將文字邊緣圓滑化、移除瑕疵,並且擷取純文本。然後將剩下的文字轉成黑白,取代掉所有的灰影。讓文字更易於辨識且提高準確性。
文字辨識:OCR 採用多層化文字與圖案辨識、特徵偵測及特徵擷取,例如每個字特有的曲線與彎角,以清楚呈現出每一頁的內容。
後續處理:根據 OCR 引擎的基本能力高低,將文字與國際通用的字典進行比對、交叉參照上下文,以求更高的準確性。最終輸出可供整篇搜尋並編輯的數位文件。
最常見的使用案例是簡單的文件掃描,即是將印刷文字文件轉換成機器可讀取的文字文件。文件最終便能夠透過 Microsoft Word 或其他文字處理器進行編輯。
如何開始使用 OCR?
要開始使用 OCR 並導入自動化作業,需先經過數個與安裝啟用無關的步驟。為減少瓶頸與混淆情形,首先必須評估您的組織是否已做好自動化的準備。請確定您對於以下問題至少已有基本的解答:
您有何願景與策略?
您要將哪些程序自動化,衡量的方法為何?
您的組織架構為何?員工與管理結構是否能配合?
您目前使用什麼技術?從技術的角度而言,貴公司如何規劃建立組織架構?
明確而言,以上問題更偏向企業級組織的相關資訊,而非針對單一經營者,但這並不代表中小企業遭排除在外。機器人流程自動化 (RPA) 不因事業體規模而有所歧視。
一旦您對上述問題有了基本解答,請找尋雲端原生技術的 OCR 解決方案。雲端原生解決方案之所以為首選,是因為它容易與業務流程相整合、可擴縮性佳且能夠與您的企業一同成長。可在任何類型的商業環境下運作,包括全雲端、混合雲或現場環境。
最後,請試用示範軟體。在將 OCR 實際建置於企業之前,釐清您真正期待它有什麼樣的本領。整合自動化究竟能夠為您的組織創造何種效益,結果一定會讓您感到驚艷。