常看電腦玩物分享 Evernote 使用心得的朋友,一定知道 Evernote 筆記服務一直以來有一個特色是可以「搜尋」辨識出照片上包含的中文印刷體文字,以及英文的手寫、印刷體文字,而這樣一來就可以利用在許多「真實生活紙本資料」的收納上。
例如我在「不再找不到東西的整理術:我用 Evernote 收納這些生活雜物」這篇總整理文章中提到的「名片收納」、「讀書心得」、「票券單據整理」等等,都因為有了「辨識圖片中印刷體文字」的功能,而有了更彈性的利用方式。就像本文開頭圖片所「收納」的菜單,未來可以在 Evernote 中搜尋關鍵字找出有某一道菜色的所有菜單照片。
那麼「手寫」文字呢?很多時候我把臨時筆記寫在紙片便利貼上,拍照收納到 Evernote 後,我當然也希望以後可以「搜尋」到這些內容。而原本以為 Evernote 只能搜尋手寫的英文等語言,但最近看到 Evernote 台灣官方部落格提到「Evernote 的手寫辨識加上近期新增的中文,已經可以支援 24 種語言」。這當然讓我想要立刻來試試看效果如何。
對於 Evernote 如何去辨識照片上的「手寫中文」,有興趣的朋友請參考 Evernote 官方網站的說明文章:「Evernote 手寫辨識解密!從拉丁語系到中日韓手寫」。我這邊不談原理,只做目前的實際使用效果測試報告。
首先我先手寫了一張比較簡單的便條,把這張紙便條拍照存入 Evernote 筆記,接著試著搜尋看看照片上的手寫中文。(附註: Evernote 要解析出照片內的文字內容,需要同步後等待一段不等的時間,然後才能搜尋辨識。)
在下面這兩張圖片範例中, Evernote 無法辨識出我寫的「電腦玩物」和「異塵」兩個字,但是可以辨識並搜尋出「部落格」、「行者」這兩個手寫中文。
我試著寫更多中文來試試看,在下面這兩則照片筆記中,前一則我盡可能寫得比較整齊,後一則故意寫得潦草。
而測試結果也證明後面一則的手寫中文內容幾乎完全辨識不出來,而前一則文字稍微整齊方正的,則有相對來說很大的辨識成功率。
在寫得比較整齊的這張手寫照片中,像是「桌面」、「裁切」、「工具」、「拖拉」、「完成」、「比例」等等比較偏名詞、動詞的句子中的關鍵字,都能夠辨識成功,在 Evernote 筆記裡可以用搜尋的方式,找出這些對應筆記上的文字。
(圖片裡黃色螢光部分,不是我加的,而是 Evernote 成功辨識出文字內容時,自動添加在上面的標示)
不過這似乎有點奇怪,為什麼有些感覺寫得清楚的文字,反而無法正確辨識出來?
經過我一天的幾次反覆測試,「合理的猜想」是 Evernote 的手寫中文辨識起步先從「簡體中文」資料庫分析起,所以上面那些可以辨識出來的繁體手寫中文,其實是因為這些關鍵字在簡體中文裡也是一樣的寫法。
可是相對的,像是「为了」、「适当」、「视窗」、「适合」這些感覺也寫得很清楚,但是卻無法在我的筆記照片上辨識出來的中文,他們的共通特性就是繁體寫法與簡體的寫法不同。
在你的 Evernote 網頁端帳戶設定中,可以在「個人設定」選擇「辨識語言」,這邊相信台灣用戶大多會選擇「繁體中文 + English 」,這樣就能辨識 PDF 、 照片上的繁體中文、英文內容,如果是標準的印刷體文字,這部分的辨識準確度很高。
而目前的 Evernote 軟體確實是可以支援「手寫」的繁體、簡體中文辨識了,不過這個功能應該還在慢慢地改進成長中,而成長的開始,看起來應該是先從簡體中文的資料庫建構起,但相信未來也會擴及到繁體中文領域,各位台灣的 Evernote 愛用者,還是可以期待一下。
或者你可以自己不時測試看看 Evernote 的中文手寫辨識是否有持續進步。也或許我一個人的測試報告不夠完整,大家也可以自己試試看,並歡迎在本文回報討論你筆記中的手寫中文辨識搜尋結果。
This entry passed through the Full-Text RSS service — if this is your content and you're reading it on someone else's site, please read the FAQ at fivefilters.org/content-only/faq.php#publishers.