Mac用戶的福音:OCR新神器,一鍵轉換屏幕上的任意文本
在機器學習和計算機視覺領域,光學字符識別(optical character recognition, OCR)長期以來都是人們研究的重要主題之一。OCR 很簡單,就是將文檔照片或場景照片轉換為機器編碼的文本。
關于 OCR 的工具,機器之心此前也介紹過不少,如 2020 年頻頻登上 Github Trending 日榜月榜的開源項目 PaddleOCR,目前該項目已經獲得 12.6k star 量。此外還有曠視研究院與華中科大聯合研發的基于分割的場景文字識別方法 TextScanner,不僅可以正確讀取字符數據,還在一系列相關文字基準數據集上取得了當前最佳性能。
近日,GitHub 上又出現了一個非常火的 OCR 工具 macOCR,短短一天時間,就收獲了近800贊。macOCR 是一個開源命令行應用程序,用戶可以使用它將屏幕上的任何文本轉換為剪貼板上的文本。

項目地址:https://github.com/schappim/macOCR
當你調用 ocr 命令時,一個類似于光標的「屏幕捕獲」(screen capture)就會出現。如此一來,邊框內的任何文本都將轉換為純文本。
項目作者提供了如下動圖展示,將圖片文本轉換為了文本。

對于 macOCR 命令行應用程序,網友給予了高度評價。網友 @mromanuk 表示:「我很沮喪的是,一直以來沒有簡單的方法來提取 Mac 圖片中的文本。現在 macOCR 彌補了這一空白!這一功能應該在 MacOS 中集成或隨時可用。」

安裝使用
用戶使用的操作系統需要是 macOS Catalina 及以上版本。
用戶可以選擇編譯以下 repo 中的代碼,或者下載預先構建的二進制(分為蘋果 Silicon 處理器和英特爾處理器)并放在自己的路徑中。
蘋果 Silicon 處理器安裝代碼:
- curl -O https://files.littlebird.com.au/ocr.zip;
- unzip ocr.zip;
- sudo cp ocr /usr/local/bin;
英特爾處理器安裝代碼:
- curl -O https://files.littlebird.com.au/ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;
- unzip ocr-EPiReQzFJ5Xw9wElWMqbiBayYLVp.zip;
- sudo cp ocr /usr/local/bin;
當首次運行 macOCR app 時,用戶可能需要「允許該 app 訪問你的屏幕」,示意圖如下:

項目作者
macOCR 的創建者是 Marcus Schappi,現為 Chick Global 的 CEO 和聯合創始人。他還曾是 Little Bird Electronics 和 Geek Ammo 等其他其他幾家公司的聯合創始人。
Schappi 曾在澳大利亞巴克學院、悉尼科技大學以及悉尼大學就讀。其中,在攻讀悉尼科技大學工程創新、機電一體化及創業學士學位期間,他沒有獲得該學位。但由于其創建的海嘯預警軟件吸引了媒體的廣泛關注,他最終被悉尼大學研究生項目錄取,攻讀設計科學碩士(設計計算及計算)。
Schappi 在軟件開發、移動應用以及 IOS 開發等方面具有嫻熟的技能。
目前,他的 GitHub 主頁上有多個項目,比如 macOCR、kod-website、dropcam 等。
