優秀工具!用于機器學習的10種文本注解工具和服務
本文轉載自公眾號“讀芯術”(ID:AI_Discovery)。
從搜索引擎、情緒分析到虛擬助手和聊天機器人,文本注解工具和服務應用廣泛。
在人工智能研發行業,注解數據如同黃金,而大量優質注解數據則猶如一座金礦。對一個團隊來說,查找或創建此類數據代價高昂、任務艱巨。幸運的是,各種文本注解工具和服務可以為你提供所需數據,包括實體提取、詞性標注、情感分析等。
Tagtog
Tagtog公司總部位于波蘭,是一種文本注解工具,可自動或手動注解文本。Tagtog不僅支持本機PDF注解,還支持預先訓練的自動注解文本NER模型。除了Tagtog工具,該公司還擁有囊括各領域的專家網絡,可以對專門的文本進行注解。
Lionbridge AI
Lionbridge專門從事語言學研究,擁有一個多語言注解人員社區,規模達100萬人,精通300多種語言。文本注解服務包括文本提取、情感分類、實體注解、命名實體識別和語言成分分析等。此外,Lionbridge還提供了一個自定義數據注解軟件,你的團隊可以授權并將其用于各種文本注解項目。
Scale
Scale公司位于舊金山,是一家提供計算機視覺和NLP數據注解服務的公司。通過將人工工作和Scale平臺相結合,該公司提供以下文本注解服務:OCR轉錄、文本分類和比較。
Dandelion API
Dandelion API總部位于意大利,提供各種自動文本注解工具。雖然這家公司剛剛起步,但他們的工具可以用于實體提取、情感分析、文本和內容分類。
KConnect
許多AI研發人員面臨的問題之一是如何訪問高度專業化的AI培訓數據。KConnect團隊致力于幫助注解人員快速有效地對醫療數據進行分類和注解。具體來說,KConnect為醫學信息提供語義注解、文本分析和語義搜索服務。
Clickworker
Clickworker是一家總部位于美國和德國的眾包公司,員工基數大,能夠完成各種各樣的任務。他們提供的文本注解服務有:情感分析和分類。
LightTag
LightTag文本注解工具是一個供注解者和公司在內部標記文本數據的平臺。雖然初始包是免費的,但每個包級別的成本都有所上升,并且每個月的注解數量也有所限制,每月免費提供1000個注解。
ParallelDots Text Annotation APIs
ParallelDots是眾多文本注解工具和API的供應商。他們的解決方案包括:情感分析、情緒分析、關鍵字提取和命名實體識別。
圖源:Google
Appen
Appen眾包員工來自不同國家,數量龐大,是多種AI培訓數據的供應商。例如,他們文本注解服務包括:情感注解、意圖注解和命名實體注解。
Dataturks Text Annotation Tools
借助用于數據注解的內部API和數千家外包伙伴公司,Dataturks提供了各種圖像注解和文本注解工具。具體來說,他們的文本標記能力包括:文本分類、命名實體識別和詞性標注。
希望你能找到適合自己的工具。