50+實用的機器學習和預測API(2018年版)
譯文【51CTO.com快譯】本文全面介紹了臉部及圖像識別、文本分析、自然語言處理(NLP)、情緒分析、語言翻譯、機器翻譯及預測等方面的50多個API。
API是一組用于構建應用軟件的例程、協議和工具。這已是KDnuggets第三次撰寫本文,去掉了2017年版已叫停的API,補充了新的API。所有API分類成幾個新興的應用類別:
- 臉部及圖像識別
- 文本分析、NLP、情緒分析
- 語言翻譯
- 機器學習及預測
在每一類應用里面,按首字母順序來介紹。API概述基于其網址上顯示的信息。看看這些API可以派什么用場!如果我們沒有收錄某個流行的、活躍的API,歡迎留言交流。
一、臉部及圖像識別
1.Animetrics Face Recognition:該API可用來檢測圖片上的人臉,并將它們與一組已知的臉部進行比對。該API還能為可搜索的圖庫添加對象或刪除圖庫的對象,為對象添加臉部或刪除對象的臉部。
2.Betaface:這是一項臉部識別和檢測Web服務。功能包括:多臉部檢測、臉部修剪、123 個臉部點(22 個基本,101 個高級)檢測、臉部驗證、識別以及超大數據集的相似度搜索。
鏈接:https://www.betaface.com/wpa/
3.Eyedea Recognition:專注于高端計算機視覺解決方案,主要關注目標檢測和目標識別軟件。這項識別服務提供眼睛、臉部、車載、版權和車牌檢測。該API的主要價值在于可立即了解目標、用戶和行為。
4.Face++:這項臉部識別和檢測服務提供了可以用于應用的檢測、識別和分析。用戶可以通過調用該API來訓練程序、檢測臉部、識別臉部、分組臉部、創建臉部集、創建群組和獲取信息等。
鏈接:https://www.faceplusplus.com/
5.FaceMark:該API 能夠檢測正面照片上的 68 個點以及側臉照片上的 35 個點。
鏈接:http://apicloud.me/apis/facemark/docs/
6.FaceRect:這是一套功能強大、完全免費的臉部檢測 API。該API可以找到一張照片上的臉部(正面或側面)或多張臉,為找到的每一張臉生成JSON輸出。此外,FaceRect可以為每一張檢測到的臉找到臉部特征(眼睛、鼻子和嘴)。
鏈接:http://apicloud.me/apis/facerect/demo/
7.Google Cloud Vision API:該API由TensorFlow等強大的平臺驅動,讓模型能夠學習和預測圖像內容。它可以幫你找到青睞的圖像,并迅速獲得豐富的注釋。它將圖像分成數千個類別(比如:船、獅子和埃菲爾鐵塔),檢測相關表情的臉部,識別使用多種語言的印刷文字。
鏈接:https://cloud.google.com/vision/
8.IBM Watson Visual Recognition:可理解圖像的內容――視覺概念標記圖像、尋找人臉、給出年齡和性別的近似值、尋找集合中的相似圖像。你還可以通過自行創建自定義概念來訓練該服務。
鏈接:https://www.ibm.com/watson/developercloud/visual-recognition.html
9. Imagga:提供的API可自動為圖像賦予標簽,因而讓圖像易于查找。它基于圖像識別平臺即服務(PaaS)。
鏈接:https://imagga.com/solutions/auto-tagging.html
10.Kairos:該平臺讓你可以將情緒分析和臉部識別迅速添加到你的應用程序和服務中。
鏈接:https://www.kairos.com/docs/api/
11.Microsoft Cognitive Service - Computer Vision:這個基于云的API可以基于輸入和用戶選擇,以不同的方式分析視覺內容。比如說,基于內容標記圖像;分類圖像;檢測人臉并返回坐標;識別特定領域的內容;生成內容的描述;識別圖像中找到的文本;標記成人內容。
鏈接:https://www.microsoft.com/cognitive-services/en-us/computer-vision-api
12.Skybiometry Face Detection and Recognition:提供臉部檢測和識別服務。該API的新版本包括區分墨鏡和透明眼鏡的功能。
鏈接:https://skybiometry.com/Documentation/
二、文本分析、NLP、情緒分析
1.Bitext:提供了市面上最精確的多語言的、基于主題的情緒分析。目前提供四種語義服務:實體和概念提取、情緒分析和文本分類。該API支持8種語言。
鏈接:https://www.bitext.com/text-analysis-api-2/#How-accurate-is-the-analysis
2.Diffbot Analyze:提供開發者工具可分析、識別和提取來自任何網頁的主要內容和章節。
鏈接:https://www.diffbot.com/dev/docs/analyze/
3.Free Natural Language Processing Service:這項免費服務包括情緒分析、內容提取和語言檢測。這是大型云API市場mashape.com上的一個流行的數據 API。
鏈接:https://market.mashape.com/loudelement/free-natural-language-processing-service
4.Google Cloud Natural Language API:可分析文本的結構和含義,包括情緒分析、實體識別和文本標注。
鏈接:https://cloud.google.com/natural-language/reference/rest/
5. Watson Alchemy Language:分析文本,從概念、實體、關鍵字、類別、關系和語義角色等內容提取元數據。
鏈接:https://www.ibm.com/watson/services/natural-language-understanding/
6.MeaningCloud Text Classification:該API可執行預分類任務,比如:提取文本、分詞、移除停用詞和詞形還原。
鏈接:https://www.meaningcloud.com/developer/text-classification
7. Microsoft Cognitive Service - Text Analytics:可檢測來自文本的情緒、關鍵短語、主題和語言。與該API屬于同一類(面向語言的認知服務)的其他API包括:Bing Spell Check、Language Understanding、Linguistic Analysis和Web Language Model。
鏈接:https://www.microsoft.com/cognitive-services/en-us/text-analytics-api
8.nlpTools:這是基于充分利用REST的HTTP Web服務的簡單JSON,用于自然語言處理。它可解碼在線新聞媒體,用于情緒分析和文本分類。
鏈接:http://nlptools.atrilla.net/web/api.php
9.Geneea:可對提供的原始文本、從特定URL提取的文本或來自直接提供的文檔的文本執行分析(自然語言處理)。
鏈接:https://api.geneea.com/
10.Thomson Reuters Open Calais™:Calais使用自然語言處理、機器學習及其他方法,將你的文檔與實體(人、地點和組織等)、事實(人“x”為公司“y”工作)和事件(人“z” 在日期“x”被任命為公司“y”的主席)進行歸類和鏈接。
鏈接:http://www.opencalais.com/opencalais-api/
11.Yactraq Speech2Topics:這項云服務可通過語音識別和自然語言處理,將音頻視覺內容轉換成主題元數據。
三、語言翻譯
1.Google Cloud Translation:可以動態地在數千個語言對之間翻譯文本。該API讓網站和程序可以通過編程的方式與該翻譯服務整合起來。
鏈接:https://cloud.google.com/translate/docs/
2.Google Cloud SPEECH-TO-TEXT:讓開發人員能夠以一種易于使用的API來運用強大的神經網絡模型,將音頻轉換成文本。API可識別120種語言及變種,支持你的全球用戶群。
鏈接:https://cloud.google.com/speech-to-text/
3.IBM Watson Language Translator:可將文本從一種語言翻譯成另一種語言。該服務提供了多種特定領域的模型,你可以基于獨特的術語和語言進行定制。比如,可以用客戶自己的語言與他們進行交流。
鏈接:http://www.ibm.com/watson/developercloud/language-translator.html
4.MotaWord:這是一種快速人工翻譯平臺。它提供70多種語言的翻譯。該API還可以讓開發人員獲得每種翻譯的報價、提交翻譯項目(連同文檔和樣式指南)、跟蹤翻譯項目的進度以及實時獲得活動信息。
鏈接:https://www.motaword.com/developer
5.WritePath Translation:該API讓開發人員可以訪問WritePath的功能,并與其他應用程序整合起來??梢杂迷揂PI執行的操作包括:統計字數、發布翻譯文檔以及檢索已翻譯的文檔和文本。
鏈接:https://www.writepath.co/en/developers
6.Houndify:通過一種可始終學習的獨立平臺,將語音和對話信息整合到你的產品中。
7. IBM Watson Conversation:可構建能明白自然語言的聊天機器人,并將它們部署到任何設備上的消息傳遞平臺和網站。與該API屬于同一類(面向語言的認知服務)的其他API包括:Dialog、Natural Language Classifier、Personality Insights、Document Conversion和Tone Analyzer。
鏈接:https://www.ibm.com/watson/developercloud/conversation.html
8. IBM Watson Speech:包括語音轉換成文本和文本轉換成語音(比如,將聯系中心中的呼叫翻譯成文字,或創建語音控制的應用程序。)
鏈接:https://www.ibm.com/watson/developercloud/speech-to-text.html
四、機器學習和預測
1.Amazon Machine Learning:可用來查找數據中的模式。該API的幾種典型應用包括:用于檢測欺詐、預測需求、針對性營銷和點擊預測。
鏈接:https://aws.amazon.com/documentation/machine-learning/
2.BigML:它為云托管的機器學習和數據分析提供了一種服務。用戶可以通過標準的 HTTP ,使用基本的監督和無監督機器學習任務來設置數據源、創建預測模型。
3.Google Cloud Prediction:提供了一種充分利用REST的API,用于構建機器學習模型。這些工具有助于分析你的數據,為應用程序增加各種功能,比如客戶情緒分析、垃圾郵件檢測和推薦系統等。
鏈接:https://cloud.google.com/prediction/docs/
4.Guesswork:為電子商務網站提供了產品推薦引擎。Guesswork使用一種在Google Prediction API上運行的語義規則引擎,準確地預測客戶意圖。
5.Hu:toma:可幫助全球的開發人員構建深度學習聊天機器人,并從中獲利,為此它讓開發人員免費訪問一種專有平臺,該平臺提供了創建和共享對話式AI的工具和渠道。
6.IBM Watson Retrieve and Rank:開發人員可以將數據裝入到該服務,使用已知的相關結果來訓練機器學習模型(Rank)。服務輸出包括相關文檔和元數據列表。比如,聯系中心的接線員還能迅速找到答案,縮短平均的呼叫處理時間。
鏈接:http://www.ibm.com/watson/developercloud/retrieve-rank.html
7.indico:提供文本分析(比如情緒分析、推特參與和情緒)以及圖像分析(比如臉部情緒和臉部定位)。indico API可免費使用,不需要訓練數據。
8.Microsoft Azure Cognitive Service API:它在取代Azure Machine Learning Recommendations服務,后者基于預測分析提供解決方案。它為客戶提供了個性化產品推薦,可提升銷售成績。新版本有新的功能,比如支持批量處理、更好的API Explorer、更整潔的API界面、更一致的注冊/計費體驗等。
鏈接:https://azure.microsoft.com/en-au/services/cognitive-services/
9.Microsoft Azure Anomaly Detection API:使用時間上均勻間隔的數值來檢測時間序列數據中的異常。比如說,監測計算中的內存使用時,上升趨勢可能要引起注意,因為這可能表明內存泄露。
鏈接:https://gallery.cortanaintelligence.com/MachineLearningAPI/Anomaly-Detection-2
10.Microsoft Cognitive Service - QnA Maker:將信息提煉成對話式、易于瀏覽的答案。與該API屬于同一類(知識認知服務)的其他API包括:Academic Knowledge、Entity Linking、 Knowledge Exploration和Recommendations。
鏈接:https://www.microsoft.com/cognitive-services/en-us/qnamaker
11.Microsoft Cognitive Service - Speaker Recognition:讓你的應用程序能夠知道誰在說話。與該API屬于同一類(面向語音的認知服務)的其他API包括:Bing Speech(可將語音轉換成文本并將文本轉換成語音,并理解其意圖)和Custom Recognition。
鏈接:https://www.microsoft.com/cognitive-services/en-us/speaker-recognition-api
12.MLJAR:為設計、開發和部署模式識別算法提供了一種服務。
13.NuPIC:這是用Python/C++編寫的開源項目,實現了Numenta的皮質學習算法,由NuPIC社區維護。該API讓開發人員可以處理原始算法、將多個區域(包括層次結構)串聯起來,并利用其他平臺功能。
14.PredicSis:通過預測分析,獲取大數據的強大洞察力,并提升營銷效果。
15.PredictionIO:這是在Apache Spark、HBase和Spray上構建的開源機器學習服務器,采用Apache 2.0許可證發布。典型的API方法包括:創建和管理用戶及用戶記錄、檢索項目和內容、創建和管理基于用戶的推薦。
鏈接:http://predictionio.incubator.apache.org/index.html
16.RxNLP – Cluster Sentences and Short Texts:這是一項文本挖掘和自然語言處理服務。其中一個API:Cluster Sentences API可以對句子(比如來自多個新聞報道的句子)和簡短文本(比如來自推特和Facebook 狀態更新的帖子)進行分組。
鏈接:http://www.rxnlp.com/api-reference/cluster-sentences-api-reference/
17.Recombee:提供了這樣一項服務:借助充分利用REST的API,使用數據挖掘、查詢語言和機器學習算法(比如協作過濾和基于內容的推薦)。
原文標題:50+ Useful Machine Learning & Prediction APIs, 2018 Edition,作者:Pedro Lopez
【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】