成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

在Data Collector中如何使用TensorFlow實現實時機器學習

譯文
人工智能 機器學習
本文將向您簡單介紹TensorFlow(TF)模型的相關知識,Evaluator的用法示例。據此,您可以提供出經過訓練的TF模型,并在無需額外編碼的情況下,生成各種預測和分類。

 

【51CTO.com快譯】

不知您是否已注意到,只有當業務用戶和應用程序能夠訪問到不同來源的原始數據和聚合數據,并及時生成基于數據驅動的洞見時,他們才能真正認識到現代化DataOps平臺的真正價值。憑借著機器學習(Machine Learning,ML)技術,數據分析師和科學家們可以利用各種歷史數據,在離線或實時的狀態下,使用TensorFlow等技術,協助做出更好的數據驅動類業務決策。

在本文中,您將學習到:如何使用StreamSets Data Collector 3.5.0(請參見-- https://streamsets.com/products/sdc)和StreamSets Data Collector Edge(請參見-- https://streamsets.com/documentation/datacollector/latest/help/datacollector/UserGuide/Edge_Mode/EdgePipelineTypes.html#concept_c14_m4r_4bb)最新發布的TensorFlow Evaluator(請參見--https://streamsets.com/documentation/datacollector/latest/help/datacollector/UserGuide/Processors/TensorFlow.html#concept_otg_csh_z2b),將TensorFlow(TF)模型用于各種預測和分類。

在深入討論細節之前,我們先一起理清幾個基本概念。

機器學習

Arthur Samuel將其描述為:“是一個研究如何讓計算機在無需事先做好明確編程的情況下,自動開展學習的領域。”隨著機器學習技術的發展,如今的電腦已經能夠做出與人類相似、甚至更好的預測。在解決問題的方式上,機器學習通常分為兩大類:

監督學習

維基百科的定義為:監督學習是一項能夠根據給定示例中的“輸入輸出對(input-output pair)”,將實際輸入映射到輸出的學習任務。當歷史數據被根據其結果進行了標記之后,它可以通過構建一個準確的模型,來預測各種結果。

監督學習能夠解決的常見業務問題包括:

  • 二選一分類(學習預測分類值)
    • 客戶是否會購買某個產品?
    • 某種癌癥病例是惡性還是良性?
  • 多種分類(學習預測分類值)
    • 在給定的文本中是否帶有病毒、或內容不健康?
    • 給定的花卉屬于哪種科目和種類?
  • 回歸(學習預測連續值)
    • 房屋的預售價格是多少?
    • 明天舊金山是幾度?

無監督學習

無監督學習處理的是我們幾乎不太了解、或完全不知道輸出的問題。由于需要構建的模型無法使用到過往數據的標簽,因此它需要根據數據中變量之間的關系,對數據進行聚類以得出結構。

無監督學習的兩種常見方法分別是:K-means聚類(請參見-- https://en.wikipedia.org/wiki/K-means_clustering)和DBSCAN(請參見-- https://en.wikipedia.org/wiki/DBSCAN)。

值得注意的是:Data Collector和Data Collector Edge中的TensorFlow Evaluator當前都僅支持監督學習模型。

神經網絡與深度學習

神經網絡是機器學習算法的一種形式,它可以學習和使用某種受到人腦結構啟發而設計出的計算模型。與其他諸如決策樹、邏輯回歸等機器學習算法相比,神經網絡具有很高的準確性。而深度學習是神經網絡的子集,它允許網絡在嵌套的層次結構中,表示出各種各樣的概念。常見的神經網絡和深度學習應用程序包括:

  • 計算機視覺/圖像識別/物體檢測
  • 語音識別/自然語言處理(NLP)
  • 推薦系統(產品推介、婚介交友等)
  • 異常檢測(網絡安全等)

TensorFlow

由Google Brain團隊創建的TensorFlow,是專為深度神經網絡而設計的開源式機器學習框架。TensorFlow不但能夠在Windows和Mac OS上,也能夠在CPU、GPU和TPU上,支持可擴展、且可移植式的模型訓練。目前,它是GitHub上最受歡迎、且最活躍的機器學習項目之一。

Data Collector中的TensorFlow

通過TensorFlow Evaluator,您可以創建出承載數據/功能的管道,并在包含的環境中產生各種預測或分類。您無需通過初始化HTTP或REST API調用,便可訪問那些被公布為Web服務的機器學習模型。例如,數據在被存儲到最終目的地之前,往往會經過若干個階段,而Data Collector的各種管道就可以實時地檢測到諸如欺詐性交易、或是通過對文本進行自然語言處理,以采取進一步的處理或決策。

此外,借助Data Collector Edge,您可以在Raspberry Pi(請參見--https://www.raspberrypi.org/)或其他支持此類平臺(請參見--https://streamsets.com/documentation/datacollector/latest/help/datacollector/UserGuide/Edge_Mode/SupportedPlatforms.html#concept_yxr_b5q_4bb)的設備上,運行啟用TensorFlow機器學習的管道。例如,檢測高風險地區的洪水等自然災害發生的概率。

應用案例

讓我們來考慮一個如何將乳腺癌腫瘤分類為惡性或良性的用例。通過使用由scikit-learn模型(請參見--http://scikit-learn.org/stable/modules/generated/sklearn.datasets.load_breast_cancer.html)提供的乳腺癌經典數據集,我使用Python構建列一個可用于訓練和導出的簡單TF模型。您可以通過鏈接—https://github.com/iamontheinet/datascience/blob/master/Breast_Cancer/breast_cancer_training.py,來查看我在GitHub上的代碼。作為一個最簡單的用例,我在模型的創建和訓練中,只用到了幾個隱藏層。不過,您可以留意其中的TensorFlow SavedModelBuilder(請參見--https://www.tensorflow.org/api_docs/python/tf/saved_model/builder/SavedModelBuilder)是如何使用支持的語言(如Python),以及諸如Jupiter Notebook(請參見--http://jupyter.org/)的交互式環境,來導出和保存模型的。

在TensorFlow SavedModelBuilder訓練并導出模型后,您只要將模型保存在Data Collector或Data Collector Edge可以訪問到的位置,就可以非常簡便地在數據流管道中進行預測或分類了。

管道概述

下圖展示了上述用例的管道細節。其中:

  • 目錄來源(Directory Origin):
    • 此處會從.csv文件中加載乳腺癌的數據記錄。注意:您可以將此處輸入的數據源輕松地替換為其他來源,包括:Kafka、AWS S3、MySQL等。
  • 場轉換器(Field Converter):
    • 該處理器將對所有帶有乳腺癌記錄特征的輸入,從字符串到浮點型在均值上進行各種轉換。
  • TF評估器(TensorFlow Evaluator,其配置如下圖):

     

  • 表達式評估器(Expression Evaluator):
    • 該處理器評估模型的輸出與分類值是0還是1(通常存儲在輸出字段TF_Model_Classification中),并且據此分別創建一個具有“良性”或“惡性”特征“條件(Condition)”的新記錄字段。
  • 流選擇器(Stream Selector):
    • 通評估癌癥的狀況(良性或惡性),它將記錄發送給各個Kafka生產者(producer)。
  • Kafka生產者(Kafka producer):
    • 各種輸入記錄連同模型的輸出/分類值,會被有條件地路由到兩個Kafka生產者處,以進一步處理與分析。(請注意:此處的目標可以被輕松地替換為其他目標,包括:AWS S3、MySQL、以及NoSQL等)

值得注意的是:相對于TensorFlow Evaluator產生的模型輸出,該示例的管道階段其實是選配的。您可以根據用例的要求,與其他處理器和目標進行相互替換。

管道的執行

在預覽(或執行)管道時,那些輸入的乳腺癌記錄,會通過上述數據流的管道階段進行傳遞,并包含針對TensorFlow模型所提供的服務。發送給Kafka生產者的最終輸出記錄(如上圖所示),會包括用于分類乳腺癌的模型特征;在用戶定義的字段TF_Model_Classification中,輸出的模型值(0或1);以及由表達式評估器創建的字段條件,進而表示癌癥狀況是良性還是惡性。

總結

上面給大家簡單地介紹了由Data Collector 3.5.0新發布的TensorFlow Evaluator的用法。通過該evaluator,您可以提供出經過訓練的TF模型,進而在無需額外編寫任何自定義代碼的情況下,生成各種預測和分類。

原標題:Real-Time Machine Learning With TensorFlow in Data Collector,作者: Dash Desai

【51CTO譯稿,合作站點轉載請注明原文譯者和出處為51CTO.com】


 

責任編輯:龐桂玉 來源: 51CTO
相關推薦

2019-01-24 15:30:09

TensorFlow機器學習

2018-09-13 09:00:00

FacebookSpiral機器學習

2021-11-02 09:40:50

TensorFlow機器學習人工智能

2023-11-17 09:35:58

2017-05-17 08:24:08

TensorFlow機器學習線性回歸

2017-04-08 17:32:39

人工智能喬丹Ray

2018-08-02 08:45:48

物聯網機器學習Tensorflow

2023-11-26 09:10:34

WebSocketgreeting?在線用戶

2017-12-28 09:22:24

機器學習應用生活

2022-03-02 09:11:09

機器學習網絡

2022-05-30 10:14:10

jupyter

2012-12-25 09:36:11

Storm大數據分析

2017-09-22 11:45:10

深度學習OpenCVPython

2020-01-15 12:43:51

人工智能機器學習工程師

2024-09-02 09:31:19

2015-06-16 16:49:25

AWSKinesis實時數據處理

2020-05-19 14:29:50

機器學習TensorFlow

2018-03-15 11:50:53

機器學習入門Tensorflow

2020-05-19 09:00:26

機器學習人工智能TensorFlow

2017-11-27 17:29:43

深度學習TensorFlow安卓設備
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 欧美综合一区二区三区 | 欧美成视频 | 欧美三级在线 | 91精品亚洲| 草久免费视频 | 伊人网综合 | 人人爽日日躁夜夜躁尤物 | 久久久久国产精品一区三寸 | 国产精品久久久久久久久久妇女 | 午夜精品久久 | 日韩精品一区二区三区中文在线 | 欧美在线一级 | 亚洲三级在线观看 | 欧美日韩在线一区二区三区 | 亚洲免费在线观看 | 免费视频一区二区 | 精品国产91 | 亚洲高清一区二区三区 | 国产亚洲欧美日韩精品一区二区三区 | 久久成人18免费网站 | jizjizjiz中国护士18 | 日本久久一区二区三区 | 欧美video | 91免费看片| 成人精品福利 | 国产一在线观看 | 欧美一级淫片免费视频黄 | 欧美一区二 | 国产综合精品一区二区三区 | 欧美日韩高清在线一区 | 成人精品在线 | 午夜影院 | 在线免费毛片 | 久久综合一区二区三区 | 亚洲欧美日本国产 | 4h影视 | 国产中文字幕网 | 日韩精品在线播放 | 毛片高清 | 亚洲精品视频在线看 | 夜夜摸夜夜操 |