成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

幾行 Python 代碼就可以提取數(shù)百個(gè)時(shí)間序列特征

開(kāi)發(fā) 前端
時(shí)間序列數(shù)據(jù)是隨著時(shí)間的推移反復(fù)捕獲的變量值,隨著時(shí)間的推移可以產(chǎn)生一系列的按時(shí)間順序索引的數(shù)據(jù)點(diǎn)。在時(shí)間序列中,數(shù)據(jù)具有自然的時(shí)間順序,即一個(gè)變量在特定時(shí)間的值依賴(lài)于過(guò)去的值。

傳統(tǒng)的機(jī)器學(xué)習(xí)算法不能捕捉時(shí)間序列數(shù)據(jù)的時(shí)間順序。數(shù)據(jù)科學(xué)家需要執(zhí)行相關(guān)的特征工程,將數(shù)據(jù)的重要特征捕獲到幾個(gè)指標(biāo)中。生成大量的時(shí)間序列特征并從中提取相關(guān)特征是一項(xiàng)耗時(shí)且繁瑣的工作。

python的tsfresh包可以為時(shí)間序列數(shù)據(jù)生成標(biāo)準(zhǔn)的數(shù)百個(gè)通用特性。在本文中,我們將深入討論tsfresh包的使用。

tsfresh 是一個(gè)可以生成數(shù)百個(gè)相關(guān)的時(shí)間序列特征的開(kāi)源包。 從 tsfresh 生成的特征可用于解決分類(lèi)、預(yù)測(cè)和異常值檢測(cè)用例。

tsfresh 包提供了對(duì)時(shí)間序列數(shù)據(jù)執(zhí)行特征工程的各種功能,包括:

  • 特征生成
  • 特征選擇
  • 與大數(shù)據(jù)的兼容性

安裝tsfresh 也非常的簡(jiǎn)單,官方提供了pip和conda的安裝方式:

pip install -U tsfresh# orconda install -c conda-forge tsfresh

1、特征生成

tsfresh 包提供了一個(gè)自動(dòng)特征生成 API,可以從 1 個(gè)時(shí)間序列變量中生成 750 多個(gè)相關(guān)特征。 生成的特征廣泛,包括:

  • 描述性統(tǒng)計(jì)(平均值、最大值、相關(guān)性等)
  • 基于物理的非線性和復(fù)雜性指標(biāo)
  • 數(shù)字信號(hào)處理相關(guān)功能
  • 歷史壓縮特征

使用 tsfresh.extract_features() 函數(shù)可以為 1 個(gè)時(shí)間序列變量從多個(gè)域生成 789 個(gè)特征。

import pandas as pdfrom tsfresh import select_features# Read the time-series datadf = pd.read_excel("train.xlsx", parse_dates=['date']).set_index('date')# automated feature generationfeatures = tsfresh.extract_features(df, column_id="date", column_sort="date")

因?yàn)樘卣魈啵跃唧w的所有特征的介紹請(qǐng)查看官方文檔。

2、特征選擇

tsfresh 包還提供了一個(gè)基于假設(shè)檢驗(yàn)的特征選擇實(shí)現(xiàn),可以用于識(shí)別目標(biāo)變量的相關(guān)特征。 為了限制不相關(guān)特征的數(shù)量,tsfresh 包含了fresh算法(fresh 代表基于可擴(kuò)展假設(shè)測(cè)試的特征提取)。

tsfresh.select_features() 函數(shù)用戶可以實(shí)現(xiàn)特征選擇。

3、兼容大數(shù)據(jù)

當(dāng)我們有大量的時(shí)間序列數(shù)據(jù)時(shí)。tsfresh還提供api來(lái)擴(kuò)展特征的生成/提取,以及針對(duì)大量數(shù)據(jù)的特征選擇實(shí)現(xiàn):

  • 多線程處理:默認(rèn)tsfresh包可以將特征生成/提取和特征選擇在多核上并行執(zhí)行。
  • 分布式框架:tsfresh還實(shí)現(xiàn)了一個(gè)自己的分布式框架,將特征計(jì)算分布在多臺(tái)機(jī)器上加快計(jì)算速度。
  • Spark兼容:tsfresh還可以使用spark或Dask來(lái)處理非常大的數(shù)據(jù)。

最后總結(jié),tsfresh可以通過(guò)幾行Python代碼中為時(shí)間序列特性生成和選擇相關(guān)特性。它會(huì)自動(dòng)從基于時(shí)間的數(shù)據(jù)樣本的多個(gè)域中提取和選擇 750 +個(gè)經(jīng)過(guò)實(shí)際測(cè)試的特征。 它減少了數(shù)據(jù)科學(xué)家浪費(fèi)在特征工程上的大量工作時(shí)間。

并且時(shí)間序列數(shù)據(jù)是相當(dāng)大的,tsfresh 也通過(guò)多線程、支持dask和spark來(lái)處理單機(jī)處理不了的大數(shù)據(jù)樣本。

責(zé)任編輯:華軒 來(lái)源: 今日頭條
相關(guān)推薦

2021-02-23 07:01:24

js小游戲技術(shù)

2012-02-01 10:13:04

2020-09-26 21:41:30

進(jìn)度條Python代碼

2022-02-22 10:30:49

Kubernetes集群

2023-03-30 15:12:47

2024-08-26 12:57:15

2022-06-02 14:00:41

網(wǎng)絡(luò)攻擊黑客勒索攻擊

2022-03-01 15:26:29

漏洞網(wǎng)絡(luò)攻擊

2022-07-31 23:43:10

網(wǎng)絡(luò)安全漏洞風(fēng)險(xiǎn)管理

2021-11-09 06:34:32

CISA漏洞補(bǔ)丁

2022-07-04 11:17:54

微軟蠕蟲(chóng)病毒Raspberry

2022-03-17 14:36:20

后門(mén)網(wǎng)絡(luò)安全

2016-09-13 23:05:47

2020-05-11 17:12:52

換臉Python圖像

2020-07-06 10:55:38

CIO首席信息官IT

2022-10-17 07:16:08

SQL機(jī)器學(xué)習(xí)AI

2021-12-24 15:59:18

Azure漏洞源碼庫(kù)

2022-11-17 18:47:06

2024-01-07 16:56:59

Python人工智能神經(jīng)網(wǎng)絡(luò)

2013-04-15 09:51:53

中國(guó)聯(lián)通IDCSDN
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

主站蜘蛛池模板: 久久久成人免费一区二区 | 成人av网页 | av日韩高清| 午夜精品一区二区三区在线视频 | 国产免费av在线 | 99精品一区二区 | 国产在线视频一区二区董小宛性色 | 91欧美精品成人综合在线观看 | 日本在线播放一区二区 | 欧美一区在线视频 | 国内精品伊人久久久久网站 | 黑人精品| 日韩免费网站 | 在线免费中文字幕 | 国产在线麻豆精品入口 | 精品影院| 91影院在线观看 | 国产美女在线观看 | 欧美成人精品一区二区男人看 | 热久久性 | 日韩字幕 | 欧美精品91 | 亚洲人人| 日韩欧美在线观看 | 欧美一级淫片免费视频黄 | 一级午夜aaa免费看三区 | 久久久久久久久久久久久久久久久久久久 | a看片 | 成年人免费网站 | 欧美一区二区大片 | 国产精品欧美一区二区三区不卡 | 日本不卡高字幕在线2019 | 日韩电影一区二区三区 | 国产免费av网 | 精品国产区 | 久久久99国产精品免费 | 成人二区 | 国产免费视频 | 亚洲精品福利在线 | 夜夜艹 | 国产一区二区在线视频 |