成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

python中使用矢量化替換循環

開發 前端
矢量化是在數據集上實現 (NumPy) 數組操作的技術。在后臺,它將操作一次性應用于數組或系列的所有元素(不同于一次操作一行的“for”循環)。

所有編程語言都離不開循環。因此,默認情況下,只要有重復操作,我們就會開始執行循環。但是當我們處理大量迭代(數百萬/十億行)時,使用循環是一種犯罪。您可能會被困幾個小時,后來才意識到它行不通。這就是在 python 中實現矢量化變得非常關鍵的地方。

圖片


什么是矢量化?

矢量化是在數據集上實現 (NumPy) 數組操作的技術。在后臺,它將操作一次性應用于數組或系列的所有元素(不同于一次操作一行的“for”循環)。

接下來我們使用一些用例來演示什么是矢量化。

求數字之和

##使用循環
import time
start = time.time()


# iterative sum
total = 0
# iterating through 1.5 Million numbers
for item in range(0, 1500000):
total = total + item


print('sum is:' + str(total))
end = time.time()

print(end - start)

#1124999250000
#0.14 Seconds
## 使用矢量化
import numpy as np

start = time.time()

# vectorized sum - using numpy for vectorization
# np.arange create the sequence of numbers from 0 to 1499999
print(np.sum(np.arange(1500000)))

end = time.time()

print(end - start)


##1124999250000
##0.008 Seconds

與使用范圍函數的迭代相比,矢量化的執行時間減少了約 18 倍。在使用 Pandas DataFrame 時,這種差異將變得更加顯著。

數學運算

在數據科學中,在使用 Pandas DataFrame 時,開發人員使用循環通過數學運算創建新的派生列。

在下面的示例中,我們可以看到對于此類用例,用矢量化替換循環是多么容易。

DataFrame 是行和列形式的表格數據。

我們創建一個具有 500 萬行和 4 列的 pandas DataFrame,其中填充了 0 到 50 之間的隨機值。

圖片

import numpy as np 
import pandas as pd
df = pd.DataFrame(np.random.randint( 0 , 50 , size=( 5000000 , 4 )), columns=( 'a' , 'b' , 'c' , 'd ' ))
df.shape
# (5000000, 5)
df.head()

創建一個新列“ratio”來查找列“d”和“c”的比率。

## 循環遍歷
import time
start = time.time()

# 使用 iterrows 遍歷 DataFrame
for idx, row in df.iterrows():
# 創建一個新列
df.at[idx, 'ratio' ] = 100 * (row[ "d" ] / row[ "c" ])
end = time.time()
print (end - start)
### 109
## 使用矢量化
start = time.time()
df[ "ratio" ] = 100 * (df[ "d" ] / df[ "c" ])

end = time.time()
print (end - start)
### 0.12

我們可以看到 DataFrame 的顯著改進,與Python 中的循環相比,矢量化操作所花費的時間幾乎快 1000 倍。

If-else 語句

我們實現了很多需要我們使用“If-else”類型邏輯的操作。我們可以輕松地將這些邏輯替換為 python 中的矢量化操作。

讓我們看下面的例子來更好地理解它(我們將使用我們在用例 2 中創建的 DataFrame):

想象一下,我們要根據現有列“a”上的某些條件創建一個新列“e”

## 使用循環
import time
start = time.time()

# 使用 iterrows 遍歷 DataFrame
for idx, row in df.iterrows():
if row.a == 0 :
df.at[idx, 'e' ] = row.d
elif ( row.a <= 25 ) & (row.a > 0 ):
df.at[idx, 'e' ] = (row.b)-(row.c)
else :
df.at[idx, 'e' ] = row.b + row.c

end = time.time()

print (end - start)
### 耗時:166 秒
## 矢量化
start = time.time()
df[ 'e' ] = df[ 'b' ] + df[ 'c' ]
df.loc[df[ 'a' ] <= 25 , 'e' ] = df [ 'b' ] -df[ 'c' ]
df.loc[df[ 'a' ]== 0 , 'e' ] = df[ 'd' ]end = time.time()
打印(結束 - 開始)
## 0.29007707595825195

與使用 if-else 語句的 python 循環相比,向量化操作所花費的時間快 600 倍。

解決機器學習/深度學習網絡

深度學習要求我們解決多個復雜的方程式,而且需要解決數百萬和數十億行的問題。在 Python 中運行循環來求解這些方程式非常慢,矢量化是最佳解決方案。

例如,計算以下多元線性回歸方程中數百萬行的 y 值:


我們可以用矢量化代替循環。

圖片

m1、m2、m3……的值是通過使用與 x1、x2、x3……對應的數百萬個值求解上述等式來確定的

圖片

圖片

import numpy as np 
# 設置 m 的初始值
m = np.random.rand( 1 , 5 )

# 500 萬行的輸入值
x = np.random.rand( 5000000 , 5 )
## 使用循環
import numpy as np
m = np.random.rand(1,5)
x = np.random.rand(5000000,5)

total = 0
tic = time.process_time()

for i in range(0,5000000):
total = 0
for j in range(0,5):
total = total + x[i][j]*m[0][j]

zer[i] = total

toc = time.process_time()
print ("Computation time = "+ str ((toc - tic)) + "seconds" )

####計算時間 = 27.02
## 矢量化
tic = time.process_time()

#dot product
np.dot(x,mT)

toc = time.process_time()
print ( "計算時間 = " + str ((toc - tic)) + "seconds" )

####計算時間 = 0.107 秒

np.dot 在后端實現向量化矩陣乘法。與 Python 中的循環相比,它快 165 倍。

結論

python 中的矢量化速度非常快,無論何時我們處理非常大的數據集,都應該優先于循環。

圖片

隨著時間的推移開始實施它,您將習慣于按照代碼的矢量化思路進行思考。

責任編輯:武曉燕 來源: 程序那些事兒
相關推薦

2024-03-19 11:48:36

地圖框架

2024-01-29 09:36:33

高精地圖自動駕駛

2023-10-31 09:33:24

地圖自動駕駛

2023-09-12 12:14:05

Python程序矢量化

2019-10-17 09:57:08

Python設計電腦

2020-04-09 10:18:51

Bash循環Linux

2022-12-29 11:37:51

Python循環向量化

2022-08-10 14:36:05

Python循環函數

2023-08-22 20:55:04

AzureLLMTypeChat

2024-04-03 09:48:47

自動駕駛軌跡

2023-06-15 17:00:11

Rust循環

2023-06-12 07:43:05

知識庫性能優化

2024-02-22 13:52:51

Python循環代碼

2023-10-30 10:54:01

2022-06-23 08:00:53

PythonDateTime模塊

2021-07-21 14:29:27

Python編程語言軟件開發

2018-07-16 16:29:26

編程函數代碼

2025-03-21 09:58:59

Python數據類型安全

2023-11-07 10:10:56

地圖技術

2025-01-20 08:40:00

Python對象
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 福利片在线看 | 中文字幕亚洲视频 | 欧美日韩成人影院 | 日韩手机在线视频 | 女人夜夜春| 高清国产午夜精品久久久久久 | 免费午夜电影 | 精品视频一二区 | 久久不卡日韩美女 | 日韩精品久久一区二区三区 | 国产精品成人国产乱 | 日韩中文字幕在线播放 | 欧美一级在线观看 | 看av电影| 国产精品一区二区三区四区 | 日韩视频一区二区 | 在线观看日韩精品视频 | 97精品超碰一区二区三区 | 国产一区二区视频在线 | 久久久久久久久久久蜜桃 | www.国产精 | 亚洲精品成人av久久 | 亚洲精品成人免费 | 日本精a在线观看 | 欧美日高清视频 | 一区二区三区 在线 | 国产一级片在线观看视频 | 9久久精品 | 欧美日韩国产一区二区三区 | h视频网站在线观看 | 午夜国产精品视频 | 欧美日韩精品久久久免费观看 | 亚洲有码转帖 | 一区二区三区在线 | 欧 | 九九热精品在线 | 国产精品久久久久久久岛一牛影视 | 成人av在线播放 | 91亚洲精华国产 | 欧美国产精品一区二区三区 | 一级片毛片 | www.一级片|