成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

Python開發者在遷移到Go前需要知道的事情

移動開發
這篇長博客譯文記錄了作者把一大段Python/Cython代碼遷移到Go語言的經歷,非常適合想要切換到Go語言的Python開發者閱讀。

英文原文:What Python developers need to know before migrating to Go(lang)

  這是一篇記錄了我們把一大段 Python/Cython 代碼遷移到 Go語言經歷的(長)博客。如果你希望了解整個故事、背景等所有的內容,請接著讀。如果只對 Python 開發者進入之前需要知道的東西感興趣,點擊下面的鏈接: 

從 Python 遷移到 Go 的提示與技巧

 

背景

  我們在 Repustate 技術上最大的成果就是實現了阿拉伯語情感分析。阿拉伯語真是一個難啃的骨頭,它的單詞語法形態太復雜了。阿拉伯語的分詞(tokenization,把一個句子分成獨立的詞語)相比諸如英語更難,因為阿拉伯語單詞內部可能包含空格(例如,aleph內的位置)。這個不需要保密,那就是 Repustate 使用了支持向量機(SVM)來得到句子最可能的意思,然后在此基礎上分析情感。我們總共用了 22 個模型(22 個支持向量機),文檔中的每個單詞都會被分析。也就是說,如果一篇文檔包含 500 詞的話,將會有一萬次以上的支持向量機的比較操作。

 

Python

  Repustate幾乎是徹底用 Python 實現的,因為我們使用了 Django 作為應用程序接口和網站架構。所以只能保持代碼的統一,同時用 Python 實現整個阿拉伯語情感引擎。原型與實現的過程中,Python 還是很不錯的。非常強的表達能力,強大的第三方庫資源。如果你只是服務于網頁的話,還是很完美的。但是,當你需要進行底層計算,需要在散列表(Python 中的字典)上進行大量的比較運算的時候,速度就慢下來了。我們每秒鐘只能處理2到3篇阿拉伯語文檔,這太慢了。對比我們的英語情感引擎,每秒鐘能處理 500 篇文檔。

 

瓶頸

  于是,我們啟動了 Python 分析器,研究哪部分執行得慢。還記得我說過我們會用 22 個支持向量機處理每一個單詞嗎?這些處理都是串行的,沒有并行操作。好,我們第一個想法是把這個改成類似 map/reduce 的操作。長話短說:Python 中不適合使用 map/reduce。當你需要并發性的時候,Python 一點都不好用。2013 年的 PyCon 大會上,Guido 提到了 Tulip,他試圖解決這個問題的新項目,但是還需要一段時間才能推出。如果已經有更好的選擇,我們為什么還要等它呢。

 

換 Go 語言還是回家種田

  我在 Mozilla 的朋友告訴我,Mazilla 服務中日志架構的大部分代碼已經切換成 Go 了,部分原因是 goroutine(Go 線程)的強大。Go 是 Google 的一群人設計的,它把并行性作為一級概念,而不像 Python 的不同解決方案做的事后補充。于是,我們開始著手把 Python 換成 Go。

  盡管 Go 代碼還沒達到產品級別,其結果已經非常令人鼓舞了。我們達到了每秒 1000 文檔的速度,使用了更少的內存,還不用去處理用 Python 時碰到的多進程/gevent/“為什么 Ctrl+C 殺掉了我的進程”代碼等討厭的問題。

 

我們為什么愛上了Go

  只要知道一點兒編程語言工作原理的人,(明白解釋和編譯以及動態與靜態的區別,就會說:“老兄,Go 顯然會更快。沒錯,我們也可以把整個東西用 Java 來重寫,并且得到類似的性能,但這不是 Go 勝出的原因。你用 Go 寫出代碼來就很容易是正確的。我也說不清楚怎么回事,但是一旦代碼編譯通過(編譯速度還很快),你就感覺到它可以工作了(不只是運行不提示錯誤,而是邏輯上就是對的)。我知道這聽起來很玄乎,但確實是事實。這就像 Python 解決冗余問題(或者說無冗余),它把函數作為一級對象,從而函數編程可以輕松的進行。go線程和通道(channel)讓你的生活如此輕松。你還可以得到靜態類型帶來的性能提升,更精確的控制內存分配,卻不會因此損失表達性。

 

我們早該知道的事情

  除去那些贊美之詞,用 Go 的時候需要一種不同于用 Python 時的心態。下面是一些遷移時候的筆記,把 Python 轉成 Go 時隨機躍入我腦子的東西:

  • 沒有內建的集合類型(需要使用 map 然后檢查存在性)
  • 由于沒有集合類型,需要自己實現交集、并集等方法
  • 沒有元組(tuple),需要設計自己的結構(struct)或者使用slice(類似數組)
  • 沒有類似 __getattr_() 的方法,需要你檢查存在性而不能設置缺省值,例如 Python 中,你可以這么寫:value = dict.get("a_key", "default_value")
  • 需要檢查錯誤(或者至少顯式的忽略它們)
  • 不能夠有未使用的變量和包,需要時不時的注釋掉一些代碼
  • 在 []byte 和 string 之間切換,正則處理(regexp)使用 []byte(可改寫的)。這是對的,但轉換來轉換去還是很麻煩
  • Python 語法更寬松。你可以用超出范圍的索引取字符串的片段而不出錯,也可以使用負數取片段。Go 就不行。
  • 無法使用混合類型的數據結構。這可能不一定合適,但是 Python 中有時候我會有一個取值可以是字符串和列表混合的字典。Go 里不行,你必須清理里的數據結構或者自定義結構*
  • 沒法把元組或者列表分配成分開的變量(例如,x, y, x = [1, 2, 3])
  • 駝峰式大小寫習慣(首字母不大寫的函數/結構不會暴露給其他包)。我更喜歡 Python 的小寫加下劃線的習慣。
  • 必須顯式的檢查錯誤是否為空,不像 Python 中很多類型都可以像布爾類型一樣的用(0,空串,None都可以作為布爾“假”)
  • 一些模塊(如 crypo/md5)的文檔不足,但是 IRC 上的 go-nutes 很厲害,有強大的支持
  • 數字轉字符串(int64->string)與 []byte 轉字符串(只要 string([]byte))不同,需要調用 strconv
  • 讀 Go 的代碼絕對像是編程語言,而 Python 可以寫成像是偽代碼一樣。Go 使用更多的非英文數字字符,使用 || 和 && 而不是 or 和 and。
  • 寫文件會有 File.Write([]byte) 和 File.WriteString(string),與 Python 開發者的一種辦法解決問題的信條不一致。
  • 字符串插入不好用,必須經常使用 fmt.Sprintf
  • 沒有構造函數,通常的習慣是寫一個 NewType() 函數返回你要的結構
  • Else(或者 else if)得正確的格式化,else 得和與 if 配對的大括號在一行。奇怪。
  • 函數內外使用不同的賦值操作符,= 和 := (譯者注:此為作者的誤解,= 和 := 的區別是顯式定義類型還是自動類型推導,而函數外的變量只能用 =)
  • 如果我只想要鍵值(dict.keys())或取值(dict.values())的列表,或者元組的列表(dict.items()),Go 中沒有對應的函數,只能自己迭代 map 然后填列表
  • 我常用的一種寫法是通過建立一個取值為函數的字典,通過鍵值調用相應的函數。在 Go 里面可以實現,但是函數的輸入輸出必須相同,也就是函數簽名必須一致。*
  • 如果你使用 JSON,并且 JSON 是混合類型的,那么你中招了。你必須建立一個匹配 JSON 數據格式的自定義結構,然后把 JSON 解析成這個自定義的結構。相比 Python 時候的一句 obj = json.loads(json_blog) 多了很多工作。*

(*譯者注:以上很多條都是因為作者沒有使用 Go 中的 interface{} 造成的)

 

我們值得做嗎?

  絕對值,一百萬個絕對值!速度的提升簡直太驚人了!并且我還想強調一下,Go 是一個現在時髦的語言,所以再招新人的時候,讓 Go 成為 Repustate 的重要技術支持會很重要。

責任編輯:佚名 來源: oschina
相關推薦

2013-06-28 14:19:20

2021-12-24 11:24:59

React HackReact JavaScript

2013-09-12 11:24:24

創業

2010-07-30 16:27:06

Flex開發

2011-05-26 11:13:36

Flex

2010-03-01 10:20:27

Flex

2014-07-17 09:31:50

iOS8SDK

2023-06-05 16:50:06

開發TypeScriptJavaScript

2015-08-21 09:47:02

ios9sdk新特性

2016-02-22 15:09:19

Android項目管理技巧

2017-06-09 13:33:57

2025-02-25 08:30:00

前端開發VSCode

2018-09-29 15:27:05

BinderAPPAndroid

2015-11-09 10:50:42

2024-06-04 16:51:11

2024-04-26 13:36:01

2020-04-26 20:00:14

EmacsLinux

2013-11-22 15:03:25

開發者消息推送

2024-05-06 10:16:46

2013-12-02 14:07:02

Hadoop大數據集群
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 成人九区| 羞羞视频网站免费看 | 国产美女在线看 | 精品国产视频 | 四虎影院久久 | 九色国产 | 精品一区二区三区在线观看国产 | 亚洲精品乱码久久久久久9色 | 欧美精品一二三区 | 91精品国产色综合久久不卡98口 | 日韩欧美一区二区三区免费观看 | 国产精品久久久精品 | 久久网一区二区三区 | 国产一区二区三区免费 | 亚洲日本中文字幕在线 | 国外成人在线视频 | 国产精品久久久久久久 | 成人精品国产一区二区4080 | 午夜视频在线 | 亚洲午夜电影 | 在线毛片网 | 欧美日韩国产精品一区二区 | 97在线观视频免费观看 | 嫩草懂你的影院入口 | 国产日韩欧美 | 精品亚洲二区 | 91色视频在线观看 | 欧美一区二 | 国产91在线精品 | 亚洲 日本 欧美 中文幕 | 毛片一级网站 | 丝袜美腿一区二区三区动态图 | 国产一区2区 | 亚洲欧美综合 | 国产情侣啪啪 | 久久久久久女 | 成人免费日韩 | 久久精品手机视频 | 日日夜夜草 | av一区二区三区在线观看 | 中文字幕免费在线观看 |