成人免费xxxxx在线视频软件_久久精品久久久_亚洲国产精品久久久_天天色天天色_亚洲人成一区_欧美一级欧美三级在线观看

一淘曲琳:搜索引擎的架構維護與職責協調

原創
開發 項目管理
編者按:51CTO記者在International ArchSummit架構師峰會上,針對一淘的搜索引擎技術對一淘網架構師曲琳的采訪,談談一些搜索引擎的技術與研發的協調與合作關系。

編者按:51CTO記者在International ArchSummit架構師峰會上,針對一淘的搜索引擎技術對一淘網架構師曲琳的采訪,談談一些搜索引擎的技術與研發的協調與合作關系。

[[92946]]

曲琳,一淘網架構師,主要在一淘網負責搜索引擎技術。

1、 首先,能簡單的介紹一下自己么?

我是08年浙大畢業的博士生,畢業之后我就去了alibaba,當時是在B2B搜索中心在做alibaba中文站和國際站的搜索后臺,之后又到了阿里云,又到了淘寶,而現在是在一淘。而整個過程里都是在搜索這個領域上,垂直搜索這一塊做引擎開發工作。大概的背景就是這樣。

1) 你大學是學什么專業的?

我不是計算機專業的,我是學電子信息技術及儀器,應該是屬于近計算機專業吧。我博士研究方向是挖掘相關的,是智能監控方向。其實具體在學校做的事情是嵌入系統這些,偏嵌入系統的軟件。當然我們這個方向是有硬件有軟件的,所以這個背景會對硬件更加的了解一些。

2)當時學的東西和你后來做的搜索你覺得關系大嗎?

你如果說領域的話其實是相差蠻大的,當然也略有些聯系,在相關性方面,其實都會用到一些數據挖掘方法。但是在引擎平臺上講具體的領域其實是有很大偏差的,當然在這個軟件設計或者是開發這個角度其實它的基礎背景都是差不多的。剛開始來Alibaba的時候是有些挑戰的,一個全新的領域需重頭學習。

3)您一開始加入Alibaba的時候,是有資深的工程師帶您么?

Alibaba這個文化,就是你去這個公司會有個師兄,然后他會在不僅僅是你工作上的,包括你生活上一有困難的時候都可以跟他商量。我們叫他Buddy也好,更多的是一種平等的方式,你可以直接的交流。他并不是你的直接領導,你的主管可能是另外一個人。這個Buddy可能是會稍微在公司呆過一段時間的,對公司比較熟悉了解的,這樣一個相對比較資深的人。在這個過程當中來帶領你,所以你的工作在他的幫助下一點一點的開展起來。

2、 一淘網的搜索技術部主要承擔了哪些職責?

現在在一淘的搜索技術部其實是承擔除了阿里云之外的整個Alibaba集團的搜索業務,都在一淘搜索,包括淘寶的主搜索,還有一淘本身的搜索,還有Alibaba B2B的中文站、國際站、速賣通,所有搜索后臺都是在一淘搜索這個部門,都是由我們來支持的。

1)那往其他部門部署也是由你們來支持嗎?

其實并不是這樣的,這個我們可能會說在那邊的業務,在一個具體應用上的業務就是由我們這邊的人來負責的,并不是那邊部門由具體的人來負責我們給他提供代碼不是這樣的。我們直接是提供服務的,包括引擎的運維,從開發到最終上線,到業務需求的滿足都是在一淘搜索的。

2)相當于他們是你們的客戶,他們說我們要搜索服務,然后你們提供給他們?

我們是以服務化形式來支持各個部門,支持各應用業務。

3、 工程師們跟業務部門是如何協作的?

一般來說直接跟工程師打交道的是產品部門,當然也會有些運營部門來提需求,我們針對每個需求方都會有專門的技術的接口,那可能在具體的開發過程當中會有個項目經理這樣的角色,可能是從技術團隊當中出這么個角色來協調這個整個的開發過程,還有需求的溝通都會有這樣的一個角色來承擔,來協調。那么我們可能對每一個具體的業務建議會有專門的團隊來支持,比如說我,其實是負責一淘的搜索后臺,那么我們會有另外的一些小團隊負責淘寶主搜索的,針對每一個具體的應用都會這個業務需求的定制,還會有這種針對業務的性能優化,還有引擎的部署,調優,甚至會有些非搜索的這個服務。其實搜索引擎并不僅僅是這個核而已,你為了提供完整的服務,可能還會有些key-value的東西,或者是有一些在線計算實時計算的一些服務,還會有一些離線的,數據挖掘的,算法相關的,還可能會有些比如索引build,數據的抓取,或者是dump,這個一整套的工作都會有針對業務的定制。

4、 那其實像你剛剛說這個協調產品和技術雙方的角色是不是對兩邊都非常熟悉?

對。一般來說你要協調這個項目的話你首先要有非常多的這個項目經驗,另外一方面你得對整個技術的上下游,其實這個搜索的戰線是蠻長的,從后到前經歷的各個角色很多,首先你得有這個經驗你得了解整條線的這個情況,這樣的話你才能在各各技術方案當中選擇一個比較合理的。這里可能還不涉及到架構的問題,在做具體的業務需求更多的是怎么樣把這個流程看起來能夠選擇一個方案來實現需求。另一方面你也得了解業務,不僅僅要了解技術,可能你要從具體的項目當中了解整個產品的一個規劃,甚至對用戶的體驗你要有感覺,怎么樣做才是更合理的方向,或者在這個需求的tradeoff時候你得找到一個比較合適的度,不能一味的滿足這個產品的想法,跟這個技術實現的難度當中要做些折中的,這里面其實對項目接口那個角色的要求是蠻高的。

1)一般在Alibaba做到這樣的能力需要大概3-5年?

其實更多的可能是通過時間的鍛煉和更了解一些,一般說有2年左右豐富經驗的人才能去勝任這樣的角色。與你所做的這個崗位也有關系,可能引擎的同學對這個流程比較熟悉一些,因為他們屬在整個流程的中心。偏前端的同學可能在做這種用戶界面定制,用戶體驗相關的這種需求,他會更有經驗一些。 

2)那么運維和研發直接是怎么合作的?

其實在alibaba技術保障這個團隊是非常強大的,在alibaba這個規模的服務器很多,一定要是有一個統一的管理的,不可能是把機器交給各各應用方去管理,這個也沒辦法去處理,首先在整個基礎的設施上,比如說機房,服務器,基礎網絡,服務器的監控,就是基礎的硬件維護上面都是有專門的團隊去做的。Alibaba技術保障部來負責這件事情,技術的運維平臺他們會保障。其實針對具體的應用需求的話,比如說搜索的這種運維特性跟存儲的特性和偏服務的需求沒差別的,這是與你具體的應用有關的。

比如說搜索可能它會因為數據訪問的特性,可能會有中間的角色,這個角色它的流量會很大,并不是平均訪問的。那么在這種情況下對服務器的要求就會有不同,他不會用同個服務器來統一解決這個問題。就可能在這些方面你可能要針對應用特性還做一些針對網絡或者針對服務器甚至針對交換機的這種定制,或者是做出這種配置,或者說在這個應用層上這種應用服務的管理,這個可能就要跟開發密切的結合,因為你必須要了解這個服務是怎么用的,才能把它運維好。所以這個角色可能就會更加偏向于應用,我們叫它PE,這個PE的團隊更多的是跟開發團隊有密切的聯系,甚至會給開發團隊提需求,這叫可運維性的需求。其實在公司發展到一定規模的時候,或者說應用發展到一定規模的時候,可運維性一定是你軟件設置當中必須考慮的一個問題。

像這次的大會,你仔細去看你會發現所謂的這種大數據,或者是搜索規模問題,其實大家都在解一個問題,就是這個可運維性的問題。就是你怎么把一個運算用分布式架構來解決。分布式架構是什么?首先是怎么拆分數據,然后可用性的問題和擴展性的問題,不可避免的一個問題是機器的損害,故障恢復問題,這其實就是分布設計最基礎的問題。它的根源其實就是來自于可運維性的,在結合運載做的一些改動都是跟開發人員密切相關的。

在我們這個一淘的搜索上其實我們開發和運維是有一個很密切的聯系的。甚至有些開發人員他會去運維做領導,這個其實是對我們開發人員來說也是一個基本的要求,安排你去運維這個崗位上做半年到一年,讓你了解線上系統是怎么去運維的,只有你在真正的去做過以后你才能在軟件設計或架構設計的時候才知道什么事真正可運維的,而不是說你只是做個簡單的程序,要后面套一個很復雜的運維腳本去來給你做這種可運維性的事情,而是這種可運維性是嵌入到你系統核心的設計當中,這個是我們在一淘的搜索當中的一個做法,這個應該也是目前各大公司的一個方向吧。

3)像是在你們的部門,我是一個新進來的研發,那么我有哪些發展路線可以選擇?

其實這個也有些區別,比如說一個應屆的同學剛到我們團隊的話在淘寶首先是一個淘寶文化的培訓,大概有一周到兩周的時間,這個可能相對的比較泛一些,包括公司的一些文化等等,可能不會涉及到一些技術。應該說不管什么崗位,甚至非技術的都一樣參加這個培訓的。這個培訓之后會有個技術大學的課程,技術同學會有兩周的時間把整個(不僅僅是搜索)淘寶的技術體系,比如說信息存儲,比如主站相對應的服務,應該是最基礎的吧,大概這些是怎么做的都會給你個介紹。然后在這段培訓之后,你可以回到部門,在部門里面也會有培訓計劃,比如針對搜索的話我們會有搜索的這些入門的東西,不是所有人都了解搜索這個領域嘛,然后還好針對我們所用的一些技術,比如說我們弄個C++,或者說我們在這個版本管理上的一些具體的工具,甚至開發工具上我們都會有一些培訓,這個是在我們這個部門的平面上。

在你具體工作的時候我們會有師兄他會從你的工作一點一點的帶你做起來。可能在我們這應屆生剛來的時候,其實大家方向都不太明確,那么可能會是你的主管或者你的分配工作,從一個具體的事情做起。然后可能先把各各領域方面的事情都做些嘗試,再有一個比較廣度的積累之后,你就可以從你做的事情當中尋找一個可以深入做下去的點。當然可能你能做的事情很多,可以偏向應用,針對應用做一些需求相關的工作,也可以針對引擎性能相關的,這種地位都是存在的。可能后面會根椐這種具體的需求和情況來結合你自己的興趣來找到你這個可以深入做下去的點。大概我們的新人過程就是這樣的,整個過程有個半年左右吧,實話說搜索這個領域從入門到精通需要蠻長時間的。

4)那如果說成長目標是架構師呢?

其實架構師的這個title是一個比較虛的title,我相信在互聯網行業不會有一個很明確的職位或者title去叫架構師。當然也可能會有一些公司有這種title,但是在淘寶大家都是屬于工程師,可能你所做的事情會覆蓋到一部分架構的工作,或多或少的,但不是說在淘寶并沒有這樣一個角色說他就不編碼或者說不去負責具體的模塊設計或者他只是負責高層架構的很少。幾乎沒有這種,主要原因是在于這個領域變化太快了,你經驗消退的速度會非常的快,你必須要在具體的需求和具體的工作當中去尋找這樣架構的機會,而不是說自上而下的普通的這種架構,不現實。在我們一淘搜索可能更多的還是說工程師這個等級。就是說你在這個工程師這個領域上的,或者這條線上你做的有多深。這個可能更多的是你經驗的積累,可能還會有架構的經驗。當然最重要的還是說你在開發上的積累,或者說在產品上的一些靈感。

責任編輯:林師授 來源: 51CTO
相關推薦

2012-08-29 08:47:22

開發技術周刊

2011-06-20 18:23:06

SEO

2009-02-19 09:41:36

搜索引擎搜狐百度

2009-09-22 16:23:52

搜索引擎

2011-07-01 15:51:20

SEO

2020-03-20 10:14:49

搜索引擎倒排索引

2017-08-07 08:15:31

搜索引擎倒排

2016-12-26 13:41:19

大數據搜索引擎工作原理

2010-06-13 16:27:28

搜索引擎

2011-07-21 16:32:07

SEO

2011-06-23 14:48:52

網站更新頻率搜索引擎

2010-04-20 11:43:46

2022-10-08 09:13:18

搜索引擎?站

2012-09-07 13:22:21

搜索搜狗

2010-08-02 16:08:39

ibmdwJava搜索引擎

2011-06-22 17:28:51

SEO

2012-05-14 11:01:50

搜索引擎微軟

2020-08-10 14:39:30

搜索引擎

2011-06-15 19:09:24

搜索引擎

2015-08-31 10:41:58

搜索引擎Google云應用
點贊
收藏

51CTO技術棧公眾號

主站蜘蛛池模板: 麻豆久久| 亚洲精品乱码久久久久久按摩观 | 国产91精品网站 | 在线色 | 国产一级片91 | 欧美成人手机在线 | 99福利视频| 最新免费黄色网址 | 欧美一区二区在线观看 | 伊人超碰在线 | 91精品国产综合久久久久久 | 龙珠z在线观看 | 在线精品一区二区三区 | 日韩精品视频在线观看一区二区三区 | 中文成人在线 | 中文字幕免费 | 精品一区二区免费视频 | 久久国产精品无码网站 | 国产高清免费 | 精品一区二区电影 | 91资源在线播放 | 欧美日韩三级 | 黄色精品 | 精品一区二区三区免费视频 | 中文字幕一区二区三区在线视频 | 国产精品久久久久久一区二区三区 | 男女国产网站 | 国产毛片视频 | 国产一级影片 | 国产精品久久久久久久久久免费 | 一区二区高清不卡 | 国产精品久久久久国产a级 欧美日本韩国一区二区 | 国产精品一区二区在线 | 中文字幕国产日韩 | 精品国产一区二区国模嫣然 | 888久久久 | 成人黄页在线观看 | 国产精品揄拍一区二区 | 国产精品久久久久久婷婷天堂 | 精品国产一区二区三区久久久蜜月 | а天堂中文最新一区二区三区 |