服務器開光師是個什么鬼?TalkingData的研發面試題目
TalkingData是一家對數據有信仰的公司,致力于用數據去改變人們做決定的方式,并幫助人們更加了解周圍的環境。
4年堅守大數據的前沿陣地,我們遇到無數的挑戰。這里我們也向如下有志之士發出邀請,有意者請發簡歷至wenfeng.xiao@tendcloud.com:
- 大數據工程師/架構師
- Java開發工程師/架構師
- Html5/web前端開發
- iOS/安卓SDK開發
- 機器學習研究員
- DevOps/運維開發
- 程序猿鼓勵師
- 服務器開光師
對于這些職位,我們通常有如下的面試題目。
大數據工程師
1. Hadoop集群的namenode上,當meta數據損壞之后如何修復?數據的丟失率是怎樣計算?
2. 目前需要對100臺服務器做RAID ,有什么方式能夠通過自動化的方式實現?
3. 有超過10億行的數據,每行第一列為唯一ID列,其余列為數值型列,假設數值型列分別為A,B,C,D,請問如何高效的實現一個算法能夠完成:
1) 某一列數值符合在某個區間的范圍內的記錄的條數
2) 某一列數值符合在某個區間同時另一列數值在某個數值區間的記錄的條數
4. 某廣告主在渠道投放每天有大量點擊數據,包含每個點擊的IP信息。請基于IP信息設計防止渠道作弊的算法和思路。
5. 一個url文件,每行是一個url地址,可能有重復。
(1)統計每個url的頻次,設計函數實現實現。
(2)設有10億url,平均長度是20,現在機器有8G內存,怎么處理,寫出思路。
6. 20個億整數的兩個集合a與b,求a與b的交集,內存為4Gb
7. 在N個無序數中找K個最小值
8. 一個流式輸入序列(method_name, latency),其中method_name大約有100萬種,latency的取值為1到10億的正整數,每天的數據量大概100億條。限制最多 1GB的程序運行內存,設計一種方法,計算一天內每個method_name的50%,95%,99% percentile的latency,誤差不超過5%。
Java開發工程師
1. 抽象類和接口有什么區別
2. 請說一下java中的內存回收機制所采用的算法
3. Sleep()和wait()有什么區別?
4. 請列舉幾種排序算法,并用JAVA實現快速排序算法。
5. 36輛車,6條跑道,無計時器,最少幾次比賽可以選出前三
6. 一個未排序的整形序列,比如10,20,3,7,5,9,4,2,90,給出這些數字當中最長連續數的長度,例子中的長度是 4[2,3,4,5]。算法復雜度最好為O(n)
7. 兩個線程,一個運行B.m1(),一個運行B.m2(),這個程序可能的行為有哪些?
Class A{
int f;
A(){f = 1;}
}
Class B{
A a;
void m1(){a = new A();}
void m2(){if(a != null) System.out.println(a.f);}
}
8. 在N個無序數中找K個最小值
C++開發工程師
1. new 和 malloc 的區別
2. 用C/C++寫一個歸并排序。
數據結構為struct Node{int v; Node *next};
接口為 Node * merge_sort(Node *);
3. 一個url文件,每行是一個url地址,可能有重復。
1)統計每個url的頻次,設計函數實現實現。
2)設有10億url,平均長度是20,現在機器有8G內存,怎么處理,寫出思路。
4. 進程間的通信方式
5. 20個億整數的兩個集合a與b,求a與b的交集,內存為4Gb
6. 在N個無序數中找K個最小值
機器學習研究員
1. 什么是聚類分析?聚類算法有哪幾種?請選擇一種詳細描述其計算原理和步驟。
2. Pca的概念和處理過程(主成分分析)
3. 中文分詞技術簡介,常用數據結構和算法
4. 如何建立一個智能問答系統,思路
5. 如何建立一個智能商品推薦系統,思路
Html5/web前端開發
1. 實現輸出document對象中所有成員的名稱和類型。
2. 寫一個去掉數組里的重復成員的程序。比如去掉上面題中剛生成數字序列里面的重復項;
3. 請談一下HTML和XHTML的區別。
4. 你對Web標準的理解?
5. 瀏覽器兼容性,談談你經常使用的瀏覽器,和各個瀏覽器兼容的問題?
6. 頁面圖片加載太多,一般如何處理?如何合并圖片,請寫出你的代碼?如何延遲和預先加載?
大數據程序猿鼓勵師
限女,顏值高,大家都理解,不再贅述:
服務器開光師
對于大數據行業來說,開光師的作用日趨凸顯,這就是為什么有的服務器服務超期依然運行穩健,有的新買剛上線就存儲故障。根據職能開光師分為軟件專攻和硬件專攻,通常必須掌握至少一門宗教開光儀式,自備儀式禮服。因為涉及跨界,此類人才目前稀缺,培養不易。
鑒于目前安全形勢日益嚴峻,TalkingData決定在北京臥佛寺和成都青羊宮新建數據中心做異地容災,因此掌握多項技能者優先。