贊美父母的作文
筆試時(shí)間:2014-9-20

筆試職位:機器學(xué)習/數據挖掘工程師
筆試城市:天津、深圳、南京等
一. 簡(jiǎn)答題
1. new 和 malloc 的區別。
2. hash沖突是指什么?怎么解決?給兩種方法,寫(xiě)出過(guò)程和優(yōu)缺點(diǎn)。
3. 命中的概率是 0.25,若要至少命中一次的概率不小于 0.75,則至少需要幾次?
二. 算法設計題
1. 用C/C++寫(xiě)一個(gè)歸并排序。
數據結構為struct Node{int v; Node *next};
接口為 Node * merge_sort(Node *);
2. 設計S型層次遍歷樹(shù)的算法,比如根節點(diǎn)是第一層,第二層從左至右遍歷,第三層從右至左遍歷,第四層再從左至右遍歷,以此類(lèi)推。
舉例:應依次輸出 1 2 3 6 5 4 7 8 9。
3. 一個(gè)url文件,每行是一個(gè)url地址,可能有重復。
(1)統計每個(gè)url的頻次,設計函數實(shí)現實(shí)現。
(2)設有10億url,平均長(cháng)度是20,現在機器有8G內存,怎么處理,寫(xiě)出思路。
三. 系統設計題
自然語(yǔ)言處理中的中文分詞問(wèn)題,前向最大匹配算法(FMM)。
注:題目舉例說(shuō)明了FMM的基本思想。
(1)設計字典的數據結構 struct dictnote。
(2)用C/C++實(shí)現FMM,可選接口為
int FMM(vector
其中 iLetters 為待分詞的句子,比如 {“小”,“明”,“今”,“天”,“買(mǎi)”,“了”,“i”,“p”,“o”,“n”,“e”,“6”},
iRoot 是字典, oResults 保存輸出結果,即分詞的位置。也可以自己設計接口。
(3)收集了一些手機品牌的字典,如{iphone, 諾基亞}。
現在要求查找包含這些手機品牌的網(wǎng)頁(yè),比如包含 iphone6, 諾基亞 9973 等。
怎么修改FMM實(shí)現這個(gè)功能,可以寫(xiě)偽代碼。
【贊美父母的作文】相關(guān)文章:
贊美父母作文(精選25篇)07-08
贊美父母作文400字(精選21篇)05-12
贊美父母親的作文(通用20篇)10-27
贊美父母的名人名言150句05-21
贊美太陽(yáng)作文 贊美太陽(yáng)作文06-03
贊美書(shū)的作文01-19
贊美菊花的作文01-15
贊美家鄉作文01-09
贊美友誼作文02-07
贊美母親的作文04-24
- 贊美父母作文 推薦度:
- 贊美父母作文400字 推薦度:
- 相關(guān)推薦