小學(xué)生我的家鄉優(yōu)秀作文
以下是由應屆畢業(yè)生求職網(wǎng)為您分享的百度筆試經(jīng)驗,請您對此進(jìn)行參考:

1 編程:
用C語(yǔ)言實(shí)現一個(gè)revert函數,它的功能是將輸入的字符串在原串上倒序后返回。
2 編程:
用C語(yǔ)言實(shí)現函數void * memmove(void *dest,const void *src,size_t n)。memmove函數的功能是拷貝src所指的內存內容前n個(gè)字節到dest所指的地址上。
3 英文拼寫(xiě)糾錯:
在用戶(hù)輸入英文單詞時(shí),經(jīng)常發(fā)生錯誤,我們需要對其進(jìn)行糾錯。假設已經(jīng)有一個(gè)包含了正確英文單詞的詞典,請你設計一個(gè)拼寫(xiě)糾錯的程序。
(1)請描述你解決這個(gè)問(wèn)題的思路;
(2)請給出主要的處理流程,算法,以及算法的復雜度;
(3)請描述可能的改進(jìn)(改進(jìn)的方向如效果,性能等等,這是一個(gè)開(kāi)放問(wèn)題)。
4 尋找熱門(mén)查詢(xún):
搜索引擎會(huì )通過(guò)日志文件把用戶(hù)每次檢索使用的所有檢索串都記錄下來(lái),每個(gè)查詢(xún)串的長(cháng)度為1-255字節。假設目前有一千萬(wàn)個(gè)記錄,這些查詢(xún)串的重復度比較高,雖然總數是1千萬(wàn),但如果除去重復后,不超過(guò)3百萬(wàn)個(gè)。一個(gè)查詢(xún)串的重復度越高,說(shuō)明查詢(xún)它的用戶(hù)越多,也就是越熱門(mén)。請你統計最熱門(mén)的10個(gè)查詢(xún)串,要求使用的內存不能超過(guò)1G。
(1)請描述你解決這個(gè)問(wèn)題的思路;
(2)請給出主要的處理流程,算法,以及算法的復雜度。
5 集合合并:
給定一個(gè)字符串的集合,格式如: {aaa bbb ccc}, {bbb ddd},{eee fff},{ggg},{ddd hhh} 要求將其中交集不為空的集合合并,要求合并完成后的集合之間無(wú)交集,例如上例應輸出 {aaa bbb ccc ddd hhh},{eee fff}, {ggg}
(1)請描述你解決這個(gè)問(wèn)題的思路;
(2)請給出主要的處理流程,算法,以及算法的復雜度
(3)請描述可能的改進(jìn)(改進(jìn)的方向如效果,性能等等,這是一個(gè)開(kāi)放問(wèn)題)。
/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/p>
1 題
char *revert(char * str)
{
int n=strlen(str);
int i=0;
char c;
for(i=0;i {
c=str;
str=str[n-i];
str[n-i]=c;
}
return str;
}
/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/
2 題
void * memmove(void *dest,const void *src,size_t n)
{
assert((dest!=0)&&(src!=0));
char * temp=(char * )dest;
char * ss=(char * )src;
int i=0;
for(;i {
*temp =*ss ;
}
return temp;
}
/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/
3 題
(1)思路: 字典以字母鍵樹(shù)組織,在用戶(hù)輸入同時(shí)匹配
(2) 流程:
每輸入一個(gè)字母:
沿字典樹(shù)向下一層,
a)若可以順利下行,則繼續至結束,給出結果;
b)若該處不能匹配,糾錯處理,給出拼寫(xiě)建議,繼續至a);
算法:
1.在字典中查找單詞
字典采用27叉樹(shù)組織,每個(gè)節點(diǎn)對應一個(gè)字母,查找就是一個(gè)字母
一個(gè)字母匹配.算法時(shí)間就是單詞的長(cháng)度k.
2.糾錯算法
情況:當輸入的最后一個(gè)字母不能匹配時(shí)就提示出錯,簡(jiǎn)化出錯處理,動(dòng)態(tài)提示可能 處理方法:
(a)當前字母前缺少了一個(gè)字母:搜索樹(shù)上兩層到當前的匹配作為建議;
(b)當前字母拼寫(xiě)錯誤:當前字母的鍵盤(pán)相鄰作為提示;(只是簡(jiǎn)單的描述,可 以有更多的)
根據分析字典特征和用戶(hù)單詞已輸入部分選擇(a),(b)處理
復雜性分析:影響算法的效率主要是字典的實(shí)現與糾錯處理
(a)字典的實(shí)現已有成熟的算法,改進(jìn)不大,也不會(huì )成為瓶頸;
(b)糾錯策略要簡(jiǎn)單有效 ,如前述情況,是線(xiàn)性復雜度;
(3)改進(jìn)
策略選擇最是重要,可以采用統計學(xué)習的方法改進(jìn)。
/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/p>
4 題
(1)思路:用哈希做
(2) 首先逐次讀入查詢(xún)串,算哈希值,保存在內存數組中,同時(shí)統計頻度(注意值與日志項對應關(guān)系) my.chinahrlab.com 選出前十的頻度,取出對應的日志串,簡(jiǎn)單不過(guò)了。哈希的設計是關(guān)鍵。
/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/pic/p>
5 題
(1)思路:先將集合按照大小排列后,優(yōu)先考慮小的集合是否與大的集合有交集。有就合并,如果小集合與所有其他集合都沒(méi)有交集,則獨立。獨立的集合在下一輪的比較中不用考慮。這樣就可以盡量減少字符串的比較次數。當所有集合都獨立的時(shí)候,就終止。
(2)處理流程:
1.將集合按照大小排序,組成集合合并待處理列表
2.選擇最小的集合,找出與之有交集的集合,如果有,合并之;如果無(wú),則與其它集合是獨立集合,從待處理列表 中刪除。
3.重復直到待處理列表為空
算法: 1。將集合按照大小從小到大排序,組成待處理的集合列表。 2。取出待處理集合列表中最小的集合,對于集合的每個(gè)元素,依次在其他集合中搜索是否有此元素存在:
1>若存在,則將此小集合與大集合合并,并根據大小插入對應的位置 。轉3。
2>若不存在,則在該集合中取下一個(gè)元素。如果無(wú)下一個(gè)元素,即所有元素都不存在于其他集合。則表明此集合獨立,從待處理集合列表中刪除。并加入結果集合列表。轉3。
3。如果待處理集合列表不為空,轉2。
如果待處理集合列表為空,成功退出,則結果集合列表就是最終的輸出。
算法復雜度分析:
假設集合的個(gè)數為n,最大的集合元素為m 排序的時(shí)間復雜度可以達到n*log(n) 然后對于元素在其他集合中查找,最壞情況下為(n-1)*m 查找一個(gè)集合是否與其他集合有交集的最壞情況是m*m*(n-1) 合并的時(shí)間復雜度不會(huì )超過(guò)查找集合有交集的最壞情況。所以最終最壞時(shí)間復雜度為O(m*m*n*n)
需要說(shuō)明的是:此算法的平均時(shí)間復雜度會(huì )很低,因為無(wú)論是查找還是合并,都是處于最壞情況的概率很小,而且排序后優(yōu)先用最小集合作為判斷是否獨立的對象,優(yōu)先與最大的集合進(jìn)行比較,這些都最大的回避了最壞情況。
(3)可能的改進(jìn):
首先可以實(shí)現將每個(gè)集合里面的字符串按照字典序進(jìn)行排列,這樣就可以將查找以及合并的效率增高。另外,可能采取恰當的數據結構也可以將查找以及合并等操作的效率得到提高。
、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、、
1)此題10分
對任意輸入的正整數N,編寫(xiě)C程序求N!的尾部連續0的個(gè)數,并指出計算復雜度。如:18!=6402373705728000,尾部連續0的個(gè)數是3。 (不用考慮數值超出計算機整數界限的問(wèn)題)
2)此題10分 編寫(xiě)一個(gè)C語(yǔ)言函數,要求輸入一個(gè)url,輸出該url是首頁(yè)、目錄頁(yè)或者其他url
如下形式叫做首頁(yè):
militia.info/
www.apcnc.com.cn/
/pic/
www.800cool.net/
/pic/
如下形式叫做目錄頁(yè):
thursdaythree.net/greenhouses--gas-global-green-house-warming/
/pic/user/tgk5ar1r/profile/
/pic/food/yszt/chunjie/
www.fuckingjapanese.com/Reality/
請注意:
a) url有可能帶http頭也有可能不帶
b)動(dòng)態(tài)url(即含有"?"的url)的一律不算目錄頁(yè),如:
www.buddhismcity.net/utility/mailit.php?l=/activity/details/3135/
www.buddhismcity.net/utility/mailit.php?l=/activity/details/2449/
另:如果你會(huì )linux,請用linux下的grep命令實(shí)現第2題的功能(附加5分)。
3)此題40分
如果必須從網(wǎng)頁(yè)中區分出一部分"重要網(wǎng)頁(yè)"(例如在10億中選8億),比其他網(wǎng)頁(yè)更值得展現給用戶(hù),請提出一種方案。
4)此題40分
假設有10億網(wǎng)頁(yè)已經(jīng)被我們存下來(lái),并提供如下信息:網(wǎng)頁(yè)全文(即網(wǎng)頁(yè)的源碼)、全文長(cháng)度、網(wǎng)頁(yè)正文(即網(wǎng)頁(yè)中提取的主體文字)、正文長(cháng)度,以及其他網(wǎng)頁(yè)提取物等,現在希望去掉其中的重復網(wǎng)頁(yè),請提出可行的方案,計算出每個(gè)網(wǎng)頁(yè)對應的重復度,你可以自己對網(wǎng)頁(yè)重復下定義,也可以提出需要哪些更多的網(wǎng)頁(yè)提取物來(lái)實(shí)現更好的去重復方案。
更多閱讀推薦:
【小學(xué)生我的家鄉優(yōu)秀作文】相關(guān)文章:
我的家鄉的作文(優(yōu)秀)03-30
(優(yōu)秀)我的家鄉作文01-01
我的家鄉小學(xué)生優(yōu)秀寫(xiě)景作文(精選24篇)03-16
我的家鄉小學(xué)生作文04-01
我的家鄉龍海優(yōu)秀作文09-26
我愛(ài)我的家鄉作文優(yōu)秀12-29
我愛(ài)我的家鄉優(yōu)秀作文01-10
我的家鄉優(yōu)秀作文[集合]02-29
- 相關(guān)推薦