排序經(jīng)常會用,但是怎么在大數(shù)據(jù)中,以Map,Reduce這種形式來進(jìn)行實現(xiàn)了?

首先你要明確目標(biāo)對象,對誰進(jìn)行排序,如果是自定義的對象,需要實現(xiàn)其CompareTo方法,因為這個是對象之間比較大小的方法。
另外你需要設(shè)計排序策略,特殊情況,正常情況,編程的時候,應(yīng)該先寫特殊情況,最后寫正常情況,這樣的話,邏輯更加清晰。
如何設(shè)計呢?
首先按照正常邏輯寫好Map和Reduce程序,然后輸出,最后得到的是一些文本,
在寫一個Map,Reduce程序在寫,進(jìn)行排序。思想也是一樣的,偏移量為key,(剛學(xué)的時候,不知道什么是偏移量,后來才明白,是字段的偏移量,比如第一行,開始偏移量為1,第二行,偏移量就是11,為什么,因為,第一行有10個字符,占據(jù)了10位)
在所有的mapreduce程序當(dāng)中k1,v1,k2,v2,k3,v3中的k1一點用都沒有,至于其他的k2和v2,他們可以自己進(jìn)行設(shè)計,這些都只是輸出,可以是對象,也可以是數(shù)值,包括v3,也可以是NULLwriteable等等之類的。
另外有需要云服務(wù)器可以了解下創(chuàng)新互聯(lián)scvps.cn,海內(nèi)外云服務(wù)器15元起步,三天無理由+7*72小時售后在線,公司持有idc許可證,提供“云服務(wù)器、裸金屬服務(wù)器、高防服務(wù)器、香港服務(wù)器、美國服務(wù)器、虛擬主機(jī)、免備案服務(wù)器”等云主機(jī)租用服務(wù)以及企業(yè)上云的綜合解決方案,具有“安全穩(wěn)定、簡單易用、服務(wù)可用性高、性價比高”等特點與優(yōu)勢,專為企業(yè)上云打造定制,能夠滿足用戶豐富、多元化的應(yīng)用場景需求。
分享文章:Hadoop中的排序的設(shè)計-創(chuàng)新互聯(lián)
鏈接URL:http://www.chinadenli.net/article10/dccjgo.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供網(wǎng)站策劃、軟件開發(fā)、定制網(wǎng)站、網(wǎng)站排名、網(wǎng)站建設(shè)、服務(wù)器托管
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時間刪除。文章觀點不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容