<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 495,comments - 227,trackbacks - 0
    http://www.linuxidc.com/Linux/2012-07/65008.htm


    推薦器實(shí)現(xiàn)類在:

    org.apache.mahout.cf.taste.Hadoop.item.RecommenderJob。其輸入數(shù)據(jù)放在默認(rèn)輸入目錄下,使用mapred.input.dir參數(shù)指定的輸入數(shù)據(jù),是userID,itemID[,preferencevalue]值對(duì)形成的文本文件。可以有多個(gè)文件存放在該目錄下。

    運(yùn)行時(shí)相關(guān)參數(shù)如下:

    numRecommendations:為每個(gè)用戶產(chǎn)生的推薦個(gè)數(shù) "Number of recommendations per user"

    usersFile:包含待推薦用戶的用戶ID列表;

    itemsFile:包含待推薦項(xiàng)目的項(xiàng)目ID列表;

    filterFile:用來做推薦過濾的訓(xùn)練文件,內(nèi)容為使用逗號(hào)分隔的userID,itemID對(duì),

    booleanData:不帶推薦值的訓(xùn)練數(shù)據(jù)文件;

    maxPrefsPerUser:Maximum number of preferences considered per user in final recommendation phase;

    minPrefsPerUser:ignore users with less preferences than this in the similarity computation ;   maxSimilaritiesPerItem:Maximum number of similarities considered per item;

    maxurrencesPerItem:try to cap the number of urrences per item to this;

    similarityClassname:Name of distributed similarity class to instantiate, alternatively use one of the predefined similarities,可用的相似度類有:

     SIMILARITY_URRENCE(DistributedurrenceVectorSimilarity.class),

     SIMILARITY_EUCLIDEAN_DISTANCE(DistributedEuclideanDistanceVectorSimilarity.class),

     SIMILARITY_LOGLIKELIHOOD(DistributedLoglikelihoodVectorSimilarity.class),

     SIMILARITY_PEARSON_CORRELATION(DistributedPearsonCorrelationVectorSimilarity.class),

     SIMILARITY_TANIMOTO_COEFFICIENT(DistributedTanimotoCoefficientVectorSimilarity.class),

     SIMILARITY_UNCENTERED_COSINE(DistributedUncenteredCosineVectorSimilarity.class),

     SIMILARITY_UNCENTERED_ZERO_ASSUMING_COSINE(DistributedUncenteredZeroAssumingCosineVectorSimilarity.class),

     SIMILARITY_CITY_BLOCK(DistributedCityBlockVectorSimilarity.class);

    RecommendJob運(yùn)行一系列MR任務(wù),在開發(fā)時(shí),可以根據(jù)自己的需要進(jìn)行改寫。但是RecommendJob申明成final,這個(gè)比較頭疼。

    1.itemIDIndex 任務(wù):

    map:解析輸入的itemsFile;將長整型的ID通過算法映射到整形的序號(hào)上,以便后續(xù)處理。由于處理中涉及到矩陣計(jì)算,每一個(gè)項(xiàng)目對(duì)應(yīng)矩陣中的一個(gè)維度,所以必須處理成整形;產(chǎn)生序號(hào)-ID值對(duì);

    reducer:對(duì)序號(hào)-ID對(duì)進(jìn)行驗(yàn)證,產(chǎn)生序號(hào)-ID值對(duì);

    2.toUserVector任務(wù):

    ToItemPrefsMapper:從filterFile中讀取偏好信息,轉(zhuǎn)成用戶-偏好值對(duì)。

    ToUserVectorReducer:將用戶-偏好*,轉(zhuǎn)成用戶-偏好矢量對(duì),矢量表即為所有的ItemID。

    3.countUsers 任務(wù):計(jì)算用戶數(shù)量,輸出為用戶數(shù)量--空。

    4.maybePruneAndTransponse,一個(gè)名稱很奇怪的任務(wù)。

    MaybePruneRowsMapper:輸入為任務(wù)2的輸出,生成針對(duì)每個(gè)item項(xiàng)目的推薦值矩陣單元,即Item序號(hào)和矩陣單元的值對(duì)。

    ToItemVectorsReducer:輸出為矩陣行號(hào)(即Item序號(hào))-矩陣行矢量

    5. RowSimilarityJob: 計(jì)算相似度矩陣:這是引用一個(gè)現(xiàn)有的任務(wù)來完成計(jì)算,輸入為任務(wù)4輸出的矩陣;輸出為相似度矩陣,即item-相似度矢量。其中相似度矢量是當(dāng)前item和其他item的相似度值形成的矢量。

    6. prePartialMultiply1:輸入為任務(wù)5的輸出,將相似度矩陣中的對(duì)角線行,即(N,N)數(shù)值設(shè)置為Double.NaN,為后續(xù)計(jì)算做準(zhǔn)備;

    7. prePartialMultiply2:輸入為任務(wù)2的輸出,將user-(項(xiàng)目矢量),拆分成item-(userId, 推薦值)對(duì)。如果設(shè)置了usersFile,則僅處理usersFile中指定的用戶。

    8. partialMultiply: 合并任務(wù)6和7的額輸出,變成item-(相似度矢量、userId、推薦值) 對(duì)。

    9. itemFiltering:如果有filterFile,則處理filterFile文件,轉(zhuǎn)換成item-(相似度矢量、userId、推薦值)對(duì)。其中相似度矢量的值為0;

    aggregateAndRecommend:將8和9的輸出合并作為輸入,

    PartialMultiplyMapper: 將item-(相似度矢量、userId、推薦值)集轉(zhuǎn)換成userId-(推薦值,相似度矢量)值對(duì);

    AggregateAndRecommendReducer:匯總map輸出,產(chǎn)生userId-((itemId, 推薦值)列表)值對(duì),其中(itemId, 推薦值)列表是按照推薦度來排序,如果maxPrefsPerUser、minPrefsPerUser、maxurrencesPerItem,則只產(chǎn) 生符合條件的userId值對(duì)。

    posted on 2014-12-04 14:39 SIMONE 閱讀(679) 評(píng)論(0)  編輯  收藏 所屬分類: hadoop mahout

    只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


    網(wǎng)站導(dǎo)航:
     
    主站蜘蛛池模板: 国产精品久久香蕉免费播放| 亚洲精品国产第一综合99久久| 麻豆国产入口在线观看免费| 亚洲视频在线免费观看| 人妻18毛片a级毛片免费看| 在线综合亚洲欧洲综合网站| 日韩亚洲AV无码一区二区不卡 | 香蕉视频在线观看亚洲| 亚洲色欲久久久久综合网| 女人被弄到高潮的免费视频| 亚洲一区二区三区免费视频| 国产婷婷成人久久Av免费高清| 一区二区3区免费视频| 精品亚洲视频在线| 亚洲av无码日韩av无码网站冲| 亚洲AV无码成人专区| 亚洲黑人嫩小videos| 亚洲视频在线观看一区| 亚洲AV无码成人精品区在线观看| 国产亚洲日韩一区二区三区| 亚洲国产黄在线观看| 四虎影视永久免费观看| 国产男女猛烈无遮档免费视频网站 | 在线观看亚洲一区二区| 久久精品国产亚洲香蕉| 日韩亚洲一区二区三区| 亚洲国产第一站精品蜜芽| 亚洲国产精华液网站w| 亚洲精品国产成人片| 亚洲深深色噜噜狠狠爱网站| 国产av无码专区亚洲av果冻传媒 | 美女视频免费看一区二区| 亚洲AV成人精品日韩一区| 国产亚洲欧美在线观看| 国产精品日本亚洲777| 高潮毛片无遮挡高清免费视频 | 亚洲人成无码网WWW| 亚洲一区二区精品视频| 国产亚洲色视频在线| 国产v亚洲v天堂无码网站| 亚洲精品国产成人专区|