<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 30,  comments - 3,  trackbacks - 0
    大致內容:
    這篇論文的任務是對twitter上的短文本進行分類,分到預先定義的5個類別中:news,event,opinions,deal,PM(private message)。該論文摒棄傳統的BOW特征模型而別出心裁地選取了8個特征(8F):
    1個是名詞性特性:用戶。這個特征是8F特征中最為主要的特征,因為它反映了信息源的主要類別特征。如,企業的用戶和個人用戶通常有著不同的用戶行為,這個特征可以限定該用戶tweet的分類范圍。
    另外7個是binary feature(存在特征):
    俚語與詞語縮寫的使用:俚語和詞語縮寫通常不會是一個新聞
    time-event短語:Event類別的重要特征
    評論性詞語:Opinion類重要特征
    詞語的強調(大寫或字母重要,如veeery):同上
    currency和percentage標志:如¥$%,這些都是Deal類別的重要特征
    @usrname:這是PM的重要特征,當然也有可能是Event類中的一個特征(participants)。
    實驗表明8F比BOW在精度上均為大幅提高。

    使用工具:
    weka

    論文:
    Bharath Sriram, Dave Fuhry, Engin Demir, Hakan Ferhatosmanoglu, Murat Demirbas:Short Text Classification in Twitter to Improve Information Filtering. Proceeding of the 33rd international ACM SIGIR conference on Research and development in information retrieval, Jul. 2010

    論文鏈接:
    SIGIR2010_Short_Text_Classification_in_Twitter_to_Improve_Information_Filtering.pdf
    posted on 2012-02-18 12:32 Seraphi 閱讀(1290) 評論(0)  編輯  收藏

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 奇米影视亚洲春色| 2019亚洲午夜无码天堂| 久9久9精品免费观看| 亚洲伦理一二三四| 在线a亚洲v天堂网2018| 男的把j放进女人下面视频免费| 亚洲AV无码久久久久网站蜜桃 | 亚洲av无码片在线观看| 波多野结衣免费视频观看| 久久久久高潮毛片免费全部播放 | 亚洲中文久久精品无码| 希望影院高清免费观看视频| 美女视频免费看一区二区| 久久亚洲熟女cc98cm| 亚洲国产成人乱码精品女人久久久不卡| 国产偷伦视频免费观看| 蜜桃传媒一区二区亚洲AV| 91亚洲精品第一综合不卡播放| 国产成人精品免费直播| 91热久久免费精品99| 有色视频在线观看免费高清在线直播 | 欧美大尺寸SUV免费| 免费人成毛片动漫在线播放| 亚洲成av人无码亚洲成av人 | 99精品视频免费| 色天使色婷婷在线影院亚洲| 亚洲自偷自拍另类12p| 国产亚洲精品免费视频播放| 成人免费视频一区二区三区| 一级毛片免费视频| 久99久无码精品视频免费播放| 亚洲色偷偷色噜噜狠狠99网| 麻豆亚洲av熟女国产一区二| 亚洲综合在线另类色区奇米| 成人免费视频国产| 91免费资源网站入口| 最近中文字幕免费完整| 久爱免费观看在线网站| 国产精品福利片免费看| 黄页网站在线免费观看| 亚洲AV成人精品日韩一区|