<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 30,  comments - 3,  trackbacks - 0
    大致內容:
    這篇論文的任務是對twitter上的短文本進行分類,分到預先定義的5個類別中:news,event,opinions,deal,PM(private message)。該論文摒棄傳統的BOW特征模型而別出心裁地選取了8個特征(8F):
    1個是名詞性特性:用戶。這個特征是8F特征中最為主要的特征,因為它反映了信息源的主要類別特征。如,企業的用戶和個人用戶通常有著不同的用戶行為,這個特征可以限定該用戶tweet的分類范圍。
    另外7個是binary feature(存在特征):
    俚語與詞語縮寫的使用:俚語和詞語縮寫通常不會是一個新聞
    time-event短語:Event類別的重要特征
    評論性詞語:Opinion類重要特征
    詞語的強調(大寫或字母重要,如veeery):同上
    currency和percentage標志:如¥$%,這些都是Deal類別的重要特征
    @usrname:這是PM的重要特征,當然也有可能是Event類中的一個特征(participants)。
    實驗表明8F比BOW在精度上均為大幅提高。

    使用工具:
    weka

    論文:
    Bharath Sriram, Dave Fuhry, Engin Demir, Hakan Ferhatosmanoglu, Murat Demirbas:Short Text Classification in Twitter to Improve Information Filtering. Proceeding of the 33rd international ACM SIGIR conference on Research and development in information retrieval, Jul. 2010

    論文鏈接:
    SIGIR2010_Short_Text_Classification_in_Twitter_to_Improve_Information_Filtering.pdf
    posted on 2012-02-18 12:32 Seraphi 閱讀(1290) 評論(0)  編輯  收藏

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 亚洲&#228;v永久无码精品天堂久久| 在线看片v免费观看视频777| 久久免费的精品国产V∧| 99视频免费观看| 大学生一级毛片免费看| 国产一级高清免费观看| 亚洲伊人久久综合中文成人网| 亚洲天堂一区二区| 亚洲色欲色欲www在线播放| 男人扒开添女人下部免费视频| 99久久精品毛片免费播放| 波多野结衣在线免费视频| 又黄又爽的视频免费看| 亚洲av永久无码精品漫画| 亚洲熟妇无码八V在线播放| 人人鲁免费播放视频人人香蕉| 男的把j放进女人下面视频免费| 国内精品乱码卡1卡2卡3免费| 国产99视频精品免费视频7| 国产精品亚洲片在线观看不卡| 亚洲中文无码线在线观看| 特级毛片A级毛片100免费播放| 男人天堂免费视频| 扒开双腿猛进入爽爽免费视频| 中文字幕亚洲一区二区三区 | 亚洲福利精品电影在线观看| 亚洲AV无码专区亚洲AV伊甸园| 亚洲综合成人婷婷五月网址| 精品一区二区三区免费观看| 99久久久精品免费观看国产| 国产国拍亚洲精品福利| 亚洲欧洲日本在线观看| 中文字幕成人免费高清在线视频| 永久免费的网站在线观看| 亚洲女初尝黑人巨高清| 亚洲国产美女精品久久久| 99国产精品免费视频观看| 男人的天堂亚洲一区二区三区 | 夜夜爽妓女8888视频免费观看| 亚洲电影免费观看| 亚洲视频在线一区二区|