<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    隨筆-295  評論-26  文章-1  trackbacks-0
    字符串切分
    ?package demo.analysis;
    ?
    ?import java.io.IOException;
    ?
    ?import jeasy.analysis.MMAnalyzer;
    ?
    ?public class Segment?
    ?{
    ????????
    ???? public static void main(String[] args)?
    ???? {
    ???????? String text = "據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示,"
    ??????????????? + "日惹市附近當地時間27日晨5時53分發生的里氏6.2級地震已經造成至少5427人死亡,"
    ??????????????? + "20000余人受傷,近20萬人無家可歸。";?
    ?????????
    ???????? MMAnalyzer analyzer = new MMAnalyzer();
    ???????? try?
    ???????? {
    ???????????????? System.out.println(analyzer.segment(text, " | "));
    ???????? }?
    ???????? catch (IOException e)?
    ???????? {
    ???????????????? e.printStackTrace();
    ???????? }
    ???? }
    ?}
    ?
    生成效果:
    據 | 路透社 | 報道 | 印度尼西亞 | 社會 | 事務 | 部 | 官員 | 星期二 | 29日 | 表示 | 日惹 | 市 |
    附近 | 當地時間 | 27日 | 晨 | 5時 | 53分 | 發生 | 里氏 | 6.2級 | 地震 | 已經 | 造成 | 至少 |
    5427人 | 死亡 | 20000 | 余人 | 受傷 | 近 | 20萬人 | 無家可歸 |
    ?
    Lucene搜索
    ?package demo.analysis;
    ?
    ?import jeasy.analysis.MMAnalyzer;
    ?
    ?import org.apache.lucene.analysis.Analyzer;
    ?import org.apache.lucene.document.Document;
    ?import org.apache.lucene.document.Field;
    ?import org.apache.lucene.index.IndexWriter;
    ?import org.apache.lucene.queryParser.QueryParser;
    ?import org.apache.lucene.search.Hits;
    ?import org.apache.lucene.search.IndexSearcher;
    ?import org.apache.lucene.search.Query;
    ?import org.apache.lucene.store.Directory;
    ?import org.apache.lucene.store.RAMDirectory;
    ?
    ?public class Segment?
    ?{
    ?????
    ???? public static void main(String[] args)?
    ???? {
    ???????? String fieldName = "text";
    ???????? String text = "據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示,"
    ???????????? + "日惹市附近當地時間27日晨5時53分發生的里氏6.2級地震已經造成至少5427人死亡,"
    ???????????? + "20000余人受傷,近20萬人無家可歸。"; //檢索內容
    ?
    ???????? //采用正向最大匹配的中文分詞算法
    ???????? Analyzer analyzer = new MMAnalyzer();
    ?
    ???????? Directory directory = new RAMDirectory();
    ???????? //Directory directory = FSDirectory.getDirectory("/tmp/testindex", true);
    ?
    ???????? try
    ????????? {
    ???????????? IndexWriter iwriter = new IndexWriter(directory, analyzer, true);
    ???????????? iwriter.setMaxFieldLength(25000);
    ???????????? Document doc = new Document();
    ???????????? doc.add(new Field(fieldName, text, Field.Store.YES, Field.Index.TOKENIZED));
    ???????????? iwriter.addDocument(doc);
    ???????????? iwriter.close();
    ?????????????
    ???????????? IndexSearcher isearcher = new IndexSearcher(directory);
    ???????????? QueryParser parser = new QueryParser(fieldName, analyzer);
    ???????????? Query query = parser.parse("印度尼西亞 6.2級地震");//檢索詞
    ???????????? Hits hits = isearcher.search(query);
    ???????????? System.out.println("命中:" + hits.length());
    ?
    ???????????? for (int i = 0; i < hits.length(); i++)?
    ???????????? {
    ???????????????? Document hitDoc = hits.doc(i);
    ???????????????? System.out.println("內容:" + hitDoc.get(fieldName));
    ???????????? }
    ?
    ???????????? isearcher.close();
    ???????????? directory.close();
    ???????? }?
    ???????? catch (Exception e)?
    ???????? {
    ???????????? e.printStackTrace();
    ???????? }???
    ???? }
    ?????
    ?}
    ?
    生成效果:
    命中:1
    內容:據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示,日惹市附近當地時間27日晨5時53分發生的
    里氏6.2級地震已經造成至少5427人死亡,20000余人受傷,近20萬人無家可歸。
    搜索詞加亮
    ?package demo.analysis;
    ?
    ?import jeasy.analysis.MMAnalyzer;
    ?
    ?import org.apache.lucene.analysis.Analyzer;
    ?import org.apache.lucene.analysis.TokenStream;
    ?import org.apache.lucene.document.Document;
    ?import org.apache.lucene.document.Field;
    ?import org.apache.lucene.index.IndexReader;
    ?import org.apache.lucene.index.IndexWriter;
    ?import org.apache.lucene.index.TermPositionVector;
    ?import org.apache.lucene.queryParser.QueryParser;
    ?import org.apache.lucene.search.Hits;
    ?import org.apache.lucene.search.IndexSearcher;
    ?import org.apache.lucene.search.Query;
    ?import org.apache.lucene.search.highlight.Highlighter;
    ?import org.apache.lucene.search.highlight.QueryScorer;
    ?import org.apache.lucene.search.highlight.TokenSources;
    ?import org.apache.lucene.store.Directory;
    ?import org.apache.lucene.store.RAMDirectory;
    ?
    ?public class Segment
    ?{
    ?
    ???? public static void main(String[] args)
    ???? {
    ???????? String fieldName = "text";
    ???????? String text = "據路透社報道,印度尼西亞社會事務部一官員星期二(29日)表示,"
    ???????????? + "日惹市附近當地時間27日晨5時53分發生的里氏6.2級地震已經造成至少5427人死亡,"
    ???????????? + "20000余人受傷,近20萬人無家可歸。"; //檢索內容
    ?
    ???????? //采用正向最大匹配的中文分詞算法
    ???????? Analyzer analyzer = new MMAnalyzer();
    ?
    ???????? Directory directory = new RAMDirectory();
    ???????? //Directory directory = FSDirectory.getDirectory("/tmp/testindex", true);
    ?
    ???????? try
    ???????? {
    ???????????? IndexWriter iwriter = new IndexWriter(directory, analyzer, true);
    ???????????? iwriter.setMaxFieldLength(25000);
    ???????????? Document doc = new Document();
    ???????????? doc.add(new Field(fieldName, text, Field.Store.YES,
    ???????????????????? Field.Index.TOKENIZED,
    ???????????????????? Field.TermVector.WITH_POSITIONS_OFFSETS));
    ???????????? iwriter.addDocument(doc);
    ???????????? iwriter.close();
    ?
    ???????????? IndexSearcher isearcher = new IndexSearcher(directory);
    ???????????? QueryParser parser = new QueryParser(fieldName, analyzer);
    ???????????? Query query = parser.parse("印度尼西亞 6.2級地震");//檢索詞
    ???????????? Hits hits = isearcher.search(query);
    ???????????? System.out.println("命中:" + hits.length());
    ?
    ???????????? Highlighter highlighter = new Highlighter(new QueryScorer(query));
    ???????????? for (int i = 0; i < hits.length(); i++)
    ???????????? {
    ???????????????? text = hits.doc(i).get(fieldName);
    ???????????????? TermPositionVector tpv = (TermPositionVector) IndexReader.open(
    ???????????????????? directory).getTermFreqVector(hits.id(i), fieldName);
    ???????????????? TokenStream tokenStream = TokenSources.getTokenStream(tpv);
    ???????????????? String result = highlighter.getBestFragments(tokenStream, text, 3, "...");
    ???????????????? System.out.println("內容:" + result);
    ???????????? }
    ?
    ???????????? isearcher.close();
    ???????????? directory.close();
    ???????? }
    ???????? catch (Exception e)
    ???????? {
    ???????????? e.printStackTrace();
    ???????? }
    ???? }
    ?
    ?}
    ?
    生成效果:
    命中:1
    內容:據路透社報道,<B>印度尼西亞</B>社會事務部一官員星期二(29日)表示,日惹市附近當地時間27日晨
    5時53分發生的里氏<B>6.2級</B><B>地震</B>已經造成至少5427人死亡,20000余人受傷,近20萬人無家可歸


    大盤預測 國富論
    posted on 2008-10-29 10:21 華夢行 閱讀(902) 評論(0)  編輯  收藏

    只有注冊用戶登錄后才能發表評論。


    網站導航:
     
    主站蜘蛛池模板: 伊人久久大香线蕉亚洲| 久久精品无码精品免费专区| 一级中文字幕免费乱码专区| 一级成人生活片免费看| 成人啪精品视频免费网站| 亚洲日本va午夜中文字幕一区| 羞羞视频免费网站日本| 国产成人午夜精品免费视频| 亚洲综合伊人久久大杳蕉| 亚洲va久久久久| 色在线亚洲视频www| 特级毛片免费观看视频| 又爽又高潮的BB视频免费看 | 色窝窝亚洲av网| 国产男女猛烈无遮档免费视频网站 | 免费阿v网站在线观看g| 日本亚洲精品色婷婷在线影院| 中文字幕无码视频手机免费看| 亚洲字幕在线观看| 成人黄18免费视频| 色婷婷精品免费视频| 国产L精品国产亚洲区久久| 免费国产污网站在线观看| 久久狠狠高潮亚洲精品| 国产美女在线精品免费观看| 色窝窝亚洲av网| 国产亚洲综合成人91精品| 最近中文字幕2019高清免费| 亚洲熟妇AV日韩熟妇在线| 亚洲国产激情一区二区三区| 青青操在线免费观看| 亚洲人成电影网站| 免费在线观看中文字幕| 一区二区三区在线免费看| 在线观看亚洲AV日韩A∨| 亚洲熟妇少妇任你躁在线观看无码| 久久免费观看国产精品88av| 亚洲色大成网站www永久网站| 国产成人精品亚洲精品| 精品国产污污免费网站aⅴ| 美女又黄又免费的视频|