<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 8, comments - 0, trackbacks - 0, articles - 0

    2008年4月6日

     

    package indexer;
    //package ch2.lucenedemo.process;

    import java.io.File;

    import java.io.IOException;
    import java.util.ArrayList;
    import java.util.logging.Level;
    import java.util.logging.Logger;
    import jeasy.analysis.MMAnalyzer;

    import org.apache.lucene.document.Document;
    import org.apache.lucene.document.Field;
    import org.apache.lucene.index.IndexWriter;
    import org.apache.lucene.store.Directory;
    import org.apache.lucene.store.FSDirectory;
    import parameters.Param;
    import pretreat.FileControl;

    public class IndexOnFS implements IIndexTool{
        
    // 成員變量存儲創建的索引文件存放的位置
        private String INDEX_STORE_PATH = Param.INDEX_STORE_PATH;
            
    //建立索引的目標文件
            private String INDEX_WANTED_PATH = "e:\\";
            
    //目錄數組總數
            private int NumOfDir = 0;
            
    //存放根目錄下的所有子目錄
            private ArrayList<String> DirList = new ArrayList<String>();
            
    //地址映射
            private Directory dir = null;
            
            
    private IndexWriter writer;
            
            
    public IndexOnFS(String path){
                    
    try {
                        dir 
    = FSDirectory.getDirectory(INDEX_STORE_PATH);
                    } 
    catch (IOException ex) {
                        Logger.getLogger(IndexOnFS.
    class.getName()).log(Level.SEVERE, null, ex);
                    }
                    INDEX_WANTED_PATH 
    = path;
                    makeSegments();
                    searchDirectorys(path);
            }

            
    //建立索引之前遍歷所有目錄并存放,這是為了迎合IndexWriter的同步機制
            public void searchDirectorys(String rootDir){
            
                    File rootfile 
    = new File(rootDir);
                    File[] files 
    = rootfile.listFiles();
                    
    if(files!=null)
                    
    for (int i = 0; i < files.length; i++){
                        
    if(files[i].isDirectory()){
                           DirList.add(files[i].getPath());
                           searchDirectorys(files[i].getPath()); 
                        }
                    }
            }
            
    public void printAllDirectorys(){
                    
    for(int i = 0;i<DirList.size();i++)
                           System.out.println(DirList.get(i));
            }
            
    public void createIndexs() {
                    createIndex(INDEX_WANTED_PATH);
                    
    for(int k = 0;k<DirList.size();k++)
                        createIndex(DirList.get(k));
            }
            
    public Document preIndexWrite(File file){
                    
    // 創建一個新的Document
                Document doc = new Document();
                
    // 文件名對應的Field
                Field field = new Field("filename", file.getName(), 
                                     Field.Store.YES, Field.Index.TOKENIZED); 
            doc.add(field);
            
    // 文件內容對應的Filed
            field = new Field("content", FileControl.fileToString(file),//轉到控制器
                       Field.Store.NO, Field.Index.TOKENIZED);
            doc.add(field);
                    
    //文件路徑對應的Filed
                    field = new Field("filepath", file.getPath(), 
                               Field.Store.YES, Field.Index.TOKENIZED); 
            doc.add(field);
                    
                    
    return doc;
            }
        
    /*單目錄創建索引*/
        
    public void createIndex(String inputDir) {
            
    try {
                
    /*MMAnalyzer作為分詞工具創建一個IndexWriter*/
                    writer 
    = new IndexWriter(dir,new MMAnalyzer(), false); /*第一次創建索引時為true*/
                File filesDir 
    = new File(inputDir);
                
    /*取得所有需要建立索引的文件數組*/
                File[] files 
    = filesDir.listFiles();
                
    /*遍歷數組*/
                            
    if(files!=null)
                
    for (int i = 0; i < files.length; i++) { 
                                  
    /*判斷是否為文件*/
                                  
    if(files[i].isFile()){ 
                        
    /*把Document加入IndexWriter*/
                        writer.addDocument(preIndexWrite(files[i]));  
                                            System.out.println( files[i].getPath());
                            }
                                        } 
                            writer.optimize(); 
    /*索引優化*/

            } 
    catch (Exception e) { e.printStackTrace(); }
                    
                    
    finally
                        
    try{writer.close();
                        }
    catch(Exception ee){ ee.printStackTrace(); }
                    }

        }
            
    //初始化空索引庫
            public void makeSegments(){
                
    if(new File(INDEX_STORE_PATH).list().length==0){
                    
    try {
                        IndexWriter iw 
    = new IndexWriter(dir, new MMAnalyzer(), true);
                        writer.addDocument(preIndexWrite(
    new File(Param.INITFILE_PATH)));
                    } 
    catch (Exception ex) { ex.printStackTrace(); } 
                    
                    
    finally
                          
    try{writer.close();
                          }
    catch(Exception ee){ ee.printStackTrace(); }
                      }
                }
            }
            
    public ArrayList getDirs(){
                
    return this.DirList;
            }
            
            
    public void startIndex() {
                makeSegments();
                createIndexs();
            }

        
    public static void main(String[] args) {
            IndexOnFS processor 
    = new IndexOnFS("e:\\畢業論文");
                    
    //processor.searchDirectorys("e:\\1");
                    processor.startIndex();
        }


    }

    posted @ 2008-06-01 05:11 HanLab 閱讀(225) | 評論 (0)編輯 收藏

    這是我做畢業設計時畫的,感覺還可以就放過來共享,有什么不足的地方,請多指點。

    看Lucene代碼也算是中享受,根據下圖可以先看看關鍵類的代碼。
    Lucene2.3.1發布不久,源代碼下載地址:http://apache.mirror.phpchina.com/lucene/java/


     

     

     org.apache.Lucene.search/

     搜索入口

     org.apache.Lucene.index/

     索引入口

     org.apache.Lucene.analysis/

     語言分析器

     org.apache.Lucene.queryParser/

    查詢分析器

     org.apache.Lucene.document/

     存儲結構

     org.apache.Lucene.store/ 

     底層IO/存儲結構

     org.apache.Lucene.util/

     一些公用的數據結構


     

     

    posted @ 2008-04-06 17:02 HanLab 閱讀(411) | 評論 (0)編輯 收藏

    主站蜘蛛池模板: 亚洲一级毛片免费观看| igao激情在线视频免费| 亚洲国产成人久久一区久久| 国产成人无码精品久久久免费| 亚洲成色WWW久久网站| 99国产精品永久免费视频| 久久亚洲精品无码av| 伊人久久亚洲综合| 美女网站免费福利视频| 黄页视频在线观看免费| 亚洲VA中文字幕不卡无码| 在线精品免费视频| 欧洲人免费视频网站在线| 亚洲人成人伊人成综合网无码| 中文字幕亚洲日本岛国片| 美女内射毛片在线看免费人动物| 爱情岛论坛免费视频| 亚洲最大福利视频网站| 日韩免费福利视频| 一级毛片不卡片免费观看| 免费国产草莓视频在线观看黄| 亚洲美女在线观看播放| 亚洲日本在线观看视频| 国产免费不卡v片在线观看| A国产一区二区免费入口| 亚洲国产欧美国产综合一区| 亚洲AV无码一区二区乱子伦| 免费一级大黄特色大片| 亚洲一级免费视频| 中文字幕视频免费在线观看| 亚洲男同gay片| 亚洲精品国产啊女成拍色拍| 免费大黄网站在线观看| 成年男女男精品免费视频网站| 久久国产精品一区免费下载| 亚洲av成人一区二区三区观看在线| 亚洲高清免费在线观看| 亚洲日韩中文无码久久| 国产成人精品免费直播| 国产精品成人免费一区二区| 无码人妻AV免费一区二区三区|