<rt id="bn8ez"></rt>
<label id="bn8ez"></label>

  • <span id="bn8ez"></span>

    <label id="bn8ez"><meter id="bn8ez"></meter></label>

    posts - 8, comments - 0, trackbacks - 0, articles - 0

    2008年6月1日

     

    package indexer;
    //package ch2.lucenedemo.process;

    import java.io.File;

    import java.io.IOException;
    import java.util.ArrayList;
    import java.util.logging.Level;
    import java.util.logging.Logger;
    import jeasy.analysis.MMAnalyzer;

    import org.apache.lucene.document.Document;
    import org.apache.lucene.document.Field;
    import org.apache.lucene.index.IndexWriter;
    import org.apache.lucene.store.Directory;
    import org.apache.lucene.store.FSDirectory;
    import parameters.Param;
    import pretreat.FileControl;

    public class IndexOnFS implements IIndexTool{
        
    // 成員變量存儲創建的索引文件存放的位置
        private String INDEX_STORE_PATH = Param.INDEX_STORE_PATH;
            
    //建立索引的目標文件
            private String INDEX_WANTED_PATH = "e:\\";
            
    //目錄數組總數
            private int NumOfDir = 0;
            
    //存放根目錄下的所有子目錄
            private ArrayList<String> DirList = new ArrayList<String>();
            
    //地址映射
            private Directory dir = null;
            
            
    private IndexWriter writer;
            
            
    public IndexOnFS(String path){
                    
    try {
                        dir 
    = FSDirectory.getDirectory(INDEX_STORE_PATH);
                    } 
    catch (IOException ex) {
                        Logger.getLogger(IndexOnFS.
    class.getName()).log(Level.SEVERE, null, ex);
                    }
                    INDEX_WANTED_PATH 
    = path;
                    makeSegments();
                    searchDirectorys(path);
            }

            
    //建立索引之前遍歷所有目錄并存放,這是為了迎合IndexWriter的同步機制
            public void searchDirectorys(String rootDir){
            
                    File rootfile 
    = new File(rootDir);
                    File[] files 
    = rootfile.listFiles();
                    
    if(files!=null)
                    
    for (int i = 0; i < files.length; i++){
                        
    if(files[i].isDirectory()){
                           DirList.add(files[i].getPath());
                           searchDirectorys(files[i].getPath()); 
                        }
                    }
            }
            
    public void printAllDirectorys(){
                    
    for(int i = 0;i<DirList.size();i++)
                           System.out.println(DirList.get(i));
            }
            
    public void createIndexs() {
                    createIndex(INDEX_WANTED_PATH);
                    
    for(int k = 0;k<DirList.size();k++)
                        createIndex(DirList.get(k));
            }
            
    public Document preIndexWrite(File file){
                    
    // 創建一個新的Document
                Document doc = new Document();
                
    // 文件名對應的Field
                Field field = new Field("filename", file.getName(), 
                                     Field.Store.YES, Field.Index.TOKENIZED); 
            doc.add(field);
            
    // 文件內容對應的Filed
            field = new Field("content", FileControl.fileToString(file),//轉到控制器
                       Field.Store.NO, Field.Index.TOKENIZED);
            doc.add(field);
                    
    //文件路徑對應的Filed
                    field = new Field("filepath", file.getPath(), 
                               Field.Store.YES, Field.Index.TOKENIZED); 
            doc.add(field);
                    
                    
    return doc;
            }
        
    /*單目錄創建索引*/
        
    public void createIndex(String inputDir) {
            
    try {
                
    /*MMAnalyzer作為分詞工具創建一個IndexWriter*/
                    writer 
    = new IndexWriter(dir,new MMAnalyzer(), false); /*第一次創建索引時為true*/
                File filesDir 
    = new File(inputDir);
                
    /*取得所有需要建立索引的文件數組*/
                File[] files 
    = filesDir.listFiles();
                
    /*遍歷數組*/
                            
    if(files!=null)
                
    for (int i = 0; i < files.length; i++) { 
                                  
    /*判斷是否為文件*/
                                  
    if(files[i].isFile()){ 
                        
    /*把Document加入IndexWriter*/
                        writer.addDocument(preIndexWrite(files[i]));  
                                            System.out.println( files[i].getPath());
                            }
                                        } 
                            writer.optimize(); 
    /*索引優化*/

            } 
    catch (Exception e) { e.printStackTrace(); }
                    
                    
    finally
                        
    try{writer.close();
                        }
    catch(Exception ee){ ee.printStackTrace(); }
                    }

        }
            
    //初始化空索引庫
            public void makeSegments(){
                
    if(new File(INDEX_STORE_PATH).list().length==0){
                    
    try {
                        IndexWriter iw 
    = new IndexWriter(dir, new MMAnalyzer(), true);
                        writer.addDocument(preIndexWrite(
    new File(Param.INITFILE_PATH)));
                    } 
    catch (Exception ex) { ex.printStackTrace(); } 
                    
                    
    finally
                          
    try{writer.close();
                          }
    catch(Exception ee){ ee.printStackTrace(); }
                      }
                }
            }
            
    public ArrayList getDirs(){
                
    return this.DirList;
            }
            
            
    public void startIndex() {
                makeSegments();
                createIndexs();
            }

        
    public static void main(String[] args) {
            IndexOnFS processor 
    = new IndexOnFS("e:\\畢業論文");
                    
    //processor.searchDirectorys("e:\\1");
                    processor.startIndex();
        }


    }

    posted @ 2008-06-01 05:11 HanLab 閱讀(225) | 評論 (0)編輯 收藏

    主站蜘蛛池模板: 中国在线观看免费国语版| 亚洲视频免费观看| 在线看片无码永久免费aⅴ| 亚洲中文久久精品无码1| 99re6热视频精品免费观看 | 国产拍拍拍无码视频免费| 久久精品国产亚洲AV不卡| 一级A毛片免费观看久久精品| 亚洲无码高清在线观看| 国产伦精品一区二区免费| 亚洲日韩精品A∨片无码| 免费无码作爱视频| 一区二区三区亚洲| 18禁免费无码无遮挡不卡网站| 亚洲熟妇久久精品| 四虎影视永久免费视频观看| av电影在线免费看| 亚洲av网址在线观看| 免费看h片的网站| 国产精品亚洲AV三区| mm1313亚洲精品无码又大又粗| 一区二区三区在线免费| 亚洲色成人中文字幕网站| 免费A级毛片无码A∨中文字幕下载 | 一二三四在线观看免费高清中文在线观看| 中文字幕亚洲综合久久2| 黄页网站在线观看免费高清| 亚洲av成人无码网站…| 亚洲日韩精品一区二区三区| 永久黄色免费网站| 天天综合亚洲色在线精品| 亚洲AV无码成人网站久久精品大 | 国产黄色片免费看| 99ri精品国产亚洲| 四虎成人精品在永久免费| 日本免费高清视频| 亚洲精品天堂成人片AV在线播放| 亚洲综合区小说区激情区| 国产2021精品视频免费播放| 视频一区在线免费观看| 亚洲日本在线免费观看|