Apache POI是Apache軟件基金會的開放源碼函式庫,用來幫助Java程序讀寫Microsoft Office的格式檔案。POI提供了下面這幾種類型對Microsoft Office的格式檔案進行解析:
HSSF - 提供讀寫Microsoft Excel XLS格式檔案的功能。
XSSF - 提供讀寫Microsoft Excel OOXML XLSX格式檔案的功能。
HWPF - 提供讀寫Microsoft Word DOC格式檔案的功能。
HSLF - 提供讀寫Microsoft PowerPoint格式檔案的功能。
HDGF - 提供讀Microsoft Visio格式檔案的功能。
HPBF - 提供讀Microsoft Publisher格式檔案的功能。
你可以訪問POI的主頁http://poi.apache.org/ 下載你喜歡的版本和了解更多的信息.
這里只介紹使用POI讀取Excel文件,在讀取Excel時首先要定位Excel文件的位置,然后通過POI的API生成一個工作表HSSFWorkbook對象:
File file = new File(filePath);
FileInputStream fint = new FileInputStream(file);
POIFSFileSystem poiFileSystem = new POIFSFileSystem(fint);
HSSFWorkbook workbook = new HSSFWorkbook(poiFileSystem);
可以通過HSSFWorkbook提供的getSheetAt(int sheetNum)訪問對應的子工作表HSSFSheet,序號從'0'開始.在獲得HSSFSheet對象后通過sheet.getRow(rowNum)方法獲得子工作表的指定行HSSFRow,HSSFRow提供了getCell(short)方法訪問其中的單元格對象.在處理單元格的時候要注意,不能簡單使用HSSShell的getStringCellValue()方法獲得單元格中的值,在我使用的版本中(2.0)沒有提供自動類型轉換的功能,所以在取值的時候要根據類型判斷:
public static String getCell(HSSFCell cell) {
if (cell == null)
return "";
switch (cell.getCellType()) {
case HSSFCell.CELL_TYPE_NUMERIC:
return cell.getNumericCellValue() + "";
case HSSFCell.CELL_TYPE_STRING:
return cell.getStringCellValue();
case HSSFCell.CELL_TYPE_FORMULA:
return cell.getCellFormula();
case HSSFCell.CELL_TYPE_BLANK:
return "";
case HSSFCell.CELL_TYPE_BOOLEAN:
return cell.getBooleanCellValue() + "";
case HSSFCell.CELL_TYPE_ERROR:
return cell.getErrorCellValue() + "";
}
return "";
}
HSSFCell沒有提供時間類型常量,這時候你只能根據自己判斷是否要將它轉換成時間格式了: cell.getDateCellValue();
下面是一個簡單的例子,你可以參考一下:
/**
* 打印Excel文件 。
* @author vwpolo
* <p>2009-9-15</p>
*/
public class PrintExcelTest {
public static void main(String[] args) throws Exception {
File file = new File("User.xls");
FileInputStream fint = new FileInputStream(file);
POIFSFileSystem poiFileSystem = new POIFSFileSystem(fint);
HSSFWorkbook workbook = new HSSFWorkbook(poiFileSystem);
HSSFSheet sheet = workbook.getSheetAt(0);
HSSFRow rowTitle = sheet.getRow(0);
Iterator<HSSFCell> iterTitle = rowTitle.cellIterator();
while(iterTitle.hasNext()) {
System.out.print(iterTitle.next().getStringCellValue()+" ");
}
System.out.println("");
HSSFRow rowUser = sheet.getRow(1);
Iterator<HSSFCell> iterUser = rowUser.cellIterator();
while(iterUser.hasNext()) {
System.out.print(getCell(iterUser.next())+" ");
}
System.out.println("\n");
System.out.println("出生日期:"+rowUser.getCell((short)3).getDateCellValue().toLocaleString());
}
public static String getCell(HSSFCell cell) {
if (cell == null)
return "";
switch (cell.getCellType()) {
case HSSFCell.CELL_TYPE_NUMERIC:
return cell.getNumericCellValue() + "";
case HSSFCell.CELL_TYPE_STRING:
return cell.getStringCellValue();
case HSSFCell.CELL_TYPE_FORMULA:
return cell.getCellFormula();
case HSSFCell.CELL_TYPE_BLANK:
return "";
case HSSFCell.CELL_TYPE_BOOLEAN:
return cell.getBooleanCellValue() + "";
case HSSFCell.CELL_TYPE_ERROR:
return cell.getErrorCellValue() + "";
}
return "";
}
}
這里的User.xls文件時一個模板,
A1、C1的單元格格式是常規格式,B1、E1的單元格格式是文本,D1的單元格格式是日期
運行上面的例子會輸出:
姓名 員工編號 所屬公司 出生日期 身份證號碼
張三 000018 上海 32117.0 370684198712066666
出生日期:1987-12-6 0:00:00
在那個迭代方法中無法對日期類型的判斷,所以輸出格式存在問題,可以將日期格式額外處理。