Notice
Recent Posts
Recent Comments
Link
«   2024/04   »
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30
Archives
Today
Total
관리 메뉴

아님말고

POI를 이용한 excel, word, powerpoint, visio 텍스트 추출 본문

Parser

POI를 이용한 excel, word, powerpoint, visio 텍스트 추출

스타박씨 2009. 3. 9. 13:51


조건       : POI 3.5 이상

한글 추출도 잘된다.



[워드]

[엑셀]
xls 에서 텍스트 추출하는 것은 그냥 하면 되는데,
xlsx 에서 텍스트를 추출하기 위해서는,
ooxml-lib 폴더 안의 4개의 jar 파일을 추가해줘야 한다.
그리고 log4j jar 파일도 추가해준다.

아직까지는 xlsx 추출이 완벽해 보이지는 않는다.

'Parser' 카테고리의 다른 글

PDFBOX를 이용한 PDF 텍스트 추출하기  (0) 2009.03.10
NekoHTML 파서  (0) 2009.03.04
Comments