Notice
Recent Posts
Recent Comments
Link
아님말고
POI를 이용한 excel, word, powerpoint, visio 텍스트 추출 본문
조건 : POI 3.5 이상
한글 추출도 잘된다.
[워드]
[엑셀]
xls 에서 텍스트 추출하는 것은 그냥 하면 되는데,
xlsx 에서 텍스트를 추출하기 위해서는,
ooxml-lib 폴더 안의 4개의 jar 파일을 추가해줘야 한다.
그리고 log4j jar 파일도 추가해준다.
아직까지는 xlsx 추출이 완벽해 보이지는 않는다.
'Parser' 카테고리의 다른 글
PDFBOX를 이용한 PDF 텍스트 추출하기 (0) | 2009.03.10 |
---|---|
NekoHTML 파서 (0) | 2009.03.04 |
Comments