Parser

POI를 이용한 excel, word, powerpoint, visio 텍스트 추출

스타박씨 2009. 3. 9. 13:51


조건       : POI 3.5 이상

한글 추출도 잘된다.



[워드]

[엑셀]
xls 에서 텍스트 추출하는 것은 그냥 하면 되는데,
xlsx 에서 텍스트를 추출하기 위해서는,
ooxml-lib 폴더 안의 4개의 jar 파일을 추가해줘야 한다.
그리고 log4j jar 파일도 추가해준다.

아직까지는 xlsx 추출이 완벽해 보이지는 않는다.