Word解析成Html,方法总结

Docx4j一开始打算使用docx4j来进行解析Word并生成Html。但是生成的图片包含了emf格式的图片,这是html所不支持的。而且生成完成之后的Html样式皆为行内样式。没有去仔细研读他的API(时间不充足呀....)。导致生成的效果不是很理想。LibreOffice想起了当初使用过这个东西