最近遇到最頭大的問題就是 word 要怎麼轉成 html
在windows 平台或是.net 這也許不是太大問題,
但在linux 上就很難處理了!
好險有openoffice 和sourceforge.net上一套神奇的程式 JODconverter
JODconverter 最新版本是 2.2.2 可在http://sourceforge.net/projects/jodconverter/files/ 找到
原理很簡單 , 系統要先安裝 openoffice , jodconverter 只是幫助你透過OO(openoffice)
把word檔案開啟後另存成html ( or PDF)
安裝步驟: (in CentOS)
1.yum install openoffice.org-writer (同時會把java裝進去)
2.yum install Xvfb
3.參考 http://pulipuli.blogspot.com/2009/08/xvfbopenoffice.html 寫啟動檔 /etc/init.d/openoffice
----------------------------------------------------
#!/bin/bash
case "$1" in
start)
DISPLAY=:5.0
export DISPLAY
Xvfb :5 -screen scrn 1024x768x24 &
/usr/lib/openoffice.org/program/soffice.bin "-accept=socket,host=127.0.0.1,port=8100;urp;StarOffice.ServiceManager -nofirststartwizard -nologo -
headless -display:5" &
;;
stop)
pkill soffice &
pkill Xvfb &
exit 1 &
;;
*)
echo "Usage: $0 { start | stop }"
exit 1
;;
esac
exit 0
----------------------------------------------------------
4.java -jar jodconverter-cli-2.2.2.jar /home/phenix/a.doc /home/phenix/a.html
轉出成功!!! (限office 2003 以下版本)
這時發現一個問題 , 轉出來中文會爛掉
好吧 , 既然透過 OO轉檔, 問題應該出在OO上 想了想辦法
在server 上先啟動X , 然後打開OO , 修改設定?
這時需要以下幾個步驟
1.yum install vnc-server
2.修改
/root/.vnc/xstartup
---------------------------------------------------------------------------------------
#!/bin/sh
# Uncomment the following two lines for normal desktop:
# unset SESSION_MANAGER
# exec /etc/X11/xinit/xinitrc
[ -x /etc/vnc/xstartup ] && exec /etc/vnc/xstartup
[ -r $HOME/.Xresources ] && xrdb $HOME/.Xresources
xsetroot -solid grey
vncconfig -iconic &
xterm -geometry 80x24+10+10 -ls -title "$VNCDESKTOP Desktop" &
#twm & (這個不會用...只好裝gnome)
gnome-session &
---------------------------------------------------------------------------------------
3.gnome-server (安裝RPM)
4.gnome-terminal (安裝RPM)
5.openoffice.org-langpack-tr_TR (安裝RPM)
6.vncserver 啟動VNC後,
用vncviewer連進gnome ,
啟動openoffice
設定好語言環境是中文~搞定收工!
寫得很簡略...將就看一看吧XD
相信姓廖的那位朋友會把它變成圖文併茂的版本XD
留言列表