新聞中心
項(xiàng)目需求,對上傳的文檔進(jìn)行一些預(yù)處理,如果用戶上傳了doc格式的文檔,需要將其處理為docx或者pdf格式,以便后續(xù)的流程對文檔內(nèi)容進(jìn)行提取。

成都創(chuàng)新互聯(lián)公司網(wǎng)站建設(shè)服務(wù)商,為中小企業(yè)提供成都網(wǎng)站制作、成都網(wǎng)站設(shè)計(jì)服務(wù),網(wǎng)站設(shè)計(jì),成都網(wǎng)站托管等一站式綜合服務(wù)型公司,專業(yè)打造企業(yè)形象網(wǎng)站,讓您在眾多競爭對手中脫穎而出成都創(chuàng)新互聯(lián)公司。
先是試了一下phpoffice/phpword這個包,發(fā)現(xiàn)其對doc的轉(zhuǎn)換很不理想,這個包更適合用來根據(jù)內(nèi)容生成文檔,而不是轉(zhuǎn)換文檔,不是太適合我這種需求。
然后發(fā)現(xiàn)了LibreOffice這個開源工具,經(jīng)過使用,效果很好,分享一下。
服務(wù)器是centos7,直接使用yum安裝LibreOffice,大概需要600MB+ 的磁盤空間:
# 裝之前可以先刪除一下,防止之前裝過 yum remove libreoffice-* yum install libreoffice
等待安裝完成后,確認(rèn)一下版本啥的,雖然官方已經(jīng)到6.1版本了,yum里面還是5.3.6的包,不過用起來并沒有什么毛病,在這里我還是建議大家使用各自的Linux系統(tǒng)的包管理工具來安裝,這樣可以省去很多麻煩的。
[root@localhost /]# soffice --version LibreOffice 5.3.6.1 30(Build:1)
不會用的話可以使用soffice –help看一下幫助,非常多的參數(shù)和使用案例,轉(zhuǎn)換格式就很簡單:
soffice --headless --convert-to docx /opt/upload/source/123.doc --outdir /opt/upload/source
以上的命令就是將/opt/upload/source/123.doc文件轉(zhuǎn)換成docx格式,輸出到/opt/upload/source文件夾里。
默認(rèn)情況下:
- 會使用源文件名+新的擴(kuò)展名保存輸出文件;
- 會覆蓋outdir里已經(jīng)有的同名文件;
轉(zhuǎn)換成功會輸出類似這樣的:
convert /opt/upload/source/123.doc -> /opt/upload/source/123.docx using filter : MS Word 2007 XML Overwriting: /opt/upload/source/123.docx
LibreOffice會根據(jù)文件格式自動匹配格式過濾器(filter),至于它支持哪些格式,可以參考一下官網(wǎng)。
總結(jié)
以上所述是小編給大家介紹的CentOS下使用LibreOffice實(shí)現(xiàn)文檔格式的轉(zhuǎn)換方式,大家如有疑問可以留言,或者聯(lián)系站長。感謝親們支持?。?!
如果你覺得本文對你有幫助,歡迎轉(zhuǎn)載,煩請注明出處,謝謝!
成都服務(wù)器租用選創(chuàng)新互聯(lián),先試用再開通。
創(chuàng)新互聯(lián)(www.cdcxhl.com)提供簡單好用,價(jià)格厚道的香港/美國云服務(wù)器和獨(dú)立服務(wù)器。物理服務(wù)器托管租用:四川成都、綿陽、重慶、貴陽機(jī)房服務(wù)器托管租用。
網(wǎng)頁名稱:CentOS下使用LibreOffice實(shí)現(xiàn)文檔格式的轉(zhuǎn)換方式
URL分享:http://m.fisionsoft.com.cn/article/cdghgdh.html


咨詢
建站咨詢
