js333 > 计算机互联网 > 金沙js333娱乐场phpword插件导出word文件时中文乱码

原标题:金沙js333娱乐场phpword插件导出word文件时中文乱码

浏览次数:87 时间:2019-10-02

最近领导要求用php生成word,网上找了很多类啊,函数啊。最终相中phpword。无奈不是国人开发,对中文支持很不友好。经过研究,终于解决了中文乱码,分享出来。

最近一个项目开发要用到PHP技术导出Word文档,比较了几种方案,首先是使用Microsoft Office自带的ActiveX/COM组件,比如Word.Application,这种方式的优点是格式兼容度高,可以生成纯doc的Word2003格式文档,缺点一是比较占资源(调用会启动一个WINWORD.EXE进程),不适合Web多用户访问使用;二是PHP这种Web开发技术大多数是跑在Linux服务器上,当然也就无法使用Windows下的技术了,平台可移植和兼容性不好。

最近一个项目开发要用到PHP技术导出Word文档,比较了几种方案,首先是使用Microsoft Office自带的ActiveX/COM组件,比如Word.Application,这种方式的优点是格式兼容度高,可以生成纯doc的Word2003格式文档,缺点一是比较占资源(调用会启动一个WINWORD.EXE进程),不适合Web多用户访问使用;二是PHP这种Web开发技术大多数是跑在Linux服务器上,当然也就无法使用Windows下的技术了,平台可移植和兼容性不好。第二种生成Word的方案是生成Word兼容的网页格式,然后以Word方式打开,这种方案总体上感觉怪怪的,毕竟文件格式是HTML的,而且格式兼容度不好,不过这种方式的优点是节省服务器资源,能够快速生成;最后一种方案也就是今天的主角,采用PHPWord生成Word2007(docx)格式的文档,现在基本上微软Office Word 2003以后的版本均兼容这种格式了,对于2003版本来说,仅需要下载安装个兼容格式包(下载地址),也能正常打开这类文件,当然如果你使用的是最新版本的Office(包括但不限于Office 2007、Office 2010)则不需要安装此格式包。

最近在做一个项目,需要导出word文档,查阅相关资料之后选择了PHPWord,但是由于是国外开发者写的类库,国内资料又不全,因此在使用的过程中遇到一些问题。关于PHPWord类库的使用手册,网上很多。下面只将遇到的问题记录下来,算是笔记:

1、用模板word生成word中文乱码解决方案:

第二种生成Word的方案是生成Word兼容的网页格式,然后以Word方式打开,这种方案总体上感觉怪怪的,毕竟文件格式是HTML的,而且格式兼容度不好,不过这种方式的优点是节省服务器资源,能够快速生成;最后一种方案也就是今天的主角,采用PHPWord生成Word2007(docx)格式的文档,现在基本上微软Office Word 2003以后的版本均兼容这种格式了,对于2003版本来说,仅需要下载安装个兼容格式包(下载地址),也能正常打开这类文件,当然如果你使用的是最新版本的Office(包括但不限于Office 2007、Office 2010)则不需要安装此格式包。

好了,下面我就介绍一下PHPWord,大家可以通过访问项目主页下载并获得关于项目的更多信息。

金沙js333娱乐场 1

打开phpword/Template.php文件,找到$replace = utf8_encode($replace);将其改为$replace =iconv('gbk', 'utf-8', $replace); 即可。

好了,下面我就介绍一下PHPWord,大家可以通过访问项目主页下载并获得关于项目的更多信息。

我在使用过程中主要遇到了中文乱码的问题,结合网上大神们的指导,通过下面的方式解决了这类问题,希望对大家有所帮助。

测试过程中乱码文件

2、直接生成word文档,调用addText对象时中文乱码解决方案:

我在使用过程中主要遇到了中文乱码的问题,结合网上大神们的指导,通过下面的方式解决了这类问题,希望对大家有所帮助。

1、增加东亚字体支持

1.PHPWord如何安装使用?

打开phpword/Section.php文件,找到$givenText = utf8_encode($text);将其改为$givenText = iconv('gbk', 'utf-8', $text);即可。

1、增加东亚字体支持 

 代码如下

这是第一个困扰我的问题,在网上也没有找到实质性的资料,因此我除了php环境没有下载安装软件,直接找到代码包,配置环境做测试的,下面是操作顺序:

3、貌似其他方法也类似第解决。

打开并编辑路径/Writer/Word2007/Base.php文件内容,大概在第349行(行数随着版本可能会有变化)大概函数_writeTextStyle内添加:

打开并编辑路径/Writer/Word2007/Base.php文件内容,大概在第349行(行数随着版本可能会有变化)大概函数_writeTextStyle内添加:

a.下载代码包,我找了好久,这个不错,亲测可用。地址:

4、注意php文件采用gbk哦。反正我的显示中文了。在网上找了好久,研究了半天才搞定。

$objWriter->writeAttribute('w:eastAsia', $font)
比如我的修改片段基本是下面这样:

$objWriter->writeAttribute('w:eastAsia', $font)
比如我的修改片段基本是下面这样:

b.配置本地环境,将配置新域名根目录指向一个新的目录,关于php域名配置,网上教程很多,在此不多赘述

// Font
if($font != 'Arial') {
  $objWriter->startElement('w:rFonts');
    $objWriter->writeAttribute('w:eastAsia', $font); // 添加这行
    $objWriter->writeAttribute('w:ascii', $font);
    $objWriter->writeAttribute('w:hAnsi', $font);
    $objWriter->writeAttribute('w:cs', $font);
  $objWriter->endElement();
}

// Font
if($font != 'Arial') {
    $objWriter->startElement('w:rFonts');
        $objWriter->writeAttribute('w:eastAsia', $font); // 添加这行
        $objWriter->writeAttribute('w:ascii', $font);
        $objWriter->writeAttribute('w:hAnsi', $font);
        $objWriter->writeAttribute('w:cs', $font);
    $objWriter->endElement();
}

c.解压a中下载的文件包,将解压之后的PHPWord文件夹和PHPWord.php放在b中文件夹中

  1. 解决中文乱码问题
  1. 解决中文乱码问题

d.新建php文件,引入PHPWord.php,并new PHPWord类

编辑PHPWord/Template.php,找到代码$replace = utf8_encode($replace);,删除或者注释掉这行代码,添加$replace = iconv( 'gbk','utf-8', $replace);,比如代码改为如下:

编辑PHPWord/Template.php,找到代码$replace = utf8_encode($replace);,删除或者注释掉这行代码,添加$replace = iconv( 'gbk','utf-8', $replace);,比如代码改为如下:

require_once 'PHPWord.php';

$PHPWord = new PHPWord();

 /**
 * Set a Template value
 * 
 * @param mixed $search
 * @param mixed $replace
 */
public function setValue($search, $replace) {
  if(substr($search, 0, 2) !== '${' && substr($search, -1) !== '}') {
    $search = '${'.$search.'}';
  }

  if(!is_array($replace)) {
    //$replace = utf8_encode($replace);
    $replace =iconv('gbk', 'utf-8', $replace); // 注释掉上面行后添加这行
  }

  $this->_documentXML = str_replace($search, $replace, $this->_documentXML);
}

 代码如下

2.PHPWord不支持中文字体

调用方式如下:

/**
 * Set a Template value
 *
 * @param mixed $search
 * @param mixed $replace
 */
public function setValue($search, $replace) {
    if(substr($search, 0, 2) !== '${' && substr($search, -1) !== '}') {
        $search = '${'.$search.'}';
    }
 
    if(!is_array($replace)) {
        //$replace = utf8_encode($replace);
        $replace =iconv('gbk', 'utf-8', $replace); // 注释掉上面行后添加这行
    }
 
    $this->_documentXML = str_replace($search, $replace, $this->_documentXML);
}

打开文件/PHPWord/Writer/Word2007/Base.php,找到函数 _writeTextStyle,大概在347行,添加代码如下:

 

调用方式如下:

if(!is_null($underline) && $underline != 'none') {

  $objWriter->startElement('w:u');

  $objWriter->writeAttribute('w:val', $underline);

  $objWriter->writeAttribute('w:eastAsia', $font);

  $objWriter->writeAttribute('w:ascii', $font);

  $objWriter->writeAttribute('w:hAnsi', $font);

  $objWriter->writeAttribute('w:cs', $font);

  $objWriter->endElement();

}

$document->setValue('Template', iconv('utf-8', 'GB2312//IGNORE', '中文'));

 代码如下

3.用模板word生成word中文乱码

上面的代码主要解决模板的问题,下面同样的道理,解决Section添加文本的问题,找到代码$givenText = utf8_encode($text);,删除或者注释掉这行代码,添加$givenText = iconv('gbk', 'utf-8', $text);,比如代码如下:

$document->setValue('Template', iconv('utf-8', 'GB2312//IGNORE', '中文'));

打开文件/PHPWord/Template.php,大概在89行找到函数setValue,网上好多说法是将

 

上面的代码主要解决模板的问题,下面同样的道理,解决Section添加文本的问题,找到代码$givenText = utf8_encode($text);,删除或者注释掉这行代码,添加$givenText = iconv('gbk', 'utf-8', $text);,比如代码如下:

$replace = utf8_encode($replace);

/**
 * Add a Text Element
 * 
 * @param string $text
 * @param mixed $styleFont
 * @param mixed $styleParagraph
 * @return PHPWord_Section_Text
 */
public function addText($text, $styleFont = null, $styleParagraph = null) {
  //$givenText = utf8_encode($text);
  $givenText = iconv('gbk', 'utf-8', $text); // 注释掉上面行后添加这行
  $text = new PHPWord_Section_Text($givenText, $styleFont, $styleParagraph);
  $this->_elementCollection[] = $text;
  return $text;
}

 代码如下

改为:

调用方式和上面的模板调用大同小异,这边就不列举了。

/**
 * Add a Text Element
 *
 * @param string $text
 * @param mixed $styleFont
 * @param mixed $styleParagraph
 * @return PHPWord_Section_Text
 */
public function addText($text, $styleFont = null, $styleParagraph = null) {
    //$givenText = utf8_encode($text);
    $givenText = iconv('gbk', 'utf-8', $text); // 注释掉上面行后添加这行
    $text = new PHPWord_Section_Text($givenText, $styleFont, $styleParagraph);
    $this->_elementCollection[] = $text;
    return $text;
}

$replace =iconv('gbk', 'utf-8', $replace);

折腾了这么多,突然发现网上还有另外一个版本的PhpWord,项目类名大小写上略有不同,隶属于PHPOffice/PHPWord,GitHub项目地址(文档)。这个版本的PHPWord内容更加丰富,支持的功能也比较多(包括行间距,缩进和首行缩进等),最后我也采取的这个版本的PHPWord,值得注意的是这两个版本的PHPWord在API接口上基本一致,可以通用。但是有些API,在PHPOffice/PHPWord里是不推荐的,比如createSection需要改成addSection,另外应用这个版本的PHPWord不需要像上面那样做任何中文支持的修改,比较省事。

调用方式和上面的模板调用大同小异,这边就不列举了。

即可。这适用于你的php文件是gbk编码;若你本来就用的utf-8编码,则改为:

这两个PHPWord项目的官方都提供了较详细的使用例子和文档,这里就不介绍了。最后提示的是:在模板模式下loadTemplate,只能使用setValue等模板操作方法,不能再添加段落或者段落修改了。这个略有不便。

折腾了这么多,突然发现网上还有另外一个版本的PhpWord,项目类名大小写上略有不同,隶属于PHPOffice/PHPWord,GitHub项目地址(文档)。这个版本的PHPWord内容更加丰富,支持的功能也比较多(包括行间距,缩进和首行缩进等),最后我也采取的这个版本的PHPWord,值得注意的是这两个版本的PHPWord在API接口上基本一致,可以通用。但是有些API,在PHPOffice/PHPWord里是不推荐的,比如createSection需要改成addSection,另外应用这个版本的PHPWord不需要像上面那样做任何中文支持的修改,比较省事。

$replace = $replace;

对于PHPOffice/PHPWord我提供一个简单的例子供参考(当然官方例子更多):

这两个PHPWord项目的官方都提供了较详细的使用例子和文档,这里就不介绍了。最后提示的是:在模板模式下loadTemplate,只能使用setValue等模板操作方法,不能再添加段落或者段落修改了。这个略有不便。

4.section中调用对象导致中文乱码

require_once 'PhpOffice/PhpWord/PhpWord.php'; // 包含头文件
use PhpOffice\PhpWord\Autoloader;
use PhpOffice\PhpWord\Settings;
use PhpOffice\PhpWord\IOFactory;

require_once __DIR__ . '/PhpOffice/PhpWord/Autoloader.php';
Autoloader::register();
Settings::loadConfig();

// Create a new PHPWord Object
$PHPWord = new \PhpOffice\PhpWord\PhpWord();
$PHPWordHelper= new \PhpOffice\PhpWord\Shared\Font();

$PHPWord->setDefaultFontName('仿宋'); // 全局字体
$PHPWord->setDefaultFontSize(16);   // 全局字号为3号

// 设置文档的属性,这些在对文档右击属性可以看到,也可以省去这些步骤
$properties = $PHPWord->getDocumentProperties();
$properties->setCreator('张三');  // 创建者
$properties->setCompany('某公司'); // 公司
$properties->setTitle('某某文档'); // 标题
$properties->setDescription('http://wangye.org'); // 描述
$properties->setLastModifiedBy('李四'); // 最后修改
$properties->setCreated( time() );   // 创建时间
$properties->setModified( time() );   // 修改时间

// 添加3号仿宋字体到'FangSong16pt'留着下面使用
$PHPWord->addFontStyle('FangSong16pt', array('name'=>'仿宋', 'size'=>16));

// 添加段落样式到'Normal'以备下面使用
$PHPWord->addParagraphStyle(
 'Normal',array(
  'align'=>'both',
  'spaceBefore' => 0,
  'spaceAfter' => 0,
  'spacing'=>$PHPWordHelper->pointSizeToTwips(2.8),
  'lineHeight' => 1.19, // 行间距
  'indentation' => array( // 首行缩进
   'firstLine' => $PHPWordHelper->pointSizeToTwips(32)
  )
 )
);

// Section样式:上3.5厘米、下3.8厘米、左3厘米、右3厘米,页脚3厘米
// 注意这里厘米(centimeter)要转换为twips单位
$sectionStyle = array(
  'orientation' => null,
  'marginLeft' => $PHPWordHelper->centimeterSizeToTwips(3),
  'marginRight' => $PHPWordHelper->centimeterSizeToTwips(3),
  'marginTop' => $PHPWordHelper->centimeterSizeToTwips(3.5),
  'marginBottom' => $PHPWordHelper->centimeterSizeToTwips(3.8),
  'pageNumberingStart' => 1, // 页码从1开始
  'footerHeight' => $PHPWordHelper->centimeterSizeToTwips(3),
);

$section = $PHPWord->addSection($sectionStyle); // 添加一节

// 下面这句是输入文档内容,注意这里用到了刚才我们添加的
// 字体样式FangSong16pt和段落样式Normal
$section->addText('文档内容', 'FangSong16pt', 'Normal');
$section->addTextBreak(1); // 新起一个空白段落

$objWriter = IOFactory::createWriter($PHPWord, 'Word2007');
$objWriter->save('/path/to/file'); // 保存到/path/to/file路径下

对于PHPOffice/PHPWord我提供一个简单的例子供参考(当然官方例子更多):

打开文件/PHPWord/Section.php,大概在111行找到函数addText,修改原理和原因与3类似,在此放下修改之后的部分代码:

总结

 代码如下

public function addText($text, $styleFont = null, $styleParagraph = null) {

  //$givenText = utf8_encode($text);

  //$givenText = iconv('gbk', 'utf-8', $text);

  $givenText = $text;

  $text = new PHPWord_Section_Text($givenText, $styleFont, $styleParagraph);

  $this->_elementCollection[] = $text;

  return $text;

}

1、用模板word生成word中文乱码解决方案:打开phpword/Template.php文件,找到$replace = utf8_encode($replace);将其改为$replace =iconv('gbk', 'utf-8', $replace); 即可。

require_once 'PhpOffice/PhpWord/PhpWord.php'; // 包含头文件
use PhpOffice\PhpWord\Autoloader;
use PhpOffice\PhpWord\Settings;
use PhpOffice\PhpWord\IOFactory;
 
require_once __DIR__ . '/PhpOffice/PhpWord/Autoloader.php';
Autoloader::register();
Settings::loadConfig();
 
// Create a new PHPWord Object
$PHPWord = new \PhpOffice\PhpWord\PhpWord();
$PHPWordHelper= new \PhpOffice\PhpWord\Shared\Font();
 
$PHPWord->setDefaultFontName('仿宋'); // 全局字体
$PHPWord->setDefaultFontSize(16);     // 全局字号为3号
 
// 设置文档的属性,这些在对文档右击属性可以看到,也可以省去这些步骤
$properties = $PHPWord->getDocumentProperties();
$properties->setCreator('张三');   // 创建者
$properties->setCompany('某公司'); // 公司
$properties->setTitle('某某文档'); // 标题
$properties->setDescription(''); // 描述
$properties->setLastModifiedBy('李四'); // 最后修改
$properties->setCreated( time() );      // 创建时间
$properties->setModified( time() );     // 修改时间
 
// 添加3号仿宋字体到'FangSong16pt'留着下面使用
$PHPWord->addFontStyle('FangSong16pt', array('name'=>'仿宋', 'size'=>16));
 
// 添加段落样式到'Normal'以备下面使用
$PHPWord->addParagraphStyle(
  'Normal',array(
    'align'=>'both',
    'spaceBefore' => 0,
    'spaceAfter' => 0,
    'spacing'=>$PHPWordHelper->pointSizeToTwips(2.8),
    'lineHeight' => 1.19,  // 行间距
    'indentation' => array( // 首行缩进
      'firstLine' => $PHPWordHelper->pointSizeToTwips(32)
    )
  )
);
 
// Section样式:上3.5厘米、下3.8厘米、左3厘米、右3厘米,页脚3厘米
// 注意这里厘米(centimeter)要转换为twips单位
$sectionStyle = array(
    'orientation' => null,
    'marginLeft' => $PHPWordHelper->centimeterSizeToTwips(3),
    'marginRight' => $PHPWordHelper->centimeterSizeToTwips(3),
    'marginTop' => $PHPWordHelper->centimeterSizeToTwips(3.5),
    'marginBottom' => $PHPWordHelper->centimeterSizeToTwips(3.8),
    'pageNumberingStart' => 1, // 页码从1开始
    'footerHeight' => $PHPWordHelper->centimeterSizeToTwips(3),
);
 
$section = $PHPWord->addSection($sectionStyle); // 添加一节
 
// 下面这句是输入文档内容,注意这里用到了刚才我们添加的
// 字体样式FangSong16pt和段落样式Normal
$section->addText('文档内容', 'FangSong16pt', 'Normal');
$section->addTextBreak(1); // 新起一个空白段落
 
$objWriter = IOFactory::createWriter($PHPWord, 'Word2007');
$objWriter->save('/path/to/file'); // 保存到/path/to/file路径下

另外,在大概129行找到函数addLink(添加链接),修改其中的$linkSrc和$linkName变量;在大概183行找到函数addListItem(添加list列表),修改其中的$text变量;在大概292行找到函数addTitle(添加标题),修改其中的$text变量;请根据自己的需要按照上面的方法修改上述变量。

2、直接生成word文档,调用addText对象时中文乱码解决方案:打开phpword/Section.php文件,找到$givenText = utf8_encode($text);将其改为$givenText = iconv('gbk', 'utf-8', $text);即可。

总结

5.页眉中加入中文出现乱码

3、貌似其他方法也类似第解决。

1、用模板word生成word中文乱码解决方案:打开phpword/Template.php文件,找到$replace = utf8_encode($replace);将其改为$replace =iconv('gbk', 'utf-8', $replace); 即可。
2、直接生成word文档,调用addText对象时中文乱码解决方案:打开phpword/Section.php文件,找到$givenText = utf8_encode($text);将其改为$givenText = iconv('gbk', 'utf-8', $text);即可。
3、貌似其他方法也类似第解决。
4、注意php文件采用gbk哦。反正我的显示中文了。在网上找了好久,研究了半天才搞定。

打开文件/PHPWord/Section/Header.php,大概在74行找到函数addText,修改原理和原因与3类似,请参照3,4进行修改$givenText变量。

4、注意php文件采用gbk哦。反正我的显示中文了。在网上找了好久,研究了半天才搞定。

另外,若要添加表示页码的 Pagenumber 到页眉,请在大概165行找到函数addPreserveText,修改其中的$text变量。

您可能感兴趣的文章:

  • javascript下用ActiveXObject控件替换word书签,将内容导出到word后打印
  • Javascript客户端将指定区域导出到Word、Excel的代码
  • PHP中将网页导出为Word文档的代码
  • C# 大数据导出word的假死报错的处理方法
  • asp.net 按指定模板导出word,pdf实例代码
  • 使用PHP导出Word文档的原理和实例
  • php导出word文档与excel电子表格的简单示例代码
  • C#导出文本内容到word文档的方法
  • 使用aspose.word 第三方的插件实现导出word

6.页脚中加入中文出现乱码

打开文件/PHPWord/Section/Header.php,大概在74行找到函数addText,修改原理和原因与3类似,请参照3,4进行修改$givenText变量。

另外,若要添加表示页码的 Pagenumber 到页脚,请在大概165行找到函数addPreserveText,修改其中的$text变量。

7.使用表格中加入中文出现乱码

打开文件/PHPWord/Section/Table/Cell.php,大概在111行找到函数addText,修改其中的$text变量;在大概126行找到函数addLink(添加链接),修改其中的$linkSrc和$linkName变量;在大概163行找到函数addListItem(添加list列表),修改其中的$text变量;在大概273行找到函数addTitle(添加标题),修改其中的$text变量;请根据自己的需要按照上面的方法修改上述变量。

目前遇到的问题就这些,有问题会继续追加。另外,如果有需要测试代码的,请联系作者哟。

本文由js333发布于计算机互联网,转载请注明出处:金沙js333娱乐场phpword插件导出word文件时中文乱码

关键词:

上一篇:与删除元素,删除数组中的元素实例程序

下一篇:php中preg_match_all函数用法详解