php com类如何逐行读取word文档数据
通过com类读取word文档时,默认会将整个文档内容读取出来,而不是逐行读取。为了实现逐行读取,可以使用以下方法:
使用正则表达式切割
$lines = preg_split('![ ]!', $text);
自行解析xml
立即学习“PHP免费学习笔记(深入)”;
docx格式的word文档本质上是一个zip压缩包,可以通过解压并将word/document.xml文件解析出来,从而直接读取内容,而不依赖com类。值得注意的是,此方法仅适用于docx格式的word文档。