2016 - 2024

感恩一路有你

python读取docx的内容 python-docx为什么不支持doc格式?

浏览量:2639 时间:2021-03-17 16:25:05 作者:admin

python-docx为什么不支持doc格式?

Docx是一种开放格式。它本质上是一个zip文件,可以用解压软件把它解压到一个目录中,包括几个目录,内置图片,所有的东西都在相应的目录中。文本的内容存储在XML中,因此用Python解析它相对容易。

Doc是早期生成的文件,已关闭。一般来说,类似的软件如OpenOffice或WPS会对格式进行解码和支持,但不能保证完全支持。这比docx困难得多。

对于该库的开发人员,我认为他没有心思或需要做这样的事情。

如果需要读取doc文件,可以使用win32com模块将doc转换为docx,然后使用python_uux读取内容。

python读取docx的内容 python将doc转docx python跳过异常继续执行

版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。