python读取word指定内容 python-docx为什么不支持doc格式?
浏览量:1233
时间:2021-03-11 03:04:20
作者:admin
python-docx为什么不支持doc格式?
Docx是一种开放格式。它本质上是一个zip文件,可以用解压软件把它解压到一个目录中,包括几个目录,内置图片,所有的东西都在相应的目录中。文本的内容存储在XML中,因此用Python解析它相对容易。
Doc是早期生成的文件,已关闭。一般来说,类似的软件如OpenOffice或WPS会对格式进行解码和支持,但不能保证完全支持。这比docx困难得多。
对于该库的开发人员,我认为他没有心思或需要做这样的事情。
如果需要读取doc文件,可以使用win32com模块将doc转换为docx,然后使用python_uux读取内容。
python读取word指定内容 怎么用python读word文档 python读取word页数
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。