Python3 读取Word文件方式
我的环境,Windows10,Python3.6.3
查询了很多有关资料,发现都是Python2版本操作Word文件的,所以就写了这篇短小的文章。
一、安装docx
pipinstalldocx
完了之后,导入:importdocx
发现报错:ModuleNotFoundError:Nomodulenamed‘exceptions'
说没有exceptions这个模块,由于Python3已经取消了这个模块,而PendingDeprecationWarning是内置
可以直接使用的,所以我们直接进入文件(这个要看你报错显示的路径):
D:\ProgramFiles\Anaconda3\lib\site-packages\docx.py
把fromexceptionsimportPendingDeprecationWarning注释掉即可
示例代码:
importdocx defget_docx(file_name): d=docx.opendocx(file_name) doc=docx.getdocumenttext(d) returndoc doc=get_docx('tt.docx') print(doc)#输出行数:1075 fordindoc[:5]: print(d)#打印前5行 '''输出: 一、补益之剂 1.四君子汤 四君子汤中和义,参术茯苓甘草比 益以夏陈名六君,祛痰补气阳虚饵 除却半夏名异功,或加香砂胃寒使 '''
以上这篇Python3读取Word文件方式就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持毛票票。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。