问题描述
如何使用python判断Word文档中的段落格式以及目录格式
解决方案
本次主接着上次的研究,使用python-docx要有前提,不是安装,要先取出我要判断的文档所在的段落,只是在那个段落中判断。然后space_before、space_after是控制段前段后间距,在代码中建立新的document后分别得到段落的间距,但是会得到None的返回值,之后就需要带入具体的段落,在一个小范围中是可以得到想要的段前段后距。
接着就是行间距,行间距是由line_spacing和line_spacing_rule控制。但是我们的目的不是改变行间距,只是找出数据后做比较看是否正确,所以后面有改数据的的就不需要。
虽然还是没能做到判断,但有了更准确的范围与操作方法,目的还是在慢慢的实现,这是基于上次的思路的延伸研究。
结语
要完成本次的研究,库的调用不用重复,寻着上一条的思路继续往下研究,明确每一步要到达的目的。
作者:沈志坚
s实习编辑:王晓姣
稿件来源:深度学习与文旅应用实验室(DLETA)
联系客服