快速入门
入门python-docx
很容易。让我们来看一下基础知识。
官方文档地址请点击
打开文档
你需要的第一件事是工作的文档。最简单的方法是:
from docx import Document
document = Document()
这将打开一个基于默认“模板”的空白文档,您可以打开并使用现有的Word文档的工作python-docx
,我们会让事情变得简单。
增加一段
段落是Word的基础。它们用于正文文本,但也用于标题和列表项目(如项目符号)。
这里是添加一个最简单的方法:
paragraph = document.add_paragraph('Lorem ipsum dolor sit amet.')
此方法返回对段落的引用,新添加的段落在文档的结尾。新的段落引用被分配给paragraph
在这种情况下,我将要离开了这一点在下面的例子中,除非我有一个需要它。在你的代码中,通常你不会对项目做任何事情,在添加它,所以没有什么意义,保持引用它挂在周围。
还可以使用一个段落作为“光标”,并在其上直接插入一个新段落:
prior_paragraph = paragraph.insert_paragraph_before('Lorem ipsum')
这允许将一个段落插入到文档的中间,这在修改现有文档时通常很重要,而不是从头开始生成。
添加标题
在除了最短文档之外的任何内容中,正文文本被分成多个部分,每个部分以一个标题开始。以下是如何添加一个:
document.add_heading('The REAL meaning of the universe')
默认情况下,这会添加顶级标题,Word中显示为“标题1”。当您需要子节的标题时,只需指定所需的级别为1到9之间的整数:
document.add_heading('The role of dolphins', level=2)
如果指定级别0,将添加“标题”段落。这可以方便地启动一个相对较短的文档,没有单独的标题页。
添加分页符
每隔一段时间,你想要下一个文本在一个单独的页面,即使你所在的一个不是满的。“hard”分页符可以做到这一点:
document.add_page_break()
如果你发现自己经常使用它,这可能是一个标志,你可以通过更好地了解段落样式受益。可设置的一个段落样式属性是在包含该样式的每个段落之前立即断开页面。因此,您可以将标题设置为某个级别,以便始终启动新页面。更多风格后。它们对于真正充分利用Word至关重要。
添加表
一个经常遇到的内容,它自己的表格呈现,排列在整齐的行和列。Word在这方面做得相当不错。以下是添加表格的方法:
table = document.add_table(rows=2, cols=2)
表具有几个属性和方法,您将需要它们来填充它们。访问单个单元格可能是一个好的开始的地方。作为基线,您可以始终按其行和列指示访问单元格:
这就给出了我们刚刚创建的表格最上面一行的右边单元格。注意,行和列指示是基于零的,就像在列表访问中一样。
一旦你有一个单元格,你可以把东西在它:
cell.text = 'parrot, possibly dead'
通常,一次访问一行单元格更容易,例如,当从数据源填充可变长度的表时。在.rows
一个表中的属性提供给单独的行,每个都具有一个 .cells
属性。该.cells
两个物业Row
和Column
支持索引访问,就像一个列表:
row = table.rows[1]
row.cells[0].text = 'Foo bar to you.'
row.cells[1].text = 'And a hearty foo bar to you too sir!'
在.rows
和.columns
桌子上的集合是可迭代的,这样你就可以直接在使用它们for
循环。相同的.cells
上行或列序列:
for row in table.rows:
for cell in row.cells:
print(cell.text)
如果你想在表中的行或列的计数,只要使用len()
的顺序:
row_count = len(table.rows)
col_count = len(table.columns)
您还可以以递增方式向表中添加行,如下所示:
这对于我们上面提到的可变长度表场景非常方便:
# get table data -------------
items = get_things_from_database_or_something()
# add table ------------------
table = document.add_table(1, 3)
# populate header row --------
heading_cells = table.rows[0].cells
heading_cells[0].text = 'Qty'
heading_cells[1].text = 'SKU'
heading_cells[2].text = 'Description'
# add a data row for each item
for item in items:
cells = table.add_row().cells
cells[0].text = str(item.qty)
cells[1].text = item.sku
cells[2].text = item.desc
同样的工作对列,虽然我还没有看到它的一个用例。
Word具有一组预格式化的表格样式,您可以从其表格样式库中选择。您可以将其中的一个应用于表格,如下所示:
table.style = 'LightShading-Accent1'
通过从表样式名称中删除所有空格形成样式名称。通过将鼠标悬停在Word的表样式库中的缩略图上,可以找到表样式名称。
添加图片
Word中,您可以将图像使用的文档中的菜单项。以下是如何做到这一点的:Insert > Photo > Picture fromfile...
python-docx
document.add_picture('image-filename.png')
此示例使用路径,从本地文件系统加载图像文件。你也可以使用一个类文件对象,本质上就像一个打开的文件的任何对象。如果您从数据库或网络检索图像,并且不想获取涉及的文件系统,这可能很方便。
图像大小
默认情况下,添加图像出现在本地的大小。这通常比你想要的更大。本机大小的计算方法。因此,具有300dpi分辨率的300×300像素图像出现在一平方英寸。问题是大多数图像不包含dpi属性,它默认为72 dpi。这将使同一图像在一边,在一半左右的某处出现4.167英寸。pixels / dp