在05python字符串基础中我们已经大致介绍过字符串,知道如何创建字符串,以及如何使用索引和切片来访问字符串中的字符。这篇文章主要介绍如何使用字符串来设置其他值的格式(比如便于打印),并大致了解使用字符串方法可完成的重要任务,如拆分、合并和查找等。
字符串基本操作
字符串是一种序列,所以所有的标准序列操作都适用于字符串
- 索引
- 切片
- 乘法
- 成员资格检查
- 长度
- 最大值
- 最小值
同时,字符串是一种不可变序列,所以元素赋值和切片赋值都是非法的,这方面字符串的性质更类似于元组。
>>>
>>> website = 'http://www.python.org'
>>> website[-3:] = 'com'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'str' object does not support item assignment
>>>
设置字符串的格式
将值转换为字符串并设置其格式是一个重要的操作,Python提供了多种字符串格式设置方法,即字符串格式化。
- 百分号
通过在 %
左边左边指定一个字符串(格式字符串),并在右边指定要设置的其格式的值,可以格式化字符串。指定要设置其格式的值时,可使用单个值(如字符串或数字),可以使用元组(如果要设置多个值格式),还可以使用字典,其中最常见的是元组。
>>>
>>> format = 'Hello, %s. %s enough for you?' # %s表示格式化字符串
>>> values = ('world', 'Hot')
>>> format % values
'Hello, world. Hot enough for you?'
>>>
>>> 'Hello %s. %s enough for you?' % ('world', 'Hot')
'Hello world. Hot enough for you?'
>>>
%s
称为转换说明符,指出了要将值插入在什么地方。s表示要将值视为字符串惊醒格式设置。
- 模板字符串
模板字符串类似于UNIX shell中的语法,旨在简化基本的格式设置机制。
>>>
>>> tmpl = Template('Hello, $who! $what enough for you?')
>>> tmpl.substitute(who='Mars', what='Dusty')
'Hello, Mars! Dusty enough for you?'
>>>
包含等好的参数称为关键字参数,在字符串格式设置中,可将关键字参数视视作为一种向命名替换字段提供值得方式。
- format——最常用的方法
在编写新代码时,应选择使用字符串方法format,使用这种方法时,每个替换字段都用 {}
括起来,其中可能包含名称,还可能包含有关如何应对相应的值进行转换和格式设置的信息。
>>>
>>> '{}, {} and {}.'.format('first', 'second', 'third')
'first, second and third.'
>>> '{0}, {1} and {2}.'.format('first', 'second', 'third')
'first, second and third.'
>>>
>>> '{3} {0} {2} {1} {3} {0}'.format('be', 'not', 'or', 'to') # 索引无需按照顺序排列,填入的值的索引与给定的参数元组索引对应即可
'to be or not to be'
>>>
>>> from math import pi
>>> '{name} is approximately {value:.2f}.'.format(value=pi, name='Π') # 大括号中还可以使用关键字参数,排序无关紧要,对应即可
'Π is approximately 3.14.'
>>>
>>> from math import pi
>>> '{name} is approximately {value}.'.format(value=pi, name='Π') # 格式说明符.2f需要使用:与字段名隔开。如果没有格式说明符,会展示所有小数
'Π is approximately 3.141592653589793.'
f
格式化
在python3.6中,如果变量与替换字段同名,还可以使用format的一种简写方式:使用f字符串——在字符串前面加上f
>>
>>> from math import e
>>> f"Euler's constant is roughly {e}."
"Euler's constant is roughly 2.718281828459045."
>>>
>>> "Euler's constant is roughly {e}.".format(e=e) # 与上面是等价的
"Euler's constant is roughly 2.718281828459045."
format格式化字符串
格式化字符串的内容很多,这一部分主要介绍对字符串调用方法format,并提供要设置其格式的值。基本原理就是给定每个值都被插入到字符串中,以替换用花括号中的替换字段。
如果要在最终结果中包含 {}
,可在格式字符串中使用两个花括号(即{{}})来指定。
>>>
>>> "{{ceci n'est pas une replacement field}}".format()
"{ceci n'est pas une replacement field}"
>>>
格式化字符串中,替换字段由以下三部分组成:
- 字段名:索引或标识符,指出要设置哪个值的格式并使用结果来替换该字段。除指定值外,还可以指定值的特定部分,如列表元素。
- 转换标志:跟在叹号后面的单个字符。当前支持的字符包括
r(表示repr)
、s(表示str)
和b
。如果使用了转换标志,将不使用对象本身的格式设置机制,而是使用指定的函数将对象转换为字符串,再做进一步的格式设置。 - 格式说明符:跟在冒号后面的表达式(这种表达式是使用微型格式指定语言表示的)。格式说明符让我们能够详细地指定最终的格式,包括格式类型(如字符串、浮点数或十六进制数),字段宽度和数的精度,如何显示符号和千位分隔符,以及各种对齐和填充方式。
替换字段名
有3中方式设置替换字段名
- 最简单的就是向format提供要设置其格式的未命名参数
- 通过索引来