Python语法分析之字符串格式化

时间:2021-05-22

前序

There should be one - and preferably only one - obvious way to do it.
———— the Zen of Python
意译:Python提倡用一种,而且最好是只有一种方法来完成一件事

虽然 Python 有以上的提倡,但却在字符串格式化方面,没有做到这一点。

字符串格式化

敲黑板,划重点:在 Python 中有至少三种常见方式实现字符串格式化:

  • %-formatting 格式(Python2.6以前,推荐输出时使用)
  • str.format() 格式(Python2.6,推荐字符串拼接使用)
  • f-string 格式(Python3.6,推荐使用)
  • 1、printf 风格的字符串格式化(%-formatting 格式)

    Python2.6 之前只有这一种方式,使用与 C 中 printf 函数一样的语法。

    基础语法:format % value(其中 format 为一个字符串),在 format 中的 % 转换标记符将被替换为零个或者多个 value 条目

    基础用法

    # coding in Python3.7print('this is %s blog written in %d%%%02d%%%d %02d:%d:%06.2f' % ('TinyDolphin', 2019, 5, 31, 9, 30, 22.3333))# this is TinyDolphin blog written in 2019%05%31 09:30:022.33print('title=%(title)s, author=%(name)s' % {'name': 'TinyDolphin', 'title': 'Python 语法浅析:字符串格式化'})# title=Python 语法浅析:字符串格式化, author=TinyDolphinprint('%0*.*f' % (6, 2, 2.345))# 002.35

    printf 语法

    针对这种格式化操作,重要知识点如下:

    1、针对这些转换标记字符,必须按照以下顺序:

    % --> (name) --> '#'、'-'、'0'、'+'、' ' --> m.n | m --> d、s、r、f

    2、常用转换类型:

    • %s 格式化字符串(str()函数)
    • %r 格式化字符串(repr()函数)
    • %d 格式化整数
    • %f 格式化浮点数字,可指定小数点后的精度

    3、常用的转换标记字符:

    • - 用做左对齐
    • + 在正数前面显示加号( + )
    • # 在八进制数前面显示零('0'),在十六进制前面显示'0x'或者'0X'(取决于用的是'x'还是'X')
    • 0 显示的数字前面填充'0',而不是默认的空格
    • % '%%'输出一个单一的'%'
    • m.n 表示 m 是显示的最小总宽度,n 是小数点后的位数
    • * 定义宽度或者小数点精度(用在不能预先指定m.n的值)
    • (var) 映射变量(字典参数)

    2、字符串的方式(str.format()格式)

    Python2.6 开始,新增了一种格式化字符串的函数 str.format(),它增强了字符串格式化的功能,比如:支持位置映射、关键字映射、对象属性映射、下标映射等多种方式

    基本语法是通过 {} 和 : 来代替以前的 %,例如:'%03.2f'被改写成 '{:03.2f}'。

    两个格式化方法:

    str.format(*args, **kwargs)
    字符串的格式化操作。
    str 包含字符串字面值 AND {} 括起来的替换域。
    每个替换域:位置参数的索引 OR 关键字参数的名称

    str.format_map(mapping)
    类似于 str.foramt(**mapping)
    不同之处:mapping 会被直接使用而不是复制到一个dict。

    PS:Python 存在内置函数 format(value, format_spec):会转换成 type(value).format(value, format_spec)

    基础用法

    1、按位置访问参数

    '{0}-{1}-{2}'.format('a', 'b', 'c') # 'a-b-c''{}-{}-{}'.format('a', 'b', 'c') # 'a-b-c''{2}-{1}-{0}'.format('a', 'b', 'c') # 'c-b-a''{2}-{1}-{0}'.format(*'abc') # 'c-b-a'args = ['a', 'b', 'c']'{2}-{1}-{0}'.format(*args) # 'c-b-a''{0}-{1}-{0}'.format(*['abc', 'def']) # 'abc-def-abc'

    2、按名称访问参数

    '{a}-{b}'.format(a='1', b='2') # '1-2'kwargs = {'a':'1', 'b':'2'}'{a}-{b}'.format(**kwargs) # '1-2'

    3、访问参数的属性

    class Point: def __init__(self, x, y): self.x, self.y = x, y def __str__(self): return 'Point({self.x}, {self.y})'.format(self=self) str(Point(3, 4)) # 'Point(3, 4)'

    4、访问参数的项

    point = (3, 5)'X:{0[0]} Y:{0[1]}'.format(point) # 'X:3 Y:5'

    5、替代 %s 和 %r (!s、!r)

    'str() = {!s}; repr() = {!r}'.format('a', 'a') # "str() = a; repr() = 'a'"

    6、对齐文本以及制定宽度(:<、:^、:>)

    '{:<20}'.format('left aligned') # 'left aligned ''{:>20}'.format('right aligned') # ' right aligned''{:^20}'.format('centered') # ' centered '# 使用 '*' 作为填充字符'{:*^20}'.format('centered') # '******centered******'

    7、替代 %+f、%-f 和 %f 以及指定正负号(:+、:-、:)

    '{:+f} {:+f}'.format(3.14, -3.14) # '+3.140000 -3.140000''{: f} {: f}'.format(3.14, -3.14) # ' 3.140000 -3.140000' 正号—>空格'{:-f} {:-f}'.format(3.14, -3.14) # '3.140000 -3.140000' == '{:f} {:f}'

    8、替换 %x 和 %o 以及转换基于不同进位制的值(:x、:d、:o、:b)

    'int:{0:d} hex:{0:x} oct:{0:o} bin:{0:b}'.format(42)# 'int:42 hex:2a oct:52 bin:101010''int:{0:d} hex:{0:#x} oct:{0:#o} bin:{0:#b}'.format(42)# 'int:42 hex:0x2a oct:0o52 bin:0b101010'# '#' : 加上前缀:0x、0o、0b

    9、使用逗号作为千位分隔符(:,)

    '{:,}'.format(123456789) # '123,456,789'

    10、表示为百分数(:.2%)

    '{:.2%}'.format(19/22) # '86.36%'

    11、使用特定类型的专属格式化

    import datetimed = datetime.datetime(2019, 6, 10, 22, 5, 13)'{:%Y-%m-%d %H:%M:%S}'.format(d)# '2019-06-10 22:05:13'

    12、嵌套参数以及更复杂的示例


    3、格式化字符串字面值(f-string 格式)

    是带有 'f' 或 'F' 前缀的字符串字面值。

    花括号以外的部分按其字面值处理,除了双重花括号 '{{' 或 '}}' 会被替换为相应的单个花括号。

    语法如下:

    单个花括号 '{',标示一个替换字段(以 Python 表达式打头)
    + 可能有一个以叹号 '!' 标示的转换字符
    + 可能有一个以冒号 ':' 标示的格式说明符
    + 以一个右花括号 '}' 作为结束

    注意:格式化字符串字面值中的表达式:

    • 当作正常的 Python 表达式处理 (这一点很重要,也很强大)
    • 不允许空表达式
    • lambda 表达式必须显式地加上圆括号
    • 可以包含换行(例如三引号字符串中)
    • 不能包含注释
    • 从左到右被求值

    如果指定了转换符,则表达式求值的结果会先转换再格式化。之后使用 Python 内置函数 format() 进行格式化。

    基本用法

    name = 'tinyDolphin'f'my name is {name}' # 'my name is tinyDolphin'f'my name is {name!r}' # "my name is 'tinyDolphin'"width = 10precision = 4value = 12.34567f'{value:{width}.{precision}}' # ' 12.35'today = datetime.datetime(year=2019, month=6, day=10)f'{today:%B %d, %Y}' # 'June 10, 2019'number = 1024f'{number:#0x}' # '0x400'

    PS:与 str.format() 有一点不同:在 str.format() 中,非数字索引将自动转化为字符串,而f-strings则不会。

    kwargs = {'a':1, 'b':2}# 使用 str.format()'a={kwargs[a]}'.format(kwargs=kwargs) # 'a=1'# 使用 f-stringf"a={kwargs[a]}" # × 发生异常Traceback (most recent call last): File "<stdin>", line 1, in <module>NameError: name 'a' is not defined# 正确使用 f-stringf"a={kwargs['a']}" # 'a=1'

    总结

    从以下三个方面进行对比:

    速度上:f-string > %-formatting > str.format()
    功能上:f-string > str.format() > %-formatting
    可读性: f-string > str.format() > %-formatting

    对于速度验证,笔者就不在此进行验证了。

    推荐使用场景:

    %-formatting:Python2 中,由于其性能优势,在涉及输出的一些操作时,优先推荐使用
    str.format():Python2 中,由于其功能优势,在涉及字符串拼接的一些操作时,优先推荐使用
    f-string: Python3 中,强烈推荐使用

    好了,以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对的支持。

    声明:本页内容来源网络,仅供用户参考;我单位不保证亦不表示资料全面及准确无误,也不保证亦不表示这些资料为最新信息,如因任何原因,本网内容或者用户因倚赖本网内容造成任何损失或损害,我单位将不会负任何法律责任。如涉及版权问题,请提交至online#300.cn邮箱联系删除。

    相关文章