在以前的文章我曾经说过,如果学习和在实际生产环境使用 Python 3,版本至少应该从 Python3.6 开始,版本越高越好。现在是已经是 Python 3.7,按计划 Python 3.8 今年 10 月 20 日也会发布。

为什么我要强调从 Python 3.6 开始呢?我认为在这之前的版本无论是性能和语法完整性都不够,在 Python 3.6 时添加了异步生成器、异步推导语法,非常实用的 Path 模块等等,另外一个很重要的是添加了 f-strings 语法,大家用了就会发现根本停不下来。本文就和大家聊聊这个神奇的 f-strings。

f-string 是格式化字符串的新语法。与其他格式化方式相比,它们不仅更易读,更简洁,不易出错,而且速度更快!我们首先了解下可视化字符串语法的历史

1: %-formatting

最早的格式化是用 %(百分号), 它这么用:

In : name = 'Xiaoming'

In : 'Hello %s' % name
Out: 'Hello Xiaoming'

% 符号前面使用一个字符串作为模板,模板中有标记格式的占位符号。占位符控制着显示的格式,这里用的%s表示格式化成字符串,另外常用的是%d(十进制整数)、%f(浮点数)。

格式化语法也可以格式化多个变量,需要把变量用括号括起来:

In : id = 123
In : 'User[%s]: %s' % (id, name)
Out: 'User[123]: Xiaoming'

另外也支持使用字典的形式:

In : 'User[%(id)s]: %(name)s' % {'id': 123, 'name': 'Xiaoming'}
Out: 'User[123]: Xiaoming'

这种用法一直到现在仍然被使广泛使用,但是其实它是一种不被提倡使用的语法 (我初 Python 学习时,就提过)。主要是当要格式化的参数很多时,可读性很差,还容易出错(数错占位符的数量),也不灵活,举个例子,name 这个变量要在格式化时用 2 次,就要传入 2 次。

2. str.format()

从 Python 2.6 开始,新增了一种格式化字符串的函数str.format(),基本语法是通过{}:来代替以前的%。format 函数支持通过位置、关键字、对象属性和下标等多种方式使用,不仅参数可以不按顺序,也可以不用参数或者一个参数使用多次。并且可以通过对要转换为字符串的对象的__format __方法进行扩展。

In : name = 'Xiaoming'

In : 'Hello {}'.format(name)
Out: 'Hello Xiaoming'

通过位置访问:

In : '{0}, {1}, {2}'.format('a', 'b', 'c')
Out: 'a, b, c'

In : '{2}, {1}, {0}'.format('a', 'b', 'c')
Out: 'c, b, a'

In : '{1}, {1}, {0}'.format('a', 'b', 'c')
Out: 'b, b, a'

通过关键字访问:

In : 'Hello {name}'.format(name='Xiaoming')
Out: 'Hello Xiaoming'

通过对象属性访问:

In : from collections import namedtuple
In : p = Point(11, y=22)
In : 'X: {0.x};  Y: {0.y}'.format(p)
Out: 'X: 11;  Y: 22'

通过下标访问:

In : coord = (3, 5)

In : 'X: {0[0]};  Y: {0[1]}'.format(coord)
Out: 'X: 3;  Y: 5

可以感受到 format 函数极大的扩展了格式化功能。但是当处理多个参数和更长的字符串时,str.format () 的内容仍然可能非常冗长,除了定义参数变量,需要把这些变量写进 format 方法里面。

3. f-Strings

现在好了,Python 3.6 新增了 f-strings,这个特性叫做字面量格式化字符串,F 字符串是开头有一个 f 的字符串文字,Python 会计算其中的用大括号包起来的表达式,并将计算后的值替换进去。

In : name = 'Xiaoming'

In : f'Hello {name}'
Out: 'Hello Xiaoming'

In : f'Hello {name.upper()}'
Out: 'Hello XIAOMING'

In : d = {'id': 123, 'name': 'Xiaoming'}

In : f'User[{d["id"]}]: {d["name"]}'
Out: 'User[123]: Xiaoming'

如果你学过 Ruby,ES6,你会非常容易接受这样的语法。另外在速度上,f-strings 是三种方案中最快的:

In : import timeit

In : timeit.timeit("""name = "Xiaoming"
...: 'Hello is %s.' % name""", number = 10000)
Out: 0.0023188740001387487

In : 'Hello is %s.' % name
Out: 'Hello is Xiaoming.'

In : timeit.timeit("""name = "Xiaoming"
...: 'Hello is {}.'.format(name)""", number = 10000)
Out: 0.0038487229999191186

In : timeit.timeit("""name = "Xiaoming"
...: f'Hello is {name}.'""", number = 10000)
Out: 0.0011758640002881293

可以侧面感受到,str.format 最慢,% s 的稍快一点,F-string 是最快的!你还有什么利用不用它?

现在我写 Python 3.6 以上的代码时,我已经完全不用另外 2 种格式化用法了。

future-fstrings

通过上面的例子,希望我们有一个共识,就是如果你的项目或者工作中使用的 Python 版本已经不小于 3.6,f-string 格式化是首选方式,不仅在保持功能强大的同时语义上更容易理解,而且性能也有较大的提升。但是不巧你用不了 Python 的 f-strings,还有个选择,就是 future-fstrings 这个项目。它的作者也是 pre-commit 作者,一个 pytest 和 tox 核心开发。

在我个人电脑的 Python 2.7 版本上体验一下:

❯ pip2.7 install future-fstrings
❯ cat test.py
# coding: future_fstrings

name = "Xiaoming"
print(f'Hello is {name}.')
print(f'Hello {name.upper()}')

d = {'id': 123, 'name': 'Xiaoming'}

print(f'User[{d["id"]}]: {d["name"]}')

~/sansa master*
❯ python -V
Python 2.7.15

~/sansa master*
❯ python test.py
Hello is Xiaoming.
Hello XIAOMING
User[123]: Xiaoming

是不是很酷?这个库的原理值得大家借鉴,我详细的分析下。

为什么根本没有 import future_fstrings 代码却能正常运行?

这是因为在你安装 future_fstrings 这个包时,在 site-packages 下添加一个叫做aaaaa_future_fstrings.pth的文件。pth 文件是路径配置文件,这种文件本来是为了扩充搜索模块路径进 sys.path 的,也有一些包用它做高级定制。

我们这里提aaaaa_future_fstrings.pth在这里被用来导入包了。所以 CPython 解释器运行时会加载这个 pth 文件,然后调用其中的future_fstrings.register方法。

emmm, pth 文件很多同学感觉很陌生,其他它离我们很近,只是作为开发者日常基本不需要关注它。举一个最常见的例子easy-install.pth。有时候为了开发方便,安装包的时候是这样用的:

❯ git clone https://github.com/dongweiming/aiomcache
❯ cd aiomcache
❯ pip install -e .

这样你使用的 aiomcache,是你本地的版本:

❯ cd ~/test  # 切换到其他目录,防止import本地目录下的aiomcache模块
❯ python -c 'import aiomcache; print(aiomcache)'
<module 'aiomcache' from '/Users/dongweiming/aiomcache/aiomcache/__init__.py'>

这样怎么生效的呢?有些同学会说「嗯,安装后就放入了 site-packages 下了呗」,其实不然,你去系统 Site 包目录下是找不到,但是呢,sys.path 是可以找到的:

❯ python -m site
sys.path = [
    '/Users/dongweiming/test',
    '/Users/dongweiming/.venvburrito/lib/python2.7/site-packages',
    '/Users/dongweiming/vue-admin/venv/lib/python37.zip',
    '/Users/dongweiming/vue-admin/venv/lib/python3.7',
    '/Users/dongweiming/vue-admin/venv/lib/python3.7/lib-dynload',
    '/usr/local/Cellar/python/3.7.2_1/Frameworks/Python.framework/Versions/3.7/lib/python3.7',
    '/Users/dongweiming/vue-admin/venv/lib/python3.7/site-packages',
    '/Users/dongweiming/aiomcache',
]
USER_BASE: '/Users/dongweiming/.local' (exists)
USER_SITE: '/Users/dongweiming/.local/lib/python3.7/site-packages' (exists)
ENABLE_USER_SITE: False

可以看到,搜索的目录包含了/Users/dongweiming/aiomcache,所以能找到。这是怎么生效的呢?其实就是靠上面说的easy-install.pth

❯ cat /Users/dongweiming/vue-admin/venv/lib/python3.7/site-packages/easy-install.pth
/Users/dongweiming/aiomcache

看到了吧,所以说 pth 配置文件扩充了要搜索模块的路径。我们测试下把 aiomcache 这样删掉:

❯ sed -i '' '/aiomcache/d' /Users/dongweiming/vue-admin/venv/lib/python3.7/site-packages/easy-install.pth  # Mac下Sed用法

再 import,和查看搜索目录就找不到 aiomcache 了:

❯ python -c 'import aiomcache; print(aiomcache)'
Traceback (most recent call last):
  File "<string>", line 1, in <module>
ModuleNotFoundError: No module named 'aiomcache'

❯ python -m site
... # 忽略输出,和上面的区别是没有包含aiomcache的哪一行

这个包实现 f-strings 的原理是?

奥妙就在# coding: future_fstrings这一句中,另外一个写法是# -*- coding: future_fstrings -*-

想必大家会想到 Python 2 里面的# coding: utf-8头了吧,这句注释用来声明文件编码。这个包巧妙的利用了它,在调用 register 函数时给 codecs 模块注册了新的文件编码方式,在词法扫描时把 f-strings 转换成 format 的写法,上面的例子等价于:

❯ future-fstrings-show test.py
# coding: future_fstrings

name = "Xiaoming"
print('Hello is {}.'.format((name)))
print('Hello {}'.format((name.upper())))

d = {'id': 123, 'name': 'Xiaoming'}

print('User[{}]: {}'.format((d["id"]), (d["name"])))

不过这样的实现性能肯定比原生的要差很多。大家有兴趣的可以尝个鲜儿~

结束语

在 Python 之禅中有这么一句:

There should be one-- and preferably only one --obvious way to do it.

也就是「应该提供一种,且最好只提供一种,一目了然的解决方案」。虽然 f-strings 不是唯一可能的格式化字符串选择,但它是最好最正确的那个选择!!!

延伸阅读

  1. https://docs.python.org/3/library/string.html#format-specification-mini-language
  2. https://realpython.com/python-f-strings/
  3. https://www.python.org/dev/peps/pep-0498/#abstract
  4. https://github.com/asottile/future-fstrings