1. dbm UNIX键-值数据库
dbm是面向DBM数据库的一个前端,DBM数据库使用简单的字符串值作为键来访问包含字符串的记录。dbm使用whichdb()标识数据库,然后用适当的模块打开这些数据库。dbm还被用作shelve的一个后端,shelve使用pickle将对象存储在一个DBM数据库中。
1.1 数据库类型
Python提供了很多模块来访问DBM数据库。具体选择的默认实现取决于当前系统上可用的库以及编译Python时使用的选项。特定实现有单独的接口,这使得Python程序可以与用其他语言编写的程序(这些语言可能不会在可用格式之间自动切换)交换数据,并且可以写适用于多个平台的可移植的数据文件。
1.1.1 dbm.gnu
dbm.gnu是GNU项目dbm库版本的一个接口。它的工作方式与这里介绍的其他DBM实现系统相同,只是open()支持的标志有些不同。
除了标准'r'、'w'、'c'和'n'标志,dbm.gnu.open()还支持一下标志:
'f'以快速(fast)模式打开数据库。在快速模式下,对数据库的写并不同步。
's'以同步(synchronized)模式打开数据库。对数据库做出修改时,这些改变要直接写至文件,而不是延迟到数据库关闭或显式同步时才写至文件。
'u'以不加锁(unlocked)的状态打开数据库。
1.1.2 dbm.ndbm
dbm.ndbm模块为dbm格式的UNIX ndbm实现提供了一个接口,依赖于编译时这个模块如何配置。模块属性library指示编译扩展模块时configure能找到库名。
1.1.3 dbm.dumb
dbm.dumb模块是没有其他实现可用时DBM API的一个可移植的后备实现。使用dbm.dumb模块不需要依赖任何外部库,但它的速度比大多数其他实现都慢。
1.2 创建一个新数据库
通过按顺序查找以下各个子模块的可用版本来选择新数据库的存储格式。
dbm.gnu
dbm.ndbm
dbm.dumb
open()函数接收flags来控制如何管理数据库文件。如果要在必要时创建一个新的数据库,则可以使用'c'。使用'n'则总会创建一个新数据库,并覆盖现有的文件。
- import dbm
- with dbm.open('example.db', 'n') as db:
- db['key'] = 'value'
- db['today'] = 'Sunday'
- db['author'] = 'Doug'
在这个例子中,文件总会重新初始化。
whichdb()会报告所创建数据库的类型。
- import dbm
- print(dbm.whichdb('example.db'))
取决于系统上安装的模块,示例程序的输出可能有所不同。
1.3 打开一个现有数据库
要打开一个现有数据库,可以使用flags 'r'(只读)或'w' (读写)。会自动将现有的数据库提供给whichdb()来识别,所以只要一个文件可以识别,便能使用一个适当的模块打开这个文件。
- import dbm
- with dbm.open('example.db', 'r') as db:
- print('keys():', db.keys())
- for k in db.keys():
- print('iterating:', k, db[k])
- print('db["author"] =', db['author'])
一旦打开,则db是一个类字典的对象。增加到数据库时,新建总是被转换为字节串,并且作为字节串返回。
1.4 错误情况
数据库的键必须是字符串。
- import dbm
- with dbm.open('example.db', 'w') as db:
- try:
- db[1] = 'one'
- except TypeError as err:
- print(err)
如果传入其他类型则会导致一个TypeError。
值必须是字符串或None。
- import dbm
- with dbm.open('example.db', 'w') as db:
- try:
- db['one'] = 1
- except TypeError as err:
- print(err)
如果值不是一个字符串,则会产生一个类似的TypeError。