为了使用 python 字典统计 csv 数据,需要六个步骤:导入 csv 和 defaultdict 模块。打开 csv 文件。创建一个 defaultdict 数据结构。遍历 csv 行并将键和值添加到字典中。提取数据并将其添加到字典中。关闭 csv 文件。
使用Python字典统计CSV数据的步骤
步骤 1:导入必要模块
import csv from collections import defaultdict
步骤 2:打开 CSV 文件
with open('data.csv', 'r') as csv_file:
步骤 3:创建 defaultdict
立即学习“Python免费学习笔记(深入)”;
data_dict = defaultdict(list)
defaultdict 是一个内置的 python 数据结构,它会在第一次访问不存在的键时自动创建该键并赋予其一个默认值。在我们的情况下,默认值是一个空列表。
步骤 4:遍历 CSV 行
csv_reader = csv.reader(csv_file) for row in csv_reader:
步骤 5:提取数据并添加到字典
key = row[0] # 第一列作为键 value = row[1] # 第二列作为值 data_dict[key].append(value)
这将根据键将值添加到字典中。如果键不存在,它将自动创建并初始化为空列表。
步骤 6:关闭 CSV 文件
csv_file.close()
示例代码
import csv from collections import defaultdict with open('data.csv', 'r') as csv_file: data_dict = defaultdict(list) csv_reader = csv.reader(csv_file) for row in csv_reader: key = row[0] value = row[1] data_dict[key].append(value) csv_file.close()
结果:
data_dict 将是一个字典,其中键是 CSV 文件的第一列,值是第二列中与该键相关联的值列表。
示例输出:
{'key1': ['value1', 'value2'], 'key2': ['value3'], 'key3': ['value4', 'value5']}