不借助 pandas 快速分组二维列表
问题:
给定一个二维列表,如何快速分组其元素,使得连续的元素属于同一组,且组名根据元素的首个元素确定?
解决方案:
itertools 模块
对于大数组,我们推荐使用高效的 itertools 模块。
import itertools def group_large_array(data): grouped_data = {} for key, group in itertools.groupby(data, lambda x: x[0]): grouped_data[key] = [item[1] for item in group] return [grouped_data[key] for key in grouped_data]
使用方法:
data = [['A', 33], ['A', 0], ['A', 12], ['A', 3], ['B', 3], ['B', 0], ['B', 77], ['C', 1], ['C', 2], ['C', 5], ['C', 0], ['C', 11], ['C', 19]] result = group_large_array(data) print(result)
解释:
- itertools.groupby 按照首个元素将数据分组。
- 列表推导式提取每一组元素的第二个元素。
- 返回结果列表,其中每个元素代表一个组。
优点:
- 避免使用 append,提高效率。
- 在处理大数组时节省内存。