Hello! 欢迎来到小浪资源网!

不借助Pandas,如何快速分组二维列表中的连续元素?


不借助Pandas,如何快速分组二维列表中的连续元素?

不借助 pandas 快速分组二维列表

问题:

给定一个二维列表,如何快速分组其元素,使得连续的元素属于同一组,且组名根据元素的首个元素确定?

解决方案:

itertools 模块

对于大数组,我们推荐使用高效的 itertools 模块。

import itertools  def group_large_array(data):     grouped_data = {}     for key, group in itertools.groupby(data, lambda x: x[0]):         grouped_data[key] = [item[1] for item in group]     return [grouped_data[key] for key in grouped_data]

使用方法:

data = [['A', 33], ['A', 0], ['A', 12], ['A', 3], ['B', 3], ['B', 0], ['B', 77], ['C', 1], ['C', 2], ['C', 5], ['C', 0], ['C', 11], ['C', 19]] result = group_large_array(data) print(result)

解释:

  • itertools.groupby 按照首个元素将数据分组。
  • 列表推导式提取每一组元素的第二个元素。
  • 返回结果列表,其中每个元素代表一个组。

优点:

  • 避免使用 append,提高效率。
  • 在处理大数组时节省内存。

相关阅读