Python中将嵌套列表扁平化的多种实现方法

 更新时间:2025年07月06日 10:48:46   作者:1010n111  
在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求,本文将给大家介绍了多种实现这一目标的方法,需要的朋友可以参考下

Python中将嵌套列表扁平化的方法

技术背景

在Python编程中,我们常常会遇到需要将嵌套列表(即列表中包含列表)转换为一个一维的扁平列表的需求。例如,有一个嵌套列表[[1, 2, 3], [4, 5, 6], [7], [8, 9]],我们希望将其转换为[1, 2, 3, 4, 5, 6, 7, 8, 9]。以下将介绍多种实现这一目标的方法。

实现步骤

1. 使用嵌套列表推导式

嵌套列表推导式是一种简洁的实现方式。其基本思路是通过两层循环,将嵌套列表中的每个元素提取出来,组成一个新的扁平列表。

xss = [[1, 2, 3], [4, 5, 6], [7], [8, 9]]
flat_list = [x for xs in xss for x in xs]
print(flat_list)

2. 使用itertools.chain()或itertools.chain.from_iterable()

itertools模块提供了高效的迭代工具。chain()函数可以将多个可迭代对象连接起来,而chain.from_iterable()可以直接接受一个可迭代对象作为参数,将其内部的可迭代对象连接起来。

import itertools
list2d = [[1, 2, 3], [4, 5, 6], [7], [8, 9]]
# 使用 chain()
merged1 = list(itertools.chain(*list2d))
# 使用 chain.from_iterable()
merged2 = list(itertools.chain.from_iterable(list2d))
print(merged1)
print(merged2)

3. 使用sum()函数

sum()函数可以对可迭代对象求和,当对嵌套列表使用时,结合初始值[],可以实现列表的扁平化。但这种方法效率较低,不适合处理大规模数据。

xss = [[1, 2, 3], [4, 5, 6], [7], [8, 9]]
flat_list = sum(xss, [])
print(flat_list)

4. 使用functools.reduce()

reduce()函数可以对序列中的元素进行累积操作。结合operator.concatoperator.iconcat可以实现列表的扁平化。

from functools import reduce
import operator
xss = [[1, 2, 3], [4, 5, 6], [7], [8, 9]]
# 使用 operator.concat
out1 = reduce(operator.concat, xss)
# 使用 operator.iconcat
out2 = reduce(operator.iconcat, xss, [])
print(out1)
print(out2)

5. 自定义递归函数

通过递归的方式,可以处理任意深度的嵌套列表。

from typing import Iterable

def flatten(items):
    for x in items:
        if isinstance(x, Iterable) and not isinstance(x, (str, bytes)):
            yield from flatten(x)
        else:
            yield x

simple = [[1, 2, 3], [4, 5, 6], [7], [8, 9]]
flat_list = list(flatten(simple))
print(flat_list)

核心代码

以下是上述各种方法的核心代码总结:

import itertools
from functools import reduce
import operator
from typing import Iterable

# 嵌套列表推导式
def nested_list_comprehension(xss):
    return [x for xs in xss for x in xs]

# itertools.chain.from_iterable()
def itertools_chain(xss):
    return list(itertools.chain.from_iterable(xss))

# sum()
def pythons_sum(xss):
    return sum(xss, [])

# functools.reduce() with operator.concat
def reduce_concat(xss):
    return reduce(operator.concat, xss)

# functools.reduce() with operator.iconcat
def reduce_iconcat(xss):
    return reduce(operator.iconcat, xss, [])

# 自定义递归函数
def custom_flatten(items):
    for x in items:
        if isinstance(x, Iterable) and not isinstance(x, (str, bytes)):
            yield from custom_flatten(x)
        else:
            yield x

xss = [[1, 2, 3], [4, 5, 6], [7], [8, 9]]
print(nested_list_comprehension(xss))
print(itertools_chain(xss))
print(pythons_sum(xss))
print(reduce_concat(xss))
print(reduce_iconcat(xss))
print(list(custom_flatten(xss)))

最佳实践

  • 小规模数据:对于小规模的嵌套列表,嵌套列表推导式是一种简洁且直观的选择,代码易于理解和维护。
  • 大规模数据:当处理大规模的嵌套列表时,itertools.chain.from_iterable()方法通常具有较高的性能,因为它避免了创建大量的中间列表。
  • 任意深度嵌套:如果嵌套列表的深度不确定,使用自定义的递归函数可以处理任意深度的嵌套结构。

常见问题

1. 性能问题

使用sum()函数和reduce()函数结合operator.concat时,由于每次操作都会创建一个新的列表对象,会导致性能下降,尤其是处理大规模数据时。建议使用itertools.chain.from_iterable()或自定义递归函数。

2. 字符串处理问题

在处理包含字符串的嵌套列表时,需要注意字符串也是可迭代对象。在自定义递归函数中,通常需要排除字符串类型,以避免将字符串拆分为单个字符。例如:

from typing import Iterable

def flatten(items):
    for x in items:
        if isinstance(x, Iterable) and not isinstance(x, (str, bytes)):
            yield from flatten(x)
        else:
            yield x

complicated = [[1, [2]], (3, 4, {5, 6}, 7), 8, "9"]
flat_list = list(flatten(complicated))
print(flat_list)

3. 空列表处理

在使用某些方法时,如reduce()函数,如果输入的嵌套列表中包含空列表,可能会导致结果不符合预期。在实际使用中,需要根据具体情况进行处理。

相关文章

  • Keras 使用 Lambda层详解

    Keras 使用 Lambda层详解

    这篇文章主要介绍了Keras 使用 Lambda层详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • 解决Jupyter 文件路径的问题

    解决Jupyter 文件路径的问题

    这篇文章主要介绍了解决Jupyter 文件路径的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • python计算auc的方法

    python计算auc的方法

    在本篇文章里小编给大家整理的是关于python计算auc的方法及相关内容,有兴趣的朋友们可以学习下。
    2020-09-09
  • 基于Python+Tkinter实现一个简易计算器

    基于Python+Tkinter实现一个简易计算器

    Tkinter作为Python的标准库,是非常流行的Python GUI工具,同时也是非常容易学习的。本文将利用Tkinter绘制一个简单的计算器,感兴趣的可以试一试
    2022-01-01
  • 模型训练时GPU利用率太低的原因及解决

    模型训练时GPU利用率太低的原因及解决

    这篇文章主要介绍了模型训练时GPU利用率太低的原因及解决方案,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-02-02
  • Python 通过打码平台实现验证码的实现

    Python 通过打码平台实现验证码的实现

    这篇文章主要介绍了Python 通过打码平台实现验证码的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-05-05
  • 解决Cannot set up a python SDK at Python问题

    解决Cannot set up a python SDK at Python问题

    本文主要介绍了解决Cannot set up a python SDK at Python问题,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2025-04-04
  • Python中的copy()函数详解(list,array)

    Python中的copy()函数详解(list,array)

    这篇文章主要介绍了Python中的copy()函数详解(list,array),具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-09-09
  • python与php实现分割文件代码

    python与php实现分割文件代码

    本文给大家分享的是两个分别使用python和php实现的将文件分割成小文件的代码,非常的实用有需要的小伙伴可以参考下
    2017-03-03
  • 如何使用 profile 进行python代码性能分析

    如何使用 profile 进行python代码性能分析

    对代码优化的前提是需要了解性能瓶颈在什么地方,程序运行的主要时间是消耗在哪里,对于比较复杂的代码可以借助一些工具来定位,python 内置了丰富的性能分析工具,本文介绍如何使用profile进行python代码性能分析,感兴趣的朋友一起看看吧
    2024-12-12

最新评论