Python四大核心數據結構深度解析：列表、元組、字典與集合

在Python編程語言中，數據結構是組織和存儲數據的基本方式。Python提供了四種內置的核心數據結構：列表（List）、元組（Tuple）、字典（Dictionary）和集合（Set）。這些數據結構各有特點，適用于不同的編程場景。本文將深入探討這四種數據結構的特性、使用方法、性能考量以及實際應用場景，幫助讀者全面理解并掌握它們的正確使用方式。

一、列表（List）：靈活有序的容器

1.1 列表的基本特性

列表是Python中最常用的數據結構之一，它表現為一個有序的可變序列。列表中的元素可以是任何數據類型，包括數字、字符串、甚至其他列表。

# 創建列表的多種方式
numbers = [1, 2, 3, 4, 5]
fruits = ['apple', 'banana', 'cherry']
mixed = [1, 'hello', 3.14, True]

列表的可變性是其最重要的特征之一。與字符串不同，列表創建后可以修改其中的元素，可以添加或刪除元素，也可以改變現有元素的值。

1.2 列表的常用操作

列表支持豐富的操作方法，下面是一些最常用的：

增刪改查操作：

# 添加元素
fruits.append('orange')  # 在末尾添加
fruits.insert(1, 'mango')  # 在指定位置插入# 刪除元素
del fruits[0]  # 刪除指定索引元素
fruits.remove('banana')  # 刪除指定值元素
popped = fruits.pop()  # 刪除并返回最后一個元素# 修改元素
fruits[0] = 'kiwi'# 查找元素
if 'apple' in fruits:print("蘋果在列表中")

切片操作：
列表支持強大的切片操作，可以方便地獲取子列表：

numbers = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
first_three = numbers[:3]  # [0, 1, 2]
last_three = numbers[-3:]  # [7, 8, 9]
middle = numbers[3:7]  # [3, 4, 5, 6]
every_other = numbers[::2]  # [0, 2, 4, 6, 8]
reversed_list = numbers[::-1]  # 反轉列表

1.3 列表的性能考量

雖然列表非常靈活，但在某些操作上性能并不理想：

在列表開頭或中間插入/刪除元素的時間復雜度為O(n)，因為需要移動后續所有元素
查找元素是否在列表中（使用in操作）的時間復雜度也是O(n)

對于需要頻繁在開頭或中間插入刪除元素的場景，可以考慮使用collections.deque，它提供了O(1)時間復雜度的兩端操作。

1.4 列表推導式

Python提供了一種簡潔的創建列表的方式——列表推導式：

# 創建平方數列表
squares = [x**2 for x in range(10)]
# 帶條件的列表推導式
even_squares = [x**2 for x in range(10) if x % 2 == 0]

列表推導式不僅代碼簡潔，而且在某些情況下比普通循環更快，因為它的實現是在C語言層面優化的。

二、元組（Tuple）：不可變的序列

2.1 元組的基本特性

元組與列表非常相似，都是有序的序列結構，但關鍵區別在于元組是不可變的。一旦創建，就不能修改元組的內容。

# 創建元組
coordinates = (10.0, 20.0)
colors = ('red', 'green', 'blue')
single_element = (42,)  # 注意逗號，區別于(42)

元組的不可變性帶來了幾個優勢：

安全性：數據不會被意外修改
可哈希性：可以作為字典的鍵
性能：在某些操作上比列表更快

2.2 元組的常見用途

雖然元組不如列表靈活，但在以下場景中非常有用：

作為函數的返回值：

def get_stats(data):return min(data), max(data), sum(data)/len(data)minimum, maximum, average = get_stats([1, 2, 3, 4, 5])

作為字典的鍵：

locations = {(35.6895, 139.6917): "Tokyo",(40.7128, -74.0060): "New York"
}

保護數據不被修改：
當需要確保數據在程序運行期間不被改變時，使用元組比列表更合適。

2.3 命名元組

Python的collections模塊提供了namedtuple，它是元組的子類，可以為元組的每個位置分配名稱，使代碼更易讀：

from collections import namedtuplePoint = namedtuple('Point', ['x', 'y'])
p = Point(10, y=20)
print(p.x)  # 10
print(p.y)  # 20

命名元組既有元組的不可變性和性能優勢，又提高了代碼的可讀性。

三、字典（Dictionary）：高效的鍵值存儲

3.1 字典的基本特性

字典是Python中的映射類型，存儲鍵值對（key-value pairs）。字典是無序的（Python 3.7+中保持插入順序），鍵必須是不可變類型（如字符串、數字或元組），且唯一。

# 創建字典
person = {'name': 'Alice', 'age': 25, 'city': 'New York'}
grades = dict(math=90, physics=85, chemistry=88)

字典的查找速度非常快，時間復雜度接近O(1)，因為它基于哈希表實現。

3.2 字典的常用操作

基本操作：

# 訪問元素
print(person['name'])  # Alice# 修改元素
person['age'] = 26# 添加元素
person['job'] = 'Engineer'# 刪除元素
del person['city']

安全訪問：

# 避免KeyError的訪問方式
age = person.get('age', 0)  # 如果'age'不存在，返回0

字典遍歷：

# 遍歷鍵
for key in person:print(key)# 遍歷鍵值對
for key, value in person.items():print(f"{key}: {value}")

3.3 字典推導式

類似于列表推導式，字典也有自己的推導式語法：

# 創建數字到其平方的映射
squares = {x: x**2 for x in range(6)}
# 帶條件的字典推導式
even_squares = {x: x**2 for x in range(6) if x % 2 == 0}

3.4 字典的高級用法

defaultdict：
collections模塊中的defaultdict可以自動為不存在的鍵創建默認值：

from collections import defaultdictword_counts = defaultdict(int)  # 默認值為0
for word in words:word_counts[word] += 1

Counter：
專門用于計數的字典子類：

from collections import Countercounts = Counter(['apple', 'banana', 'apple', 'orange'])
print(counts['apple'])  # 2

四、集合（Set）：唯一元素的容器

4.1 集合的基本特性

集合是無序的、不重復元素的集合。集合的主要用途包括成員測試、消除重復元素以及數學集合運算（并集、交集、差集等）。

# 創建集合
fruits = {'apple', 'banana', 'cherry'}
numbers = set([1, 2, 3, 4, 5])

集合中的元素必須是可哈希的（不可變類型），因此列表不能作為集合元素，但元組可以。

4.2 集合操作

基本操作：

# 添加元素
fruits.add('orange')# 刪除元素
fruits.remove('banana')  # 如果不存在會引發KeyError
fruits.discard('banana')  # 安全刪除，不存在也不報錯

集合運算：

a = {1, 2, 3}
b = {2, 3, 4}# 并集
print(a | b)  # {1, 2, 3, 4}# 交集
print(a & b)  # {2, 3}# 差集
print(a - b)  # {1}# 對稱差集（僅在其中一個集合中的元素）
print(a ^ b)  # {1, 4}

4.3 集合的應用場景

去重：

unique_numbers = list(set([1, 2, 2, 3, 3, 3]))  # [1, 2, 3]

快速成員測試：
集合的成員測試時間復雜度為O(1)，比列表的O(n)快得多：

if 'apple' in fruits:  # 非常高效print("找到了蘋果")

五、四種數據結構的比較與選擇

5.1 特性對比

特性	列表(List)	元組(Tuple)	字典(Dict)	集合(Set)
有序性	是	是	否(Python 3.7+有序)	否
可變性	可變	不可變	可變	可變
元素重復	允許	允許	鍵唯一	元素唯一
查找速度	O(n)	O(n)	O(1)	O(1)
典型用途	存儲序列	固定數據	鍵值映射	唯一元素

5.2 如何選擇合適的數據結構

選擇數據結構時應考慮以下因素：

是否需要保持順序？
- 需要：列表或元組
- 不需要：字典或集合
是否需要修改數據？
- 需要：列表、字典或集合
- 不需要：元組
是否需要快速查找？
- 需要：字典或集合
- 不需要：列表或元組
數據是否唯一？
- 需要唯一：集合或字典的鍵
- 允許重復：列表或元組
是否需要鍵值關聯？
- 需要：字典
- 不需要：其他三種

六、實際應用案例

6.1 使用字典統計詞頻

def word_frequency(text):words = text.lower().split()frequency = {}for word in words:frequency[word] = frequency.get(word, 0) + 1return frequency# 更簡潔的Counter版本
from collections import Counterdef word_frequency(text):return Counter(text.lower().split())

6.2 使用集合找出共同好友

alice_friends = {'Bob', 'Charlie', 'Diana'}
bob_friends = {'Alice', 'Charlie', 'Eve'}common_friends = alice_friends & bob_friends
print(f"Alice和Bob的共同好友是: {common_friends}")

6.3 使用元組和字典實現簡單的學生成績系統

# 使用元組表示學生信息（學號，姓名）
students = [(1001, 'Alice'),(1002, 'Bob'),(1003, 'Charlie')
]# 使用字典存儲成績 {學號: 分數}
grades = {1001: 85,1002: 92,1003: 78
}# 查找學生成績
student_id = 1002
for id, name in students:if id == student_id:print(f"{name}的成績是: {grades.get(id, '無記錄')}")break