玩轉python:通俗易懂掌握高級數據結構-collections模塊之Counter

引言

Counter是Python中collections模塊提供的一個強大工具，用于統計可哈希對象的出現次數。它非常適合用于頻率統計、詞頻分析、數據聚合等場景。本文將詳細介紹Counter的關鍵用法和特性，并通過8個豐富的案例幫助讀者掌握其應用。

關鍵用法和特性表格

特性/方法	描述
統計頻率	快速統計可哈希對象的出現次數。
字典子類	`Counter`是`dict`的子類，支持所有字典操作。
初始化	使用`Counter(iterable)`或`Counter(mapping)`創建。
`elements()`	返回一個迭代器，包含所有元素（按出現次數重復）。
`most_common(n)`	返回出現次數最多的n個元素及其計數。
`update(iterable)`	更新計數器，增加元素的計數。
`subtract(iterable)`	更新計數器，減少元素的計數。
算術操作	支持加法（`+`）、減法（`-`）、交集（`&`）、并集（`\|`）操作。

1. `Counter`的概念

Counter是collections模塊中的一個類，用于統計可哈希對象的出現次數。它的主要特點是：

統計頻率：快速統計元素的出現次數。
字典子類：支持所有字典操作，如鍵值訪問、更新等。
高效性能：統計和更新操作的時間復雜度為O(1)。

2. `Counter`的用法

2.1 創建`Counter`

from collections import Counter# 從列表創建Counter
c = Counter(['apple', 'banana', 'apple', 'orange', 'banana', 'apple'])
print(c)  # 輸出: Counter({'apple': 3, 'banana': 2, 'orange': 1})# 從字符串創建Counter
c = Counter('abracadabra')
print(c)  # 輸出: Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})

2.2 訪問元素計數

# 訪問元素的計數
print(c['a'])  # 輸出: 5
print(c['z'])  # 輸出: 0（不存在時返回0）

2.3 更新計數器

# 更新計數器
c.update(['a', 'b', 'a'])
print(c)  # 輸出: Counter({'a': 7, 'b': 3, 'r': 2, 'c': 1, 'd': 1})

3. `Counter`的常見方法

3.1 `elements()`：返回所有元素

# 返回所有元素（按計數重復）
print(list(c.elements()))  # 輸出: ['a', 'a', 'a', 'a', 'a', 'a', 'a', 'b', 'b', 'b', 'r', 'r', 'c', 'd']

3.2 `most_common(n)`：返回最常見的元素

# 返回最常見的2個元素
print(c.most_common(2))  # 輸出: [('a', 7), ('b', 3)]

3.3 `subtract(iterable)`：減少元素計數

# 減少元素計數
c.subtract(['a', 'b', 'a'])
print(c)  # 輸出: Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})

3.4 算術操作

# 加法操作
c1 = Counter(['a', 'b', 'a'])
c2 = Counter(['b', 'c', 'b'])
print(c1 + c2)  # 輸出: Counter({'a': 2, 'b': 3, 'c': 1})# 交集操作
print(c1 & c2)  # 輸出: Counter({'b': 1})

4. `Counter`的8個應用案例

案例1：統計詞頻

# 統計一段文本的詞頻
text = "Python is great. Python is easy. Python is powerful."
words = text.split()
word_count = Counter(words)
print(word_count)  # 輸出: Counter({'Python': 3, 'is': 3, 'great.': 1, 'easy.': 1, 'powerful.': 1})

案例2：統計字符頻率

# 統計字符串中字符的頻率
s = "abracadabra"
char_count = Counter(s)
print(char_count)  # 輸出: Counter({'a': 5, 'b': 2, 'r': 2, 'c': 1, 'd': 1})

案例3：找出最常見的元素

# 找出列表中最常見的元素
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
c = Counter(data)
print(c.most_common(2))  # 輸出: [(4, 4), (3, 3)]

案例4：統計文件中的單詞頻率

# 統計文件中單詞的頻率
with open('example.txt', 'r') as file:words = file.read().split()word_count = Counter(words)print(word_count.most_common(5))  # 輸出文件中出現頻率最高的5個單詞

案例5：數據聚合

# 統計多個數據集的聚合結果
data1 = ['apple', 'banana', 'apple']
data2 = ['banana', 'orange', 'banana']
c1 = Counter(data1)
c2 = Counter(data2)
combined = c1 + c2
print(combined)  # 輸出: Counter({'banana': 3, 'apple': 2, 'orange': 1})

案例6：統計投票結果

# 統計投票結果
votes = ['Alice', 'Bob', 'Alice', 'Charlie', 'Bob', 'Alice']
vote_count = Counter(votes)
print(vote_count.most_common(1))  # 輸出: [('Alice', 3)]

案例7：統計列表中元素的頻率

# 統計列表中元素的頻率
data = [1, 2, 2, 3, 3, 3, 4, 4, 4, 4]
c = Counter(data)
print(c)  # 輸出: Counter({4: 4, 3: 3, 2: 2, 1: 1})

案例8：統計多個計數器的交集

# 統計多個計數器的交集
c1 = Counter(['a', 'b', 'a'])
c2 = Counter(['b', 'c', 'b'])
print(c1 & c2)  # 輸出: Counter({'b': 1})

總結

Counter是Python中一個非常實用的工具，能夠快速統計元素的出現次數，并支持豐富的操作。通過本文的詳細講解和8個實際案例，讀者可以快速掌握Counter的使用方法，并在實際項目中靈活應用。無論是詞頻統計、數據聚合，還是投票分析，Counter都能輕松應對！

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/73505.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/73505.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/73505.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！