国产xxxx99真实实拍_久久不雅视频_高清韩国a级特黄毛片_嗯老师别我我受不了了小说

資訊專欄INFORMATION COLUMN

【python cookbook】找出序列中出現次數最多的元素

AZmake / 2342人閱讀

摘要:問題中有這么一個問題,給定一個序列,找出該序列出現次數最多的元素。例如統計出中出現次數最多的元素初步探討模塊的類首先想到的是模塊的類,具體用法看這里具體用法看這里具體用法看這里,重要的事情強調三遍。

問題

《Python Cookbook》中有這么一個問題,給定一個序列,找出該序列出現次數最多的元素。
例如:

words = [
   "look", "into", "my", "eyes", "look", "into", "my", "eyes",
   "the", "eyes", "the", "eyes", "the", "eyes", "not", "around", "the",
   "eyes", "don"t", "look", "around", "the", "eyes", "look", "into",
   "my", "eyes", "you"re", "under"
]

統計出words中出現次數最多的元素?

初步探討

1、collections模塊的Counter類
首先想到的是collections模塊的Counter類,具體用法看這里!具體用法看這里!具體用法看這里!https://docs.python.org/3.6/l...,重要的事情強調三遍。

from collections import Counter

words = [
   "look", "into", "my", "eyes", "look", "into", "my", "eyes",
   "the", "eyes", "the", "eyes", "the", "eyes", "not", "around", "the",
   "eyes", "don"t", "look", "around", "the", "eyes", "look", "into",
   "my", "eyes", "you"re", "under"
]

counter_words = Counter(words)
print(counter_words)
most_counter = counter_words.most_common(1)
print(most_counter)

關于most_common([n]):

2、根據dict鍵值唯一性和sorted()函數

import operator

words = [
    "look", "into", "my", "eyes", "look", "into", "my", "eyes",
    "the", "eyes", "the", "eyes", "the", "eyes", "not", "around", "the",
    "eyes", "don"t", "look", "around", "the", "eyes", "look", "into",
    "my", "eyes", "you"re", "under"
]

dict_num = {}
for item in words:
    if item not in dict_num.keys():
        dict_num[item] = words.count(item)
        
# print(dict_num)

most_counter = sorted(dict_num.items(),key=lambda x: x[1],reverse=True)[0]  
print(most_counter)    

sorted函數:
傳送門:https://docs.python.org/3.6/l...

iterable:可迭代類型;
key:用列表元素的某個屬性或函數進行作為關鍵字,有默認值,迭代集合中的一項;
reverse:排序規則. reverse = True 降序 或者 reverse = False 升序,有默認值。
返回值:是一個經過排序的可迭代類型,與iterable一樣。

這里,我們使用匿名函數key=lambda x: x[1]
等同于:

def key(x):
    return x[1]

這里,我們利用每個元素出現的次數進行降序排序,得到的結果的第一項就是出現元素最多的項。

更進一步

這里給出的序列很簡單,元素的數目很少,但是有時候,我們的列表中可能存在上百萬上千萬個元素,那么在這種情況下,不同的解決方案是不是效率就會有很大差別了呢?
為了驗證這個問題,我們來生成一個隨機數列表,元素個數為一百萬個。
這里使用numpy Package,使用前,我們需要安裝該包,numpy包下載地址:https://pypi.python.org/pypi/...。這里我們環境是centos7,選擇numpy-1.14.2.zip (md5, pgp)進行下載安裝,解壓后python setup.py install

def generate_data(num=1000000):
    return np.random.randint(num / 10, size=num)

np.random.randint(low[, high, size]) 返回隨機的整數,位于半開區間 [low, high)
具體用法參考https://pypi.python.org/pypi

OK,數據生成了,讓我們來測試一下兩個方法所消耗的時間,統計時間,我們用time函數就可以。

#!/usr/bin/python
# coding=utf-8
#
# File: most_elements.py
# Author: ralap
# Data: 2018-4-5
# Description: find most elements in list
#

from collections import Counter
import operator
import numpy as np
import random
import time


def generate_data(num=1000000):
    return np.random.randint(num / 10, size=num)


def collect(test_list):
    counter_words = Counter(test_list)
    print(counter_words)
    most_counter = counter_words.most_common(1)
    print(most_counter)


def list_to_dict(test_list):
    dict_num = {}
    for item in test_list:
        if item not in dict_num.keys():
            dict_num[item] = test_list.count(item)

    most_counter = sorted(dict_num.items(), key=lambda x: x[1], reverse=True)[0]
    print(most_counter)

if __name__ == "__main__":
    list_value = list(generate_data())

    t1 = time.time()
    collect(list_value)
    t2 = time.time()
    print("collect took: %sms" % (t2 - t1))

    t1 = t2
    list_to_dict(list_value)
    t2 = time.time()
    print("list_to_dict took: %sms" % (t2 - t1))

以下結果是我在自己本地電腦運行結果,主要是對比兩個方法相對消耗時間。

當數據比較大時,消耗時間差異竟然如此之大!下一步會進一步研究Counter的實現方式,看看究竟是什么魔法讓他性能如此好。

參考資料

https://blog.csdn.net/xie_072...

文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。

轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/41511.html

相關文章

  • Python3 CookBook | 數據結構和算法(二)

    摘要:以下測試代碼全部基于查找最大或最小的個元素工作中有時會遇到這樣的需求,取出數據中前面的值,或者最后的值。大家如果對堆數據結構感興趣的話,可以繼續進行深入研究,由于我了解的并不深,也沒辦法再展開了。 文章首發于知乎專欄,歡迎關注。https://zhuanlan.zhihu.com/py... 以下測試代碼全部基于 Python3 1、查找最大或最小的 N 個元素 工作中有時會遇到這樣的...

    geekidentity 評論0 收藏0
  • Python每日一練0009

    摘要:問題怎樣找出一個序列中出現次數最多的元素解決方案使用庫中的對象可以方便的求出現次數最多的前個元素直接使用成員函數就好了,例如輸出討論對象是的子類,事實上內部存儲也是按照字典存儲的,這里的就是次數,所以對象支持對象的所有操作每一個對象初始化 問題 怎樣找出一個序列中出現次數最多的元素? 解決方案 使用collections庫中的Counter對象可以方便的求出現次數最多的前N個元素 直接...

    yiliang 評論0 收藏0
  • Python實用技法第11篇:找出序列出現次數多的元素

    摘要:上一篇文章實用技法第篇對切片命名下一篇文章實用技法第篇通過公共鍵對字典列表排序需求 上一篇文章:Python實用技法第10篇:對切片命名下一篇文章:Python實用技法第12篇:通過公共鍵對字典列表排序:itemgetter 1、需求

    superw 評論0 收藏0
  • C語言——一維數組算法問題

    摘要:算法描述向數組中輸入元素定義一個新數組將數組中的元素倒序存放將數組正序輸出,注意結尾無空格的格式問題。最后打印出來數組中的元素,也就是非共有值,此處注意格式問題。 問題1:將數組中的數逆序存放 本題要求編寫程序,將給定的n個整數存入數組中,將數組中的這n個數逆序存放, 再按順序輸出數組中的元...

    lifesimple 評論0 收藏0
  • Python實用技法第10篇:對切片命名

    摘要:上一篇文章實用技法第篇從序列中移除重復項且保持元素間順序不變下一篇文章實用技法第篇找出序列中出現次數最多的元素需求 上一篇文章:Python實用技法第9篇:從序列中移除重復項且保持元素間順序不變下一篇文章:Python實用技法第11篇:找出序列中出現次數最多的元素 1、需求

    kohoh_ 評論0 收藏0

發表評論

0條評論

最新活動
閱讀需要支付1元查看
<