摘要:序本文主要講述一下如何使用的以及的的數(shù)據(jù)結構來統(tǒng)計單詞次數(shù)。小結經(jīng)過封裝后的數(shù)據(jù)結構,用起來非常簡潔。
序
本文主要講述一下如何使用apache collections4的bag以及guava的multiset的數(shù)據(jù)結構來統(tǒng)計單詞次數(shù)。
mavenbagcom.google.guava guava 22.0 org.apache.commons commons-collections4 4.1
@Test public void testBag(){ Bagmultisetbag = new HashBag<>(); String content = "She is beautiful and she is my angel"; Arrays.stream(content.split(" ")).forEach(word -> { bag.add(word);bag.add(word); }); //get unique key Set set = bag.uniqueSet(); set.stream().forEach(word -> { System.out.println(word + "-->" + bag.getCount(word)); }); }
@Test public void testMultiSet(){ String content = "She is beautiful and she is my angel"; Multiset小結set = HashMultiset.create(); Arrays.stream(content.split(" ")).forEach(word -> { set.add(word); }); set.stream().distinct().forEach(e -> { System.out.println(e + "-->" + set.count(e)); }); }
經(jīng)過封裝后的數(shù)據(jù)結構,用起來非常簡潔。
文章版權歸作者所有,未經(jīng)允許請勿轉(zhuǎn)載,若此文章存在違規(guī)行為,您可以聯(lián)系管理員刪除。
轉(zhuǎn)載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/67519.html
摘要:接著我們將數(shù)據(jù)流按照單詞字段即號索引字段做分組,這里可以簡單地使用方法,得到一個以單詞為的數(shù)據(jù)流。得到的結果數(shù)據(jù)流,將每秒輸出一次這秒內(nèi)每個單詞出現(xiàn)的次數(shù)。最后一件事就是將數(shù)據(jù)流打印到控制臺,并開始執(zhí)行最后的調(diào)用是啟動實際作業(yè)所必需的。 本文轉(zhuǎn)載自 Jark’s Blog ,作者伍翀(云邪),Apache Flink Committer,阿里巴巴高級開發(fā)工程師。 本文將從開發(fā)環(huán)境準備、創(chuàng)建 ...
閱讀 931·2023-04-26 01:34
閱讀 3365·2023-04-25 20:58
閱讀 3296·2021-11-08 13:22
閱讀 2120·2019-08-30 14:17
閱讀 2527·2019-08-29 15:27
閱讀 2680·2019-08-29 12:45
閱讀 3006·2019-08-29 12:26
閱讀 2818·2019-08-28 17:51