Java统计各个单词的个数并排序

2014-11-24 07:56:14 · 作者: · 浏览: 0
这个比较简单,我用来练练手,觉得好玩,便把代码贴出来,比如说我们统计"hello,my name is Tom,what is your name he said:\"my name is John\"";这句英语中单词的总数和各个单词的数量并排序输出,运行结果如下:
总共单词数:15
is:3
name:3
my:2
hello:1
said:1
what:1
Tom:1
your:1
John:1
he:1

直接上代码:

[plain]
import java.util.ArrayList;
import java.util.Collections;
import java.util.Comparator;
import java.util.HashMap;
import java.util.List;
import java.util.Map;
import java.util.StringTokenizer;
import java.util.Map.Entry;



public class wordCount {
public static void main(String arg[]){
int wordCount=0; //用于统计单词的总个数
Map map=new HashMap();//用于统计各个单词的个数,排序
String sentence="hello,my name is Tom,what is your name he said:\"my name is John\"";
StringTokenizer token=new StringTokenizer(sentence);//这个类会将字符串分解成一个个的标记
while(token.hasMoreTokens()){ //循环遍历
wordCount++;
String word=token.nextToken(", .!:\"\"''\n"); //括号里的字符的含义是说按照,空格 . : "" '' \n去分割,如果这里你没明确要求,即括号里为空,则默认按照空格,制表符,新行符和回车符去分割
if(map.containsKey(word)){ //HashMap不允许重复的key,所以利用这个特性,去统计单词的个数
int count=map.get(word);
map.put(word, count+1); //如果HashMap已有这个单词,则设置它的数量加1
}
else
map.put(word, 1); //如果没有这个单词,则新填入,数量为1
}
System.out.println("总共单词数:"+wordCount);
sort(map); //调用排序的方法,排序并输出!
}
public static void sort(Map map){
List> infoIds = new ArrayList>(map.entrySet());
Collections.sort(infoIds, new Comparator>() {
public int compare(Map.Entry o1, Map.Entry o2) {
return (o2.getValue() - o1.getValue());
}
}); //排序
for (int i = 0; i < infoIds.size(); i++) { //输出
Entry id = infoIds.get(i);
System.out.println(id.getKey()+":"+id.getValue());
}
}
}



摘自 Bad Boy