博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
中文词频统计
阅读量:4650 次
发布时间:2019-06-09

本文共 472 字,大约阅读时间需要 1 分钟。

import jiebaa=open('C:/1.txt','r',encoding='utf-8').read()for i in '\n,.\()。,123"?':    a=a.replace(i,' ')b=jieba.cut(a)d=list(b)exc={' ','和','你','使','都','所','又','一个','啊', '也是', '的','了','(','…','阿','廖沙','也','是','对','就','“','”','地','他','她'}dict={}key=set(d)key=key-excprint(key)for i in key:        dict[i]=d.count(i)st=list(dict.items())st.sort(key=lambda x:x[1],reverse=True)print(st)for i in range(20):    print(st[i])

转载于:https://www.cnblogs.com/cch-1007/p/7612461.html

你可能感兴趣的文章
[LeetCode]Power
查看>>
ARM处理器详解(2)-Cortex R系列
查看>>
单KEY业务,数据库水平切分架构实践
查看>>
绩效考核如何快速评分
查看>>
ssm项目启动,加载数据库连接池时卡住
查看>>
CGRect包含交错,边缘,中心的检测
查看>>
respondsToSelector的相关使用
查看>>
zabbix 自定义监控项 获取nginx监控状态
查看>>
python 并发编程 多线程 目录
查看>>
C main()参数
查看>>
javaTemplates-学习笔记四
查看>>
jQuery 时间获取扩展
查看>>
Windows Phone开发(28):隔离存储B 转:http://blog.csdn.net/tcjiaan/article/details/7436959...
查看>>
WP7中对ListBox的ItemTemplate中子元素的后台操作
查看>>
调查研究
查看>>
CMOS Sensor的调试经验分享(转)
查看>>
看的论文列表
查看>>
Linux下捕捉信号
查看>>
开发人员如何有效的进行数据库设计
查看>>
VS2017设置背景主题
查看>>