设为首页 加入收藏

TOP

Python连续数据离散化处理和pandas.cut函数用法
2019-05-23 14:36:55 】 浏览:64
Tags:Python 连续 数据 离散 处理 pandas.cut 函数 用法

连续数据离散化场景:


数据分析和统计的预处理阶段,经常的会碰到年龄、消费等连续型数值,我们希望将数值进行离散化分段统计,提高数据区分度,那么下面介绍一个简单使用的pandas中的 cut() 方法


函数用法:
**cut(series, bins, right=True, labels=NULL)**


series  (类似数组排列,必须是一维的)
bins  (表示分段数或分类区间,可以是数字,比如说4,就是分成4段,也可以是列表,表示各段的间隔点)
right=True(表示分组右边闭合,right=False表示分组左边闭合,)
labels(表示结果标签,一般最好添加,方便阅读和后续统计)
另外,请注意:
如果  cut_1 = pd.cut ()
cut_1.codes: 获得分组的codes码,即0,1,2,3,4…
pd.value_counts(cut_1):  返回分段计数的结果


如下成绩代码:


】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Python中使用 logging 和 traceba.. 下一篇Python+OpenCV为图片添加中文水印..

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目