设为首页 加入收藏

TOP

利用Python进行数据分析_Pandas_处理缺失数据
2018-12-18 10:10:13 】 浏览:47
Tags:利用 Python 进行 数据分析 _Pandas_ 处理 缺失 数据

申明:本系列文章是自己在学习《利用Python进行数据分析》这本书的过程中,为了方便后期自己巩固知识而整理。

 1 读取excel数据

import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df

2 检测缺失值

2.1 isnull返回一个含有布尔值的对象

import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df = df.isnull()
df

2.2 notnull  是isnull 的否定式

import pandas as pd
import numpy as np
file = 'D:\example.xls'
df = pd.DataFrame(pd.read_excel(file))
df = df.notnull()
df

3 滤除缺失数据

3.1 滤除所有包含缺失值的行

df.dropna()

3.2 查看不含缺失值的所有行、列

df.dropna(thresh=4)

4 填充缺失数据

DataFrame.fillna(value=None, method=None, axis=None, inplace=False, limit=None, downcast=None, **kwargs)

4.1 统一填充某一个值value

df.fillna(0)或df.fillna(value=0)

4.2 用前面的值填充缺失部分

df.fillna(method='ffill')

4.3 用后面的值填充缺失部分

df.fillna(method='bfill')

4.3 某N列用特定的值填充缺失部分

df.fillna({'起息日':'2018-12-11','评级得分':'100'})

4.4 指定一整个轴的值填充缺失部分

df.fillna(method='ffill',axis=1)

】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
上一篇Python爬虫入门教程 6-100 蜂鸟网.. 下一篇Pyhton集合数据结构

最新文章

热门文章

Hot 文章

Python

C 语言

C++基础

大数据基础

linux编程基础

C/C++面试题目