% 1.750000 12.0
50% 2.500000 12.0
75% 3.500000 12.0
max 5.000000 12.0
其中就对可计算的列进行计数、求平均值、方差、最小值、最大值等。
pandas转置
相当于把电子表格中的行和列翻转一下。
import pandas as pd
import numpy as np
data = pd.DataFrame({
"A": np.array([1, 2, 3, 5]),
"B": ["test", "train", "go", "java"],
"C": "dog",
"D": 12
})
print(data.T)
输出:
0 1 2 3
A 1 2 3 5
B test train go java
C dog dog dog dog
D 12 12 12 12
这样索引项就变成了原先数据集中的列名。
排序
sort_index()可以按照索引项进行排序。
import pandas as pd
import numpy as np
data = pd.DataFrame({
"A": np.array([1, 2, 3, 5]),
"B": ["test", "train", "go", "java"],
"C": "dog",
"D": 12
})
# 按照索引项进行倒排
print("按照索引项进行倒排:")
print(data.sort_index(ascending=False))
# 对列名进行倒排
print("对列名进行倒排:")
print(data.sort_index(axis=1, ascending=False))
输出:
按照索引项进行倒排:
A B C D
3 5 java dog 12
2 3 go dog 12
1 2 train dog 12
0 1 test dog 12
对列名进行倒排:
D C B A
0 12 dog test 1
1 12 dog train 2
2 12 dog go 3
3 12 dog java 5
排序中的数据会跟着列或索引项进行调换顺序,因此数据不会错乱。
按照值排序
使用sort_values()函数对值进行排序,其中可以指定按照哪一列的数据进行排序的:
import pandas as pd
import numpy as np
data = pd.DataFrame({
"A": np.array([1, 2, 3, 5]),
"B": ["test", "train", "go", "java"],
"C": "dog",
"D": 12
})
print(data.sort_values(by='B'))
输出:
A B C D
2 3 go dog 12
3 5 java dog 12
0 1 test dog 12
1 2 train dog 12
|