Pandas統計特征函數


Python中用於數據探索的庫主要是Pandas和Matplotlib,Pandas提供了大量與數據探索相關的函數。這些統計特征函數能反映出數據的整體分布,主要作為Pandas的對象DataFrame或Series的方法出現。
sum():計算數據樣本的總和(按列計算)
mean():計算數據樣本的算術平均數
var():計算數據樣本的方差
std():計算數據樣本的標准差
corr():計算數據樣本的Spearman(Pearson)相關系數矩陣

ser.corr(method='pearson') 

method參數為計算方法,支持pearson-默認選項、kendall以及spearman

s1.corr(s2, method='pearson')

s1,s2均為Series,指定計算兩個Series之間的相關系數
cov():計算數據樣本的協方差矩陣
從直觀上來看,協方差表示的是兩個變量總體誤差的期望。
如果兩個變量的變化趨勢一致,也就是說如果其中一個大於自身的期望值時另外一個也大於自身的期望值,那么兩個變量之間的協方差就是正值;如果兩個變量的變化趨勢相反,即其中一個變量大於自身的期望值時另外一個卻小於自身的期望值,那么兩個變量之間的協方差就是負值。

frame.cov()

frame為DataFram,返回協方差矩陣。

s1.cov(s2)

s1,s2均為Series,指定計算兩個Series之間的協方差
skew():樣本值的偏度(三階矩)
kurt():樣本值的峰度(四階矩)
describe():給出樣本的基本描述(基本統計量如均值、標准差等)


注意!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系我们删除。



 
粤ICP备14056181号  © 2014-2021 ITdaan.com