喫茶佐天

祈り2025

【忘備録】pandasのvar()

numpyでは標本分散

 

\displaystyle V(X)=\frac{1}{N} \sum_{i=1}^N\left(X_i-\mu\right)^2

 

だけど、pandasでは不偏分散

 

 \displaystyle V(X)=\frac{1}{ \color{red}{N-1}} \sum_{i=1}^N\left(X_i-\mu\right)^2

 

となる。標本分散にしたい場合は

 

df.var(ddof=0)

 

とすればよい。