python pandas 정리1_Series
1.Series함수
value_counts: NaN을 제외하고 각 값들의 빈도를 반환
a= np.array([2,1,3,3,4,4,np.NaN])
a.mean()
nan
b=pd.Series(a)
b.mean()
2.8333333333333335
b.size
7
b.count()
6 #NaN은 포함되지 않음
b.shape
(7,)
b.unique()
array([ 2., 1., 3., 4., nan])
b.value_counts()
4.0 2
3.0 2
1.0 1
2.0 1
dtype: int64
b[[1,3,5]] #2개 이상 전달할 때는 리스트로 전달해야 함
1 1.0
3 3.0
5 4.0
2.(Series).drop()
j = pd.Series(np.arange(105, 110), ['a', 'b', 'c', 'd', 'e'])
j
a 105
b 106
c 107
d 108
e 109
j.drop('e', inplace=True)
j
a 105
b 106
c 107
d 108
dtype: int32
3. Series indexing
j = pd.Series(np.arange(105, 110), ['a', 'b', 'c', 'd', 'e'])
j['a'] #문자로된 인덱스로 값을 주출
105
j[['a','b']]=[300,400]
j
a 300
b 400
c 107
d 108
e 109
j[1:3] # 문자로된 인덱싱이라도 인데스의 순서로 인덱싱을 할 수 있음
b 400
c 107
dtype: int32
j['c':'d'] #문자 인덱싱을 slicing하면 마지막 문자 index값도 포함됨
c 107
d 108
dtype: int32
Leave a comment