[IT]/python.pandas

pandas.데이터 다루기

givemebro 2020. 4. 6. 10:45
반응형
data.iloc[:10,[0,3]]​
data3=data2[['승차총승객수','하차총승객수']]
data3[:3]

data3.apply(lambda ser: ser.max()-ser.min())

data3.apply(lambda ser: pd.Series([ser.max(),ser.min(),ser.mean(),ser.std()]))

data3.apply(lambda ser: pd.Series([ser.max(),ser.min(),ser.mean(),ser.std()],
index=['max','min','mean','std']))

data3.applymap(lambda x: x//10000)
# = data3//10000
#applymap : 항목 마다

data3.applymap(lambda x: x//10000+np.random.randb())
# != 

data3.applymap//10000+np.random.randn()

# 위에는 각 항목마다 새로운 랜덤수가 출력
# 아래는 하나의 랜덤 수를 사용

Series.apply()
Series.map()
DataFrame.apple()  for each column 
DataFrame.applymap() for each value

s=pd.Series([1,0,2,4,6,3])
s.map({0:'월',1:'화',2:'수',3:'목',4:'금',5:'토',6:'일'})

data.sort_values('승차총승객수',ascending=False)

반응형