일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- tensorflow
- 대이터
- cudnn
- KNeighborsClassifier
- 데이터전문기관
- CES 2O21 참여
- Keras
- discrete_scatter
- web 사진
- vscode
- web 용어
- pycharm
- java역사
- inorder
- mglearn
- classification
- broscoding
- web
- web 개발
- CES 2O21 참가
- html
- C언어
- paragraph
- bccard
- 결합전문기관
- 머신러닝
- postorder
- 재귀함수
- 자료구조
- 웹 용어
- Today
- Total
목록[IT]/python.pandas (22)
bro's coding
import pandas as pd 'data=pd.read_csv('CARD_SUBWAY_MONTH_201905.csv') # 역명 별 승차총승객수의 합을 오름차순으로 정렬 ser=data.groupby('역명').승차총승객수.sum().sort_values() ser.head()
#data_time을 이용해 요일 알아내기 data2.일자.dt.dayofweek data2['년']=data2.일자.dt.year data2['월']=data2.일자.dt.month data2['일']=data2.일자.dt.day data2['wday']=data2.일자.dt.weekday data2['wname']=data2.일자.dt.weekday_name # 0 : 월요일 data2.head() data2['요일']=data2.일자.dt.weekday.map({0:'월',1:'화',2:'수',3:'목',4:'금',5:'토',6:'일'}) data2.head()
import pandas as pd data=pd.read_csv('CARD_SUBWAY_MONTH_201905.csv') data data.pivot_table(values='승차총승객수',index='사용일자',columns='노선명',aggfunc='sum') # [사용일자:노선명] 에 따른 승차총승객수(sum)
data=pd.read_csv('CARD_SUBWAY_MONTH_201905.csv') data
# 꽃 이름에 따른 dictionary를 생성 label={i:iris.target_names[i] for i in range(3)} label # {0: 'setosa', 1: 'versicolor', 2: 'virginica'} # target number에 따라 꽃 이름을 mapping pd.Series(iris.target).map(label) 0 setosa 1 setosa 2 setosa 3 setosa 4 setosa 5 setosa 6 setosa 7 setosa 8 setosa 9 setosa 10 setosa 11 setosa 12 setosa 13 setosa 14 setosa 15 setosa 16 setosa 17 setosa 18 setosa 19 setosa 20 setosa ..
# target을 one-hot-incoding한다 import numpy as np import pandas as pd from sklearn.datasets import load_iris iris=load_iris() data=np.c_[iris.data,pd.get_dummies(iris.target).values] data array([[5.1, 3.5, 1.4, ..., 1. , 0. , 0. ], [4.9, 3. , 1.4, ..., 1. , 0. , 0. ], [4.7, 3.2, 1.3, ..., 1. , 0. , 0. ], ..., [6.5, 3. , 5.2, ..., 0. , 0. , 1. ], [6.2, 3.4, 5.4, ..., 0. , 0. , 1. ], [5.9, 3. , 5.1,..
s3=data.groupby(['노선명','wday'])['승차총승객수','하차총승객수'].sum() s3 s3=data.groupby(['노선명','wday'])['승차총승객수','하차총승객수'].sum().unstack() s3
#역별 승차총승객수의 평균 s=data.groupby('역ID')['승차총승객수'].mean() # s= data.groupby('역ID).승차총승객수.mean() # (**)별로 묶고, .**로 보고싶은 것을 선택한다. s s1=data.groupby('역명').mean() s1 s1=data.groupby('역명').승차총승객수.mean() s1 s1=data.groupby('역명').승차총승객수.mean().sort_values(ascending=False) s1
data10=data[['역ID','역명','노선명']].drop_duplicates() #drop_duplicates() : 위 세가지 모두 중복되는 것을 제거해준다 역ID역명노선명01234567891011121314151617181920212223242526272829...5675685695705715725735745755765775785795805815825835845855865875885895905915929249259266417 1955 마두 일산선 1954 백석 일산선 1953 대곡 일산선 1952 화정 일산선 1951 원당 일산선 1950 삼송 일산선 1948 원흥 일산선 4713 신설동 우이신설선 4712 보문 우이신설선 4711 성신여대입구(돈암) 우이신설선 4710 정릉 우이신설선 47..