일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- html
- 자료구조
- CES 2O21 참여
- broscoding
- bccard
- pycharm
- tensorflow
- cudnn
- vscode
- web 개발
- inorder
- classification
- web 용어
- postorder
- KNeighborsClassifier
- C언어
- discrete_scatter
- 대이터
- CES 2O21 참가
- Keras
- 재귀함수
- mglearn
- web 사진
- java역사
- 결합전문기관
- web
- paragraph
- 웹 용어
- 데이터전문기관
- 머신러닝
- Today
- Total
목록전체 글 (689)
bro's coding

p=pd.pivot_table(data,values='승차총승객수',index='사용일자',columns='노선명', aggfunc= np.mean).reset_index() wday={0:'월',1:'화',2:'수',3:'목',4:'금',5:'토',6:'일'} p.insert(1,'요일',pd.to_datetime(p.사용일자,format='%Y%m%d').dt.dayofweek.map(wday)) p

correlation(상관 분석) data3.corr() covariance(공분산) data3.cov()

data.iloc[:10,[0,3]] data3=data2[['승차총승객수','하차총승객수']] data3[:3] data3.apply(lambda ser: ser.max()-ser.min()) data3.apply(lambda ser: pd.Series([ser.max(),ser.min(),ser.mean(),ser.std()])) data3.apply(lambda ser: pd.Series([ser.max(),ser.min(),ser.mean(),ser.std()], index=['max','min','mean','std'])) data3.applymap(lambda x: x//10000) # = data3//10000 #applymap : 항목 마다 data3.applymap(lambda x: x..

data2=data data2['year']=data2.사용일자/10000 data2['month']=(data2.사용일자%10000)//100 data2['day']=data2.사용일자%100 theday=pd.to_datetime(data2.사용일자,format='%Y%m%d') #교재 426 (format) ser=pd.Series(['2020-4-1','2020-4-2']) ser=pd.to_datetime(ser) ser.dt.year data2['year']=theday.dt.year data2['month']=theday.dt.month data2['day']=theday.dt.day wday={0:'월',1:'화',2:'수',3:'목',4:'금',5:'토',6:'일'} data2['wday..

import numpy as np import pandas as pd import matplotlib.pyplot as plt data =pd.read_csv('CARD_SUBWAY_MONTH_201905.txt') data.head(20) data.tail() data.info() data.describe() data.index data.columns data['사용일자'] data.사용일자 # 같은 표현 data2=data[['승차총승객수','하차총승객수']] data2 data2.values # pandas ->numpy data[data.승차총승객수
pandas 개념 - pandas 는 dict를 학장한 갠념이다 - 2차원 테이블 형태를 주로 다룬다 - 주로 칼럼 위주로 처리가 일어난다 - pansdas 데이터에는 항상 칼럼명과 인덱스가 붙는다 - 데이터 타입 종류 > pd.DataFrame > pd.Deries

plt.plot(range(5),range(10,20,2)) import numpy as np import matplotlib.pyplot as plt plt.plot(range(5),range(10,20,2)) plt.axis('equal')