일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
- 결합전문기관
- discrete_scatter
- 머신러닝
- broscoding
- tensorflow
- postorder
- 자료구조
- java역사
- vscode
- Keras
- 재귀함수
- bccard
- web 용어
- cudnn
- C언어
- web 개발
- html
- inorder
- 데이터전문기관
- web 사진
- pycharm
- 웹 용어
- CES 2O21 참가
- classification
- CES 2O21 참여
- web
- 대이터
- mglearn
- paragraph
- KNeighborsClassifier
- Today
- Total
목록[IT] (431)
bro's coding

data=pd.read_csv('CARD_SUBWAY_MONTH_201905.csv') data
# 꽃 이름에 따른 dictionary를 생성 label={i:iris.target_names[i] for i in range(3)} label # {0: 'setosa', 1: 'versicolor', 2: 'virginica'} # target number에 따라 꽃 이름을 mapping pd.Series(iris.target).map(label) 0 setosa 1 setosa 2 setosa 3 setosa 4 setosa 5 setosa 6 setosa 7 setosa 8 setosa 9 setosa 10 setosa 11 setosa 12 setosa 13 setosa 14 setosa 15 setosa 16 setosa 17 setosa 18 setosa 19 setosa 20 setosa ..
# target을 one-hot-incoding한다 import numpy as np import pandas as pd from sklearn.datasets import load_iris iris=load_iris() data=np.c_[iris.data,pd.get_dummies(iris.target).values] data array([[5.1, 3.5, 1.4, ..., 1. , 0. , 0. ], [4.9, 3. , 1.4, ..., 1. , 0. , 0. ], [4.7, 3.2, 1.3, ..., 1. , 0. , 0. ], ..., [6.5, 3. , 5.2, ..., 0. , 0. , 1. ], [6.2, 3.4, 5.4, ..., 0. , 0. , 1. ], [5.9, 3. , 5.1,..
y=mnist.target.copy() y=np.where(y==9,1,0) ''' if(y==9): y=1 else: y=0 '''

dist_table=np.array([[(((data[i]-data[j])**2).sum())**0.5 for j in range(150)]for i in range(150)]) array([[0. , 0.53851648, 0.50990195, ..., 4.45982062, 4.65080638, 4.14004831], [0.53851648, 0. , 0.3 , ..., 4.49888875, 4.71805044, 4.15331193], [0.50990195, 0.3 , 0. , ..., 4.66154481, 4.84871117, 4.29883705], ..., [4.45982062, 4.49888875, 4.66154481, ..., 0. , 0.6164414 , 0.64031242], [4.6508063..
(((data-data[0])**2).sum(axis=1))**0.5 array([0. , 0.53851648, 0.50990195, 0.64807407, 0.14142136, 0.6164414 , 0.51961524, 0.17320508, 0.92195445, 0.46904158, 0.37416574, 0.37416574, 0.59160798, 0.99498744, 0.88317609, 1.1045361 , 0.54772256, 0.1 , 0.74161985, 0.33166248, 0.43588989, 0.3 , 0.64807407, 0.46904158, 0.59160798, 0.54772256, 0.31622777, 0.14142136, 0.14142136, 0.53851648, 0.53851648,..

s3=data.groupby(['노선명','wday'])['승차총승객수','하차총승객수'].sum() s3 s3=data.groupby(['노선명','wday'])['승차총승객수','하차총승객수'].sum().unstack() s3

#역별 승차총승객수의 평균 s=data.groupby('역ID')['승차총승객수'].mean() # s= data.groupby('역ID).승차총승객수.mean() # (**)별로 묶고, .**로 보고싶은 것을 선택한다. s s1=data.groupby('역명').mean() s1 s1=data.groupby('역명').승차총승객수.mean() s1 s1=data.groupby('역명').승차총승객수.mean().sort_values(ascending=False) s1
data10=data[['역ID','역명','노선명']].drop_duplicates() #drop_duplicates() : 위 세가지 모두 중복되는 것을 제거해준다 역ID역명노선명01234567891011121314151617181920212223242526272829...5675685695705715725735745755765775785795805815825835845855865875885895905915929249259266417 1955 마두 일산선 1954 백석 일산선 1953 대곡 일산선 1952 화정 일산선 1951 원당 일산선 1950 삼송 일산선 1948 원흥 일산선 4713 신설동 우이신설선 4712 보문 우이신설선 4711 성신여대입구(돈암) 우이신설선 4710 정릉 우이신설선 47..