'[IT]' 카테고리의 글 목록 (34 Page)

Notice

Recent Posts

Recent Comments

Link

« 2025/02 »
일	월	화	수	목	금	토
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28

Tags more

Archives

Today

Total

관리 메뉴

목록[IT] (431)

bro's coding

pandas.drop_duplicates.reset_index

data=pd.read_csv('CARD_SUBWAY_MONTH_201905.csv') data

[IT]/python.pandas 2020. 4. 24. 10:09

pandas.string2code

# 꽃 이름에 따른 dictionary를 생성 label={i:iris.target_names[i] for i in range(3)} label # {0: 'setosa', 1: 'versicolor', 2: 'virginica'} # target number에 따라 꽃 이름을 mapping pd.Series(iris.target).map(label) 0 setosa 1 setosa 2 setosa 3 setosa 4 setosa 5 setosa 6 setosa 7 setosa 8 setosa 9 setosa 10 setosa 11 setosa 12 setosa 13 setosa 14 setosa 15 setosa 16 setosa 17 setosa 18 setosa 19 setosa 20 setosa ..

[IT]/python.pandas 2020. 4. 24. 09:40

pandas.get_dummies.ont-hot-incoding

# target을 one-hot-incoding한다 import numpy as np import pandas as pd from sklearn.datasets import load_iris iris=load_iris() data=np.c_[iris.data,pd.get_dummies(iris.target).values] data array([[5.1, 3.5, 1.4, ..., 1. , 0. , 0. ], [4.9, 3. , 1.4, ..., 1. , 0. , 0. ], [4.7, 3.2, 1.3, ..., 1. , 0. , 0. ], ..., [6.5, 3. , 5.2, ..., 0. , 0. , 1. ], [6.2, 3.4, 5.4, ..., 0. , 0. , 1. ], [5.9, 3. , 5.1,..

[IT]/python.pandas 2020. 4. 24. 09:19

numpy.where.3단 논법

y=mnist.target.copy() y=np.where(y==9,1,0) ''' if(y==9): y=1 else: y=0 '''

[IT]/python.numpy 2020. 4. 23. 14:17

matplotlib.dist_table

dist_table=np.array([[(((data[i]-data[j])**2).sum())**0.5 for j in range(150)]for i in range(150)]) array([[0. , 0.53851648, 0.50990195, ..., 4.45982062, 4.65080638, 4.14004831], [0.53851648, 0. , 0.3 , ..., 4.49888875, 4.71805044, 4.15331193], [0.50990195, 0.3 , 0. , ..., 4.66154481, 4.84871117, 4.29883705], ..., [4.45982062, 4.49888875, 4.66154481, ..., 0. , 0.6164414 , 0.64031242], [4.6508063..

[IT]/python.matplotlib 2020. 4. 7. 14:30

machine learning.데이터 간의 거리(기준 [0])

(((data-data[0])**2).sum(axis=1))**0.5 array([0. , 0.53851648, 0.50990195, 0.64807407, 0.14142136, 0.6164414 , 0.51961524, 0.17320508, 0.92195445, 0.46904158, 0.37416574, 0.37416574, 0.59160798, 0.99498744, 0.88317609, 1.1045361 , 0.54772256, 0.1 , 0.74161985, 0.33166248, 0.43588989, 0.3 , 0.64807407, 0.46904158, 0.59160798, 0.54772256, 0.31622777, 0.14142136, 0.14142136, 0.53851648, 0.53851648,..

[IT]/python 2020. 4. 7. 12:42

machine learning.개발 순서

[IT]/python 2020. 4. 7. 09:45

pandas.unstack(벡터로 펼치기(인덱스 두개))

s3=data.groupby(['노선명','wday'])['승차총승객수','하차총승객수'].sum() s3 s3=data.groupby(['노선명','wday'])['승차총승객수','하차총승객수'].sum().unstack() s3

[IT]/python.pandas 2020. 4. 6. 20:24

pandas.groupby

#역별 승차총승객수의 평균 s=data.groupby('역ID')['승차총승객수'].mean() # s= data.groupby('역ID).승차총승객수.mean() # (**)별로 묶고, .**로 보고싶은 것을 선택한다. s s1=data.groupby('역명').mean() s1 s1=data.groupby('역명').승차총승객수.mean() s1 s1=data.groupby('역명').승차총승객수.mean().sort_values(ascending=False) s1

[IT]/python.pandas 2020. 4. 6. 14:41

pandas. 항목 추가

data10=data[['역ID','역명','노선명']].drop_duplicates() #drop_duplicates() : 위 세가지 모두 중복되는 것을 제거해준다 역ID역명노선명01234567891011121314151617181920212223242526272829...5675685695705715725735745755765775785795805815825835845855865875885895905915929249259266417 1955 마두 일산선 1954 백석 일산선 1953 대곡 일산선 1952 화정 일산선 1951 원당 일산선 1950 삼송 일산선 1948 원흥 일산선 4713 신설동 우이신설선 4712 보문 우이신설선 4711 성신여대입구(돈암) 우이신설선 4710 정릉 우이신설선 47..

[IT]/python.pandas 2020. 4. 6. 14:33

Prev 1 ··· 31 32 33 34 35 36 37 ··· 44 Next

목록[IT] (431)

bro's coding

티스토리툴바