Out[60]:
sourcetargetweightcolorweight_sign
0023redM
1124blueL
2235blueXL
In [48]:
Out[48]:
sourcetargetweightcolor_bluecolor_redweight_sign_Lweight_sign_Mweight_sign_XL
002301010
112410100
223510001







regimentcompanynamepreTestScorepostTestScore
0Nighthawks1stMiller425
1Nighthawks1stJacobson2494
2Nighthawks2ndAli3157
3Nighthawks2ndMilner262
4Dragoons1stCooze370
5Dragoons1stJacon425
6Dragoons2ndRyaner2494
7Dragoons2ndSone3157
8Scouts1stSloan262
9Scouts1stPiger370
10Scouts2ndRiani262
11Scouts2ndAli370
In [76]:
Out[76]:
0       Low
1     Great
2      Good
3      Good
4      Good
5       Low
6     Great
7      Good
8      Good
9      Good
10     Good
11     Good
Name: postTestScore, dtype: category
Categories (4, object): [Low < Okay < Good < Great]

























'C Lang > machine learing' 카테고리의 다른 글

6-7, Titanic disaster  (0) 2019.03.24
6-8. feature scaling  (0) 2019.03.24
6-5,6-6. data cleaning, missing data issue(dropna, fillna)  (0) 2019.03.23
6-4. matplotlib with pandas  (0) 2019.03.23
6-3. graph(scatter, barchart, histogram..)  (0) 2019.03.23








*만약 남성평균이 적용되어하는 데이터와 여성평균이 적용되어야 하는 데이터가 구분된다면

df.groupby("sex")["postTestScore"].transform("mean")과 같은 명령어를 사용할 수 있다.

df.groupby("sex")["postTestScore"] : 전체 데이터를 성별로 나누어 postTestScore를 표시한다.












*historam은 그래프의 타입이름에서 나타내듯 데이터의 history를 나타낸다. 따라서, 연도별 추이 데이터를 나타내거나 할때 좋다

























*pyplot객체 사용시 기본  figure에 의해 그래프가 그려지는데, figure을 입맛에 맞게 생성할 수도 있다.




























위의 크로스탭은 groupby로도 만들 수 있어.





+ Recent posts