본문 바로가기

전체 글139

[코드잇] 2. 데이터 분석과 시각화: 타이타닉 EDA 퀴즈 데이터 분석과 시각화 과정 중 EDA(탐색적 데이터 분석) 수업 마지막에는 "타이타닉 EDA 퀴즈"가 있다. titanic.csv 데이터를 탐색한 후, 보기 7개 중에서 맞는 것 고르는 퀴즈를 풀기 위해 답을 찾은 방법을 정리했다. 1) 타이타닉 승객은 30대와 40대가 가장 많다 (X) - 나이대별 히스토그램으로 시각화했다. - 기존 파일에는 "나이대" 컬럼이 존재하지 않아 'Age_cat' 컬럼을 만들어서 추가했다. #1. 20,30이 제일 많음 ==> X sns.distplot(df['Age_cat']) - 나이대 구분 컬럼인 'Age_cat' 만든 방법 #나이대 가져오는 함수 만들기 def age_cat(age): age = (age//10)*10 return age Age_cat = df.Age.. 2022. 7. 14.
[코드잇] 1. 데이터 프레임 다루기 코드잇 "데이터 사이언스 입문" 과정을 수강 중이다. 해당 코스 "2강 데이터 프레임 다루기"의 마지막 퀴즈 3개는 갑자기 높아진 난이도를 자랑한다. 😅 이틀에 걸쳐서 여러 가지 방법을 찾으면서 공부한 내용을 정리했다. 1. DataFrame 조건에 맞는 행의 값만 변경하기 1.1. 조건에 맞는 행의 특정 열의 값 변경하기 #너무 길면 헷갈리니까 조건은 미리 정의하기 condition = (df['course name'] == 'information technology') & (df['year']==1) #조건에 맞는 값만 변경하기 df.loc[condition,'status']= 'not allowed' #df.loc[조건, '열 이름'] = '바꿀 값' 1.2. 조건에 맞는 행의 모든 값 변경하기 #.. 2022. 7. 5.
⚽️ 축구하는 일기 4: 축태기 극복! ⚽️ 축태기를 극복했다! 6월 2주, 심각한 축태기를 겪었다. 내가 못해서 너무 화가 났다. 6월 3주, 주중에 두 번 따로 연습했고, 골을 넣었다! 6월 4주, 주중에 두 번 따로 연습했고, 골을 넣었다! 7월 1주, 주중에 한 번 따로 연습했고, 골을 넣었다! 6/13 일기를 보면 심각한 축태기를 겪었다. 6월 2주차에 축태기를 겪은 후, '이대로는 안 되겠다!'라고 생각했다. 내가 못하니까 게임이 재미가 없었다. 한 단계 점프할 때가 되었는데 뒤쳐지는 기분이었다. 그래서 주중에 혼자 연습을 열심히 하기로 했다. 개인 연습을 시작한 후로 3주 연속 연습 게임 때 골을 넣었다. 개인 연습이 효과가 있을까 했는데, 3주 연속은 확실한 결과다. 😂 (감격의 눈물) 개인 연습을 할 때 내 실력이 는다는 확실한 느.. 2022. 7. 5.
PM에게 필요한 창의성에 관한 말 창작자에게는 영감이 필요합니다. 저는 PM도 창작자라고 생각하는데요, 때문에 영감과 창의성에 관심이 많습니다. 다양한 분야에서 창의성에 관한 힌트를 얻고 있습니다. 오늘은 그중 광고 업계에서 유명한 박웅현 님의 말을 가져왔습니다. 좋은 생각을 하는 사람은 좋은 것을 만듭니다. 게다가 형식과 무관하죠. 영화, 디자인, 드라마, 소설, 광고, 그리고 서비스까지도 좋은 생각을 하는 사람의 손에서 아름답게 피어납니다. 좋은 생각의 원천인 "창의성"은 일상에서 쉽게 감동받는 사람에게 주어집니다. 자두를 보고 감동받는 사람이라면 좋은 작품을 만들 수 있어요. 새로운 것이 더 특별하다고 생각하는 인간의 본성에 거스르기란 쉽지 않은 일이에요. 그렇기에 사소함에 경이를 느끼는 사람들이 예술가가 된 거겠죠. 일상에서 감동.. 2022. 6. 26.
데이터 분석 - 대검찰청의 범죄자 전과 데이터 (2019) 전체 161개 범죄 중 범죄자수 합계 Top-15 범죄 대상으로 데이터 분석 흥미로운 사실 - 전과 9범 이상이 생각보다 굉장히 많음 - 전과 9범 이상 범죄자가 초범보다 많은 범죄는 "근로기준법"과 "신용업무경매" - 다만, 전과 9범 이상은 10범, 11범 등 다량의 범죄 이력이 있는 사람을 모두 합친 숫자라는 점을 고려해야 함 - 초범 비율이 가장 높은 범죄는 "성폭력", "전자금융거래법", "교통사고처리특례법" - 해당 범죄는 재범률이 낮지만, 범죄를 저지를만해 보이지 않는 일반인 같은(?) 사람도 저지를 수 있는 범죄라고도 해석할 수 있음 원본 데이터 1. 각 범죄 분류 별 범죄자수 합계 (barplot) 합계 열 'total'을 추가한 후에 해당 열의 값으로 그래프 그림 2. 히트맵 (seab.. 2022. 6. 13.
일태기와 축태기 오늘의 풋살은 그리 즐겁지가 않았다. 이유를 생각해보면 몇 가지가 있는데, 1. 컨디션이 별로 좋지 않았다. 2. 우리 팀이 큰 차이로 졌다. 3. 풋살 실력이 전에 비해 좋아지기는 커녕, 더 못해진 느낌이 들었다. 4. 부상으로 기존 멤버가 여럿 빠졌다. 지금 이제 풋살을 시작한 지 6개월 차이고, 완전 처음에 비하면 확실히 실력이 좋아졌다. 그런데 오늘 게임 후에는 정체기에 접어든 것 같았다. 패스가 연결되고 골을 넣을 수 있어야 재미있는데, 패스가 툭툭 끊기고 골까지 연결이 안 된다. 게다가 오늘 내가 골키퍼를 할 때 두 골이나 먹혔다. 사기도 떨어지고 할 맛이 안 났다. '사실 지금 못하는 게 당연한 건데'라는 이성적인 생각과 달리 감정은 착 가라앉아버렸다. 나는 이 감정을 일종의 권태기라고 정의.. 2022. 6. 13.
PM이 되려면 어떤 교육을 받아야 할까? 2022년 기준, PM이 되기 위해 받을 수 있는 교육 과정은 크게 두 가지가 있습니다. PM 부트캠프와 HCI 석사과정인데요, 아래 글에 이 두 교육 과정의 장단점과 저의 생각을 정리했습니다. PM으로 진로를 잡은 후, 무엇을 어디로 배우러 가야 할지 막막할 때 참고하길 추천합니다. 제가 현재 학생이 아니기 때문에 두 교육 과정에 대한 학생 분들의 의견과 괴리가 있을 수 있습니다. 제가 석사과정 중이었던 2017~2018년에 비해 교육 환경이 달라졌을 수도 있고요. 저의 짧은 식견을 보충하기 위한 의견이 있다면 댓글로 알려주세요. :) 글에 담기지 않은 내용을 하나 추가하고 마무리하겠습니다. 저는 원글에서 부트캠프보다 스타트업에서 경력을 먼저 쌓는 것을 추천했습니다. 그리고, "스타트업에 취업하기 위해.. 2022. 6. 10.
온 더 무브: 글쓰기를 사랑한 사람의 이야기 나는 올리버 색스 박사님을 "아내를 모자로 착각한 남자"로 알게 되었다. 그 책은 대학 시절 "이상행동의 심리"가 최애 교양 과목이었던 나의 취향을 저격했고, 지금까지 가장 재밌게 읽었던 책 중 하나로 꼽고 있다. (현재까지 테드 창의 "네 인생의 이야기"와 투 탑이다. 이상행동 심리와 뇌 질환과 관련해서 읽었던 책은 또 "나는 정신병에 걸린 뇌 과학자입니다", "나는 내가 죽었다고 생각했습니다", "나는 괜찮은데 그들은 내가 아프다고 한다"가 있다.) "온 더 무브"는 올리버 색스 박사의 자서전이다. 그는 평생을 다양한 취미에 열정을 쏟으며 살았다. 오토바이, 사랑, 보디빌딩, 수영, 과학, 생물학, 화학, 뇌과학 모두에 최선을 다했다. 그러나 그의 인생을 관통하는 한 가지 취미를 말하자면, 바로 "글.. 2022. 5. 24.
딥러닝 CDS 교육 후기 교육 기간: 총 4일 (22.05.23-22.05.26) 교육명: 딥러닝 기초 교육 개요: - 딥러닝 개요 - DNN, CNN, RNN 1일 차에 배운 것: - 딥러닝 기초 수학 (경사하강법) - 딥러닝 프로세스: 데이터 전처리 > 모델 생성 (모델 정의, compile) > 모델 학습 (fit) > 모델 평가 (evaluate) > 모델 예측 - DNN 사용해보기 (Squential API), 손글씨 분류 모델 만들기 2일 차에 배운 것: - CNN으로 말/사람 구분하는 모델 만들기 - CNN으로 개/고양이 구분하는 모델 만들기 - 전이학습으로 개/고양이 구분하는 모델 만들기 2일 차까지의 후기: - 지난번 파이썬/머신러닝 CDS 수업보다 재미있다. - 지난번 수업은 2주에 걸쳐서 방대한 분량을 배우느.. 2022. 5. 24.