- 이번 프로젝트에서 무엇을 할까 고민을 많이 하였습니다. 그러던 중 제가 좋아하는 것과 접목시키면 상당히 흥미가 있을거 같다는 생각이 들었습니다.
- 저는 어렸을때 부터 축구를 보고 하는 것을 굉장히 좋아했습니다. 그래서 축구를 접목시키기로 정하였습니다.
- 그 중 세부 주제를 고민하다가 현재 한국에서 아니 아시아에서 빛이나는 활약을 펼치는 손흥민선수의 데이터 분석 및 데이터 시각화를 하기로 정하였습니다.
- 그리고 학교 종강후에도 시간이 주어져 번외로 EPL 팀들 중 가장 많이 무승부를 기록한 팀은 어디일까를 주제로 차트레이싱을 통한 데이터 시각화를 해보았습니다.
- 데이터 스크래핑을 위한 selenium
- 데이터 분서을 위한 pandas
- 데이터 시각화를 위한 matpiotlib
- 차트 레이싱을 위한 bar_chart_race
- numpy
- Understat_Data_Scraping 파일(데이터 분석을 하기 위한 언더 스탯 사이트 데이터 스크래핑)
- 데이터 시각화_01(데이터 분석 및 데이터 시각화)
- whoscored_Data_Scraping(추가적인 데이터 분석 및 시각화를 위해 후스 스코어드 사이트 데이터 스크래핑)
- 데이터 시각화_02(최종 데이터 분석 및 데이터 시각화)
- 번외 프로젝트 차트 레이싱
-
데이터를 스크래핑하는 소스코드에서 즉 selenium 을 사용할 때는 크롬 드라이버가 같은 파일안에 필요합니다. 크롬 드라이버 (우선 제가 쓰던 크롬 드라이브를 첨부하나 크롬 버전이 다르면 따로 다운이 필요합니다.)
-
데이터 스크래핑을 하는데 시간이 걸리므로 인내심이 필요합니다. (다 기다리시기 지루하시는걸 대비하여 완성된 엑셀 파일을 같이 첨부하겠습니다.)
-
차트 레이싱 할때 마지막으로 차트를 레이싱 하려면 따로 설치가 필요한 파일과 그 후 과정이 있습니다. 설치 과정 (다소 복잡하므로 제가 완성한 차트 레이싱 영상파일을 공유하겠습니다.)