Skip to content

soeunk37/CAUAppliedStatistis-AnalysisContest-DdareungPlus

 
 

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

37 Commits
 
 
 
 
 
 

Repository files navigation

CAUAppliedStatistis-AnalysisContest-DdareungPlus

2021 중앙대학교 응용통계학과 분석공모전, 따릉플러스

개요

  • 주제 : 데이터 분석을 통한 따릉이 적자 문제 해결 방안
  • 수상 : 우수상(3위)
  • 기간 : 2021.09. ~ 2021.11.
  • 팀원 : 김서린, 김소은, 신정아, 이윤지
  • 사용언어 : R, Python

분석내용

광고 타겟팅

  1. 데이터 전처리 image
  • Heatmap으로 상관관계 확인하여 높은 변수들 병합
  1. K-means Clustering
  • Elbow method 활용하여 최적 군집 수 선정 --> k=4 image
  • Decision Tree 활용하여 Cluster별 특징 파악 image
  • 결과 image

자전거 재배치

  1. 재배치 자치구 선정
  • '일별 반납/대여' 계산하여 variance 높은 구 선정 --> 중구
  1. 재배치 수행 날짜, 시간대 선정
  • 맑은 날 & 평일/주말 하루씩 선정 --> 21.04.23., 21.04.24.
  • '평균 반납/대여'의 절댓값이 큰 시간대 선정 --> (반납많은)6-10시, (대여많은)17-21시
  1. K-means Clustering
  • 각 대여소를 '(반납수 - 대여수) / 거치대수' 계산하여 정규화 -> group(적음, 적정, 많음)으로 분류 image image image
  1. TSP algorighm
  • 데이터 전처리 image
  • TSP 결과 image image
  1. 비용함수 계산
  • 최소비용으로 재배치하는 방법을 찾기 위해 각 k에 대해 비용 계산 image
  • 결과 image image

결론 및 한계

image

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages

  • Jupyter Notebook 99.7%
  • R 0.3%