본문 바로가기
Programming/Project

[NYC 택시 수요 예측 PJT] 2. 문제정의

by 최성현 2021. 7. 11.
320x100

1. 문제 정의

- 어떤 것이 문제인지에 대한 발견, 문제를 어떻게 풀 것인가에 대한 접근 방식 정의

- 문제에 대한 배경지식과 도메인이 있으면 문제 해결에 용이

본 프로젝트에서는 NYC의 Yellow taxi 데이터를 활용하여 taxi들이 더 많은 운행을 할 수 있도록 성장시키는 것이 목표

 

2. 배경

 

2015년 기준 뉴욕에서는 택시가 크게 2가지 종류가 있음 1)주로 멘하탄에 있는 Yellow taxi와 2)외부에서 들어오는 Green taxi이며 대부분의 traffic은 Yellow taxi가 담당

 

New York City 5개 자치구, Manhattan, Green, Yellow taxi (Ref : New York by – Wikipedia, Taxicabs of New York City - Wikipedia)

3. 문제 해결 방안

3-1) 문제 해결 방안 브레인 스토밍

- 시간대별/지역별로 수요와 공급 그래프가 맞는가?

- 적절한 지역과 시간대에 어느 정도의 수요가 발생할지 알 수 있을까?

-> 수요 예측을 통해 더 많은 수요가 나올 지역에 택시를 배치

3-2) 수요 예측의 단위

- 실제 데이터 분포 확인 후 예측의 시간 도메인 결정

- 수요 예측 후 실제 서비스 적용시 예측시 사용한 시간 도메인이 적용될 수 있는지 고려 필요 (e.g. 10분/30분/60분당 차가 얼마나 이동할 수 있는가?)

3-3) 지역 단위

- 적정 규모의 지역 단위 예측 필요 및 적정 규모를 규정할 단위 필요(e.g. Zip Code)

3-4) 제약 조건

- 해석 가능한 결과 추출 유무

- 모델을 사용해 Inference하는 빈도

3-5) 지표 선정

- RMSE, MAPE, R^2

 

4. 프로젝트 방향성 

- 수요 예측 단위 : 60분

- 지역 단위 : Zip Code

해석 가능성, Inference 빈도는 고려하지 않음

 

5. 프로젝트 진행 방향

- 데이터 EDA

- 베이스라인 모델 생성

- 개선 모델 생성

- Feature 추가

- 각종 모델 성능 비교

- 모델 결과 분석 및 개선

 

 

300x250