본문 바로가기
728x90

파이썬5

[BAEKJOON_Python] 4344. 평균은 넘겠지 문제 대학생 새내기들의 90%는 자신이 반에서 평균은 넘는다고 생각한다. 당신은 그들에게 슬픈 진실을 알려줘야 한다. 입력 첫째 줄에는 테스트 케이스의 개수 C가 주어진다. 둘째 줄부터 각 테스트 케이스마다 학생의 수 N(1 ≤ N ≤ 1000, N은 정수)이 첫 수로 주어지고, 이어서 N명의 점수가 주어진다. 점수는 0보다 크거나 같고, 100보다 작거나 같은 정수이다. 출력 각 케이스마다 한 줄씩 평균을 넘는 학생들의 비율을 반올림하여 소수점 셋째 자리까지 출력한다. 예제 입력 5 5 50 50 70 80 100 7 100 95 90 80 70 60 50 3 70 90 80 3 70 90 81 9 100 99 98 97 96 95 94 93 91 예제 출력 40.000% 57.143% 33.333% .. 2022. 3. 12.
[NYC 택시 수요 예측 PJT] 7. 베이스라인 모델 구축 본 장에서는 수요 예측을 진행함에 있어 성능 비교의 기준이 되는 베이스라인 모델을 구축하고자 한다. 1. Library Import import pandas as pd from sklearn.preprocessing import OneHotEncoder from sklearn.linear_model import LinearRegression import seaborn as sns import numpy as np import warnings import matplotlib.pyplot as plt from ipywidgets import interact from sklearn.metrics import mean_absolute_error from sklearn.metrics import mean_squa.. 2021. 7. 28.
[NYC 택시 수요 예측 PJT] 4. 데이터 EDA - 데이터 시각화 (Time Domain) - 1 EDA(Exploratory Data Analysis) - Exploratory data analysis (EDA) is used by data scientists to analyze and investigate data sets and summarize their main characteristics, often employing data visualization methods. - 탐색적 데이터 분석으로 도표(Plot), 그래포(Graph), 요약 통계(Summary Statistics)등으로 시각화하여 데이터를 다양한 각도에서 관찰하고 이해하는 과정 PJT Code for EDA 1. Library Install pip install plotly cufflinks pandas numpy seabor.. 2021. 7. 11.
[NYC 택시 수요 예측 PJT] 2. 문제정의 1. 문제 정의 - 어떤 것이 문제인지에 대한 발견, 문제를 어떻게 풀 것인가에 대한 접근 방식 정의 - 문제에 대한 배경지식과 도메인이 있으면 문제 해결에 용이 본 프로젝트에서는 NYC의 Yellow taxi 데이터를 활용하여 taxi들이 더 많은 운행을 할 수 있도록 성장시키는 것이 목표 2. 배경 2015년 기준 뉴욕에서는 택시가 크게 2가지 종류가 있음 1)주로 멘하탄에 있는 Yellow taxi와 2)외부에서 들어오는 Green taxi이며 대부분의 traffic은 Yellow taxi가 담당 3. 문제 해결 방안 3-1) 문제 해결 방안 브레인 스토밍 - 시간대별/지역별로 수요와 공급 그래프가 맞는가? - 적절한 지역과 시간대에 어느 정도의 수요가 발생할지 알 수 있을까? -> 수요 예측을 통.. 2021. 7. 11.
[NYC 택시 수요 예측 PJT] 1. 개요 1. 개요 모빌리티 산업의 데이터를 통해 문제를 정의하고 이를 해결하고자 함 2. 데이터세트 Google BigQuery 공개 데이터세트를 사용하며 현업에서 사용하는 데이터와 매우 유사한 형태 3. 프로젝트 목표 - BigQuery(SQL)을 활용한 클라우드 환경에 익숙해질 수 있으며, SQL 쿼리문을 사용해 Feature를 만드는 방법 학습 - 머신러닝 모델링의 베이스라인과 개선 방법 학습 2021. 7. 11.
728x90