본문 바로가기
300x250

Machine learning6

[논문정리] 최적화 하이퍼 파라미터의 XGBoost 학습자 기반 배깅 모델을 활용한 태양광 출력 예측 Optimized-XGBoost Learner Based Bagging Model for Photovoltaic Power Forecasting 최적화 하이퍼 파라미터의 XGBoost 학습자 기반 배깅 모델을 활용한 태양광 출력 예측 대한전기학회 2020년 6월 최성현*⋅허진 As the world is aware of the problem of greenhouse gas emissions, the trend of generating energy source has been changing from conventioanl fossil fuels to sustainable energy such as soalr and wind. In order to reduce greenhouse gas emissions,.. 2022. 2. 8.
재생에너지의 확대에 따른 문제와 해결책 1. 개요 파리협정은 재생에너지원을 통한 에너지 발전의 필요성을 강조하고 변동성을 가지고 있는 발전 시스템을 어떻게 관리하고 통합할 것인지에 대한 연구를 동기 부여하는 계기가 됨 미래의 세계 에너지 공급에 있어 가장 중요한 도전 과제 중 하나는 재생에너지원을 기존 또는 미래의 에너지 공급 구조에 대규모로 통합하는 것 재생에너지원의 변동성과 불확실성은 전력 계통의 안정성에 영향을 줄 수 있는 요소로 반드시 다루어지고 해결되어야 하는 문제점으로 부상함 2. 문제점 재생에너지의 근본적인 문제점은 간헐성, 변동성 그리고 이로 인한 계통연계의 불안정성 재생에너지의 보급이 확대되어 재생에너지원의 계통으로의 침투가 증가할 때 curtailment 문제 전력 계통으로의 재생에너지의 통합은 예측이 어렵고 간헐적인 특성으.. 2021. 10. 31.
[논문정리] 전력계통 유연성 증가를 위한 앙상블 기법의 태양광 발전 출력 예측 모델링에 관한 연구 - 1 전력계통 유연성 증가를 위한 앙상블 기법의 태양광 발전 출력 예측 모델링에 관한 연구 A Study on Solar Power Forecasting Ensemble Model for Increasing Flexibility in Power System 2021년 2월 최성현 전세계적으로 지구온난화를 유발하는 온실가스를 줄이기 위해 에너지원의 사용을 기존 화석 연료에서 지속 가능한 재생에너지원으로 바꾸고 있다. 우리나라 또한 2030년까지 보급되는 재생에너지의 설비용량을 전체 발전량 비중의 20%인 48.7GW로 증가시키고, 2050년까지 5대 녹색 국가 중 하나가 되는 것을 목표로 하고 있다. 재생에너지 발전원은 미래 지향적이며 많은 장점이 있지만, 기상조건에 큰 영향을 받아 출력이 간헐적이고 변동성이 .. 2021. 8. 22.
[NYC 택시 수요 예측 PJT] 9. XGBoost Regressor, LightGBM Regressor, Random Forest 본 게시글에서는 머신러닝의 앙상블 모델인 Random Forest와 Gradient Boost 기법의 종류인 XGBoost와 LightGBM를 사용하여 예측을 진행한다. XGBoost와 LightGBM 기법은 최근 Kaggle 플랫폼에서 좋은 성능을 보이며 주목을 받고 있다. 하지만 두 모델 모두 의사결정나무 (Decision Tree)를 기반으로 하기 때문에 오버 피팅 (Over-fitting)에 주의해야 한다. 부스팅은 랜덤 포레스트나 배깅처럼 여러 개의 트리를 만드나 기존에 있는 예측기를 발전시켜서 이를 합한다는 차이점이 있다. 정리해보면 배깅은 모델을 다양하게 만들기 위해 데이터를 재구성하는 방법, 랜덤 포레스트는 모델을 다양하게 만들기 위해 데이터와 변수 모두 재구성하는 방법 그리고 부스팅은 맞.. 2021. 8. 15.
[NYC 택시 수요 예측 PJT] 7. 베이스라인 모델 구축 본 장에서는 수요 예측을 진행함에 있어 성능 비교의 기준이 되는 베이스라인 모델을 구축하고자 한다. 1. Library Import import pandas as pd from sklearn.preprocessing import OneHotEncoder from sklearn.linear_model import LinearRegression import seaborn as sns import numpy as np import warnings import matplotlib.pyplot as plt from ipywidgets import interact from sklearn.metrics import mean_absolute_error from sklearn.metrics import mean_squa.. 2021. 7. 28.
[NYC 택시 수요 예측 PJT] 6. 데이터 전처리 데이터 전처리란 모델링하고자 하는 목적에 맞고 분석하기 좋게 데이터를 다듬고 이상값을 제거하는 과정을 말한다. 데이터 전처리는 SQL(BigQuery)와 Python 둘 다에서 진행이 가능하며, SQL에서 가능한 부분은 SQL에서, SQL에서 하기 힘든 부분은 Python의 Label Encoding, One Hot Encoding을 통해 하고자 한다. 코딩에 앞서 전처리할 부분은 아래와 같다. Time data pre-processing Reverse Geocoding via BigQiery GIS Categorical data pre-processing Train-Test Split 1. Library Import import pandas as pd from sklearn.preprocessing i.. 2021. 7. 27.
300x250