본문 바로가기
Energy/Papers

[논문정리] 전력계통 유연성 증가를 위한 앙상블 기법의 태양광 발전 출력 예측 모델링에 관한 연구 - 2

by 최성현 2021. 8. 24.
728x90

2. 태양광 발전 출력 예측 기법

2-1. 태양광 발전 출력 예측의 필요성과 경제적 이점

태양광, 풍력과 같이 기상 조건에 많은 영향을 받는 변동성 전원이 증가하면서 변동성 전원의 계통 연계를 대비하기 위해 계통의 유연성을 향상하는 것이 중요해졌다. 유연성을 증가시키는 데 자주 사용되는 방안 중에는 재생에너지의 예측 기술이 가장 비용 효율적인 방법으로 소개되어 있다.

 

태양광 발전 출력 예측의 이점

 

  1. 전력계통의 효과적인 운영
  2. 태양광 발전의 출력 변동성에 대한 최적의 관리
  3. 전력 계통 예비력 산정
  4. 전력 계통의 안정적 운영을 위한 스케줄링
  5. 혼잡 관리
  6. 최적의 저장장치 관리
  7. 생산된 전력의 시장에서의 거래
  8. 전력 생산 비용 감소의 효과

 

 

2-2. 공간 모델링

공간 모델링이란 기상 분석과 같은 지구과학 및 엔지니어링 등 다양한 분야에서 사용되는 지리 통계학 기법으로, 물리적 현상이나 특성을 가진 데이터를 분석하기 위해 사용된다. 이러한 특성은 과거의 데이터가 없어도 공간 정보와 현재의 데이터로만 관심이 있는 지역의 데이터를 측정을 가능하게 한다.

 

각 거리 가중치(ADW, Angular Distance Weighting)

 

  • 기상 관측의 불규칙한 망에서 규칙적인 격자로 보간 하는 데 사용되는 방법으로 거리뿐 아니라 방향을 고려하여 가중치를 부여하는 보간법
  • ADW는 격자 값을 추정할 때 평균을 낼 관측소들을 선택하고 측점 가중치의 역 거리 구성요소의 공식화를 위해 상관관계 감쇠 거리(CDD, Correlation Decay Distance) 개념을 사용

 

상관관계 감쇠 거리(CDD, Correlation Decay Distance)

 

  • 알고자 하는 지점과 모든 기존의 다른 지점 사이의 상관관계가 1/e 아래로 줄어드는 곳의 거리로 정의
  • 목표 지점의 위치와 상관이 있는 측점만을 사용할 때 최상의 결과가 예상되므로 보간법에 사용되는 측점 선정을 위한 탐색 반경은 상관관계 감쇠 거리로 설정
  • CDD가 크면 더 멀리 있는 지점들도 유의미한 상관관계를 가진다고 볼 수 있음

논문에서는 각거리 가중치 계산 시 각 관측소의 거리 부분의 영향을높이기 위해거리 가중치를 세제곱 하여 가중치를 계산하였다.

 

태양광 발전 출력 예측을 진행하고자 하는 지점(★)과, 목표 지점 기상 데이터 추정을 위한 기상 관측소 선정

 

2-3. 일사량, 태양광 발전 출력 예측 모형

태양광 출력 예측에는 크게 두 가지 접근 방법이 있다. 첫 번째는 분석 방정식(Analytical equations)을 이용하여 PV system을 모델링하는 것이다. 일반적으로, 전력 생산과 관련된 주요 요인인 정확한 일사량 예측을 얻는 것에 공을 들이며, 이 접근 방법은 PV performance, Physical, Parametric 또는 "White box"라고 정의된다.

두 번째 방법은 통계적 방법 및 머신러닝 방법을 사용한 출력량을 직접 예측하는 것이며, “Black box"라고 정의된다.

두 가지 모델을 혼합하여 예측 모델을 만들 수 있으며 이는 하이브리드 모델 또는 “Grey box”라고 정의된다. 본 논문에서는 태양광 출력 예측 방법 중 머신러닝 방법 기반의 출력 예측 모형을 모델링하였다.

 

본 논문에서는 머신러닝 방법을 사용하여 일사량과 태양광 발전 출력 예측 모형을 만들었다. 머신러닝은 컴퓨터 과학의 하위 분야로 인공지능 방식으로 분류되며, 입력과 출력 사이의 관계에 대해 표현이 불가능한 경우에도 입력과 출력의 관계를 찾을 수 있다는 장점을 가지고 있다.

 

2-3-1. Decision Tree

  • 의사결정나무는 트리구조를 이용하여 분석하는 방법으로, 의사결정규칙(decision rule)을 도표화 하여 목표 대상 집단을 여러 개의 작은 집단으로 분류(classification)하거나 예측(prediction)하는 분석 방법이다.
  • 일반적으로 의사결정나무 분석은 다음의 4단계 과정을 거친다.
    1. 의사결정나무의 형성 : 분석의 목적과 자료구조에 따라서 적절한 분리기준(split criterion)과 정지 규칙을 정하여 의사결정나무를 얻음
    2. 가지치기 : 분류 오류(classification error)를 크게 할 위험이 크거나 부적절한 규칙을 가지고 있는 가지를 제거
    3. 타당성 평가 : 이익 도표(gains chart), 위험 도표(risk chart) 또는 테스트 자료에 의한 교차검증(cross validation)등을 통해 의사결정나무를 평가
    4. 해석 및 예측 : 의사결정나무를 해석하고 분류 및 예측모형을 설정
  • 의사결정나무는 모델을 직관적으로 이해하기 쉽고, 해석력이 높으며, 데이터 유형에 제약적이지 않은 방법이다. 그러나 이 모델은 높은 변동성, 샘플에 민감하게 영향을 받으며 오버 피팅(over-fitting)을 유발한다.

2-3-2. Bagging

  • Boostrap Aggregating의 약자로 통계 분류와 회귀에 사용되는 머신러닝 앙상블 알고리즘으로 Bagging은 예측모형의 불안정성을 제거하고 예측 정확성을 향상하기 위해 개발됨
    • Boostrap : 주어진 자료를 이용하여 동일한 크기의 표본을 무작위로 복원 추출한 자료를 말하며, 여기서 선택된 자료에서 학습 알고리즘을 실행
    • Aggregation : 모든 붓스트랩에서 도출된 예측 확률 또는 모든 결과의 경우의 수에 기반하여 결과를 내는 과정
  • Bagging은 분산을 감소시키고 오버 피팅을 방지하는데 도움을 줄 수 있으며, 일반적으로 의사결정나무 방법에 적용되지만 어떤 유형의 학습 방법에도 사용될 수 있음
  • 즉, Bagging은 예측 변수의 여러 가지 버전 붓스트랩 자료를 생성하여 각각에 대한 예측 모형을 생성한 후 조합하여 최종적으로 하나의 모형을 만드는 방법

 

Bagging Algorithm

2-3-3. Random Forest

  • 의사결정나무의 단점인 큰 분산을 보완하기 위해 더 많은 무작위성을 주어 약한 학습기들을 만들고 이를 선형으로 결합하여 최종 학습기를 만드는 방법
  • 무작위성을 최대한으로 주기 위해 붓스트랩과 더불어 입력 변수들에 대한 무작위 추출을 결합
  • Bagging은 모델을 다양화하기 위해 데이터를 재구성하는 방법이지만, Random Forest는 데이터뿐만 아니라 변수를 재구성하며 모델의 분산을 줄이고 일반적인 Bagging의 성능보다 우수한 성능을 보임

2-3-4. Light Gradient Boosting

  • 그라디언트 부스팅(Gradient Boosting) 기법의 하나로 의사결정나무 기반의 학습 알고리즘
  • 부스팅은 Random Forest나 Bagging처럼 여러 개의 트리를 만드나 기존에 있는 예측기를 발전시켜서 이를 합한다는 차이점이 있으며 맞추기 어려운 데이터에 대해 가중치를 두어 학습하는 개념
  • Leaf-wise loss 방식을 사용하여 손실 함수(loss function)를 더 줄일 수 있으며, 다른 알고리즘들은 트리가 수평적으로 확장되는 반면 LightGBM은 트리가 수직적으로 확장
  • 크기가 큰 데이터를 다루면서 적은 메모리를 차지하고 빠른 처리속도를 가지고 있고, 결과의 정확도에 초점을 맞춘 알고리즘

 

2-4. 공간 모델링과 머신러닝 앙상블 모델을 활용한 태양광 발전 출력 예측 모형

본 논문은 공간 모델링과 머신러닝 앙상블 기법을 통해 일사량과 태양광 발전소 출력 예측을 진행한다.

  • 출력 예측에 필요한 기상 데이터는 발전소 주변의 기상 관측소에서 보간법을 통해 추정하며, 추정하는 데이터는 온도, 습도, 일사량이다. 온도와 습도는 주간 단위로 예보가 제공되므로 제공되는 데이터를 사용하며, 제공되지 않는 일사량은 각 기상 관측소의 과거 온도, 습도, 일사량을 이용하여 예측하고 예측한 일사량을 통해 목표 지점의 일사량을 추정한다.
  • 출력 예측의 경우 태양광 발전소의 1년 치 데이터를 사용하여 예측 모형을 만들고 만들어진 모형에 ADW 보간법으로 추정한 데이터를 입력하여 예측을 진행한다.
  • 공간 모델링은 상관관계 감쇠 거리 내에 있는 기상 관측소들에 대해 각 거리 가중치 보간법을 통하여 목표 지점의 기상 데이터를 추정했으며, 일사량, 태양광 출력 예측은 머신러닝 앙상블 모델인 Bagging 모델에서 기본 학습자를 LightGBM, Random Forest로 사용하여 예측을 진행했다.
728x90