단계적 회귀분석과 인공신경망 모형을 이용한 광양항 석탄·철광석 물동량 예측력 비교 분석

A Comparative Analysis of the Forecasting Performance of Coal and Iron Ore in Gwangyang Port Using Stepwise Regression and Artificial Neural Network Model

Article information

J Navig Port Res. 2020;44(3):187-194
* 한국해양대학교 대학원 해운경영학과 석사과정생 chosh890625@gmail.com 051)410-4381
** 한국해양대학교 해운경영학부 강사 hsnam0215@kmou.ac.kr 051)410-4381
*** 한국해양대학교 대학원 해운경영학과 석사과정생 kjryu@kmou.ac.kr 051)410-4381
한국해양대학교 해운경영학부 교수
조 상호*, 남 형식**, 류 기진***, 류 동근
* Graduate Students, Graduate School of Korea Maritime Ocean University, 49112 Busan, South Korea chosh890625@gmail.com 051)410-4381
** Part-time Instructor of Shipping Management, Korea Maritime Ocean University, 49112 Busan, South Korea hsnam0215@kmou.ac.kr 051)410-4381
*** Graduate Students, Graduate School of Korea Maritime Ocean University, 49112 Busan, South Korea kjryu@kmou.ac.kr 051)410-4381
Professor, Division of Shipping Management, Korea Maritime Ocean University, 49112 Busan, South Korea
Corresponding author: 종신회원, dkryoo@kmou.ac.kr 051)410-4381
Received 2019 September 2; Revised 2019 September 20; Accepted 2020 March 26.

Abstract

항만의 주요 정책 및 향후 운영계획 수립 시 정확한 물동량 예측에 관한 연구는 매우 중요하며 이러한 중요성으로 인해 관련 연구 가 활발히 수행되고 있다. 본 논문에서는 국내 최대 석탄 및 철광석 처리 항만인 광양항을 대상으로 단계적 회귀분석과 인공신경망모형을 활 용하여 모형간 예측력을 비교하였다. 2009년 1월부터 2019년 1월까지 총 121개월의 월별자료를 활용하였으며 석탄 및 철광석 물동량에 영향 을 주는 요인을 선정하여 공급관련요인과 시장·경제관련요인으로 분류하였다. 단계적 회귀분석 결과, 광양항 석탄 물동량 예측모형의 경우, 입항선박 톤수, 석탄가격 및 대미환율이 최종변수로 선정되었고 철광석 물동량 예측모형의 경우, 입항선박 톤수, 철광석가격이 최종변수로 선 정되었다. 인공신경망모형의 경우, 모델 성능에 영향을 미치는 다양한 Hyper-parameters를 조정하며 최적 모델을 선정하는 시행착오법을 사 용하였다. 분석결과 인공신경망모형이 단계적 회귀분석에 비해 우수한 예측성능을 나타내었으며 예측 모형별 예측값과 실측값을 그래프 상 비교 시에도 인공신경망모형이 단계적 회귀분석에 비해 고·저점을 유사하게 나타냈다.

Trans Abstract

It is very important to forecast freight volume accurately to establish major port policies and future operation plans. Thus, related studies are being conducted because of this importance. In this paper, stepwise regression analysis and artificial neural network model were analyzed to compare the predictive power of each model on Gwangyang Port, the largest domestic port for coal and iron ore transportation. Data of a total of 121 months January 2009-January 2019 were used. Factors affecting coal and iron ore trade volume were selected and classified into supply-related factors and market/economy-related factors. In the stepwise regression analysis, the tonnage of ships entering the port, coal price, and dollar exchange rate were selected as the final variables in case of the Gwangyang Port coal volume forecasting model. In the iron ore volume forecasting model, the tonnage of ships entering the port and the price of iron ore were selected as the final variables. In the analysis using the artificial neural network model, trial-and-error method that various Hyper-parameters affecting the performance of the model were selected to identify the most optimal model used. The analysis results showed that the artificial neural network model had better predictive performance than the stepwise regression analysis. The model which showed the most excellent performance was the Gwangyang Port Coal Volume Forecasting Artificial Neural Network Model. In comparing forecasted values by various predictive models and actually measured values, the artificial neural network model showed closer values to the actual highest point and the lowest point than the stepwise regression analysis.

1. 서 론

항만은 해상과 육상을 연결하는 연결점이자 국제 해상운송 의 관문으로 국가경제 발전에 높은 비중을 차지하는 사회간접 자본이다. 제품수출이나 원자재 수입 등 국제 교역에 크게 의 존하고 있는 우리나라의 특성상 항만은 경제발전 뿐 만 아니 라 생산과 소비 확대, 생산 유지 증대 등 다양한 영향을 미치 고 있다. 국내 산업 중 대표적으로 원료 수입의존도가 높으며 높은 부가가치 비중을 차지하는 산업이 철강 산업이다. 철강 산업은 자동차, 조선, 기계, 건설 및 방위산업을 비롯한 전 산 업에 기초소재를 공급하는 산업으로 대표적인 전략산업이다 (Son, 2011). 이러한 철강 산업의 대표적인 주원료는 석탄과 철광석이며 2018년 기준, 석탄수입량 약 1억 4,882만 톤, 철광 석 수입량 약 7,907만 톤으로 나타났다.

따라서 본 논문에서는 국내 석탄·철광석 처리 물동량이 가 장 많은 항만인 광양항을 대상으로 선정하였다. 광양항은 2018년 기준 석탄 처리물동량의 경우, 약 2,681만 톤으로 전국 대비 약 18%를 차지하였으며 철광석 처리물동량의 경우, 약 3,478만 톤으로 전국 대비 약 44%를 차지하였다. 이처럼 광양 항은 철강 산업 등 다양한 산업분야에 사용되는 주요 광물인 석탄 및 철광석 최대 물동량 처리 항만이며 이와 관련된 주요 정책 및 향후 운영계획 수립 시 정확한 물동량 예측에 관한 연구가 필요하다.

예측 분석 방법은 전통적인 선형시계열(linear time series) 모형을 기반으로 한 통계적 기법(statistical techniques)들이 주 로 사용되었다(Shin and Jeong, 2011). 하지만 전통적인 통계적 기법은 현실에서 발생하는 전반적인 현상을 완벽하게 설명할 수 없다는 한계점을 지니고 있다. 이러한 전통적인 통계적 기법 의 대안 중 다수의 연구에서 활용되는 방법인 기계학습 메커니 즘을 기반으로 한 인공신경망(ANN; Artificial Neural Network)모형이다(Shin and Jeong, 2011).

따라서 본 논문에서는 통계적 예측 기법 중 하나인 다중회귀 모형 중 변수를 축차적으로 선택하거나 제거하여 가장 적합한 회귀모형을 선택하는 방법인 단계적 회귀분석(stepwise regression analysis)과 인공신경망모형인 다층퍼셉트론(MLP; Multi-layer perceptron)을 활용하여 광양항의 석탄 및 철광석 물동량 예측 모형을 구성하여 모형 간의 예측력을 비교해보고자 한다. 예측 모델의 성능 평가기준은 다양하지만 일반적으로 관련 연구에서 가장 많이 활용되는 지표인 RMSE(Root Mean Square Error), MAE(Mean Absolute Error), 및 MAPE(Mean Absolute Percentage Error)를 활용하였다(Paliwal and Kumar, 2009).

2. 선행연구 고찰

Jeon and Song(2007)은 수출입품목 각각 10개를 선정 후 4 개의 변동유형으로 구분하여 회귀분석과 인공신경망모형의 우수성을 적합성, 신뢰성, 강건성 측면에서 각각 비교·분석하 였다. 분석결과 ‘상승지속형’ 데이터의 경우, 회귀분석이 우수 하였으며, ‘상승 둔화형’과 ‘정체형 또는 불규칙형’의 경우, 인 공신경망모형이 우수함을 주장하였다.

Shin, Kang, Park and Lee(2008)는 ARIMA(Auto Regressive Integrated Moving Average)모형과 인공신경망모형, 그리고 두 모형을 결합한 하이브리드 모형을 사용하여 국내 5개 항만 물 동량을 비교 분석하였다. 그 결과 예측 모형의 적합도는 하이 브리드 모형이 가장 높은 것으로 나타났으며 모형의 예측력은 ARIMA모형이 가장 우수한 것으로 나타났다. 하이브리드 모 형이 ARIMA모형에 비해 예측력이 저하된 이유는 자료의 증 감추세로 인해 예측력이 저하되는 ANN모형의 단점을 인한 것 으로 판단하였다.

Cho(2008)은 국내 최대 시멘트 적출항인 동해항을 대상으 로 Holt-Winter모형과 Box-Jenkins 방식의 예측력을 비교 분 석하였다. 동해항의 시멘트 물량을 대상으로 In-sample 및 Out-of-sample로 구분하여 주요 측정치를 비교하였다. 분석 결과, Holt-winter모형이 In-sample과 Out-of-sample 두 기 간 모두 우수한 예측력을 보였다. 이러한 결과를 바탕으로 복 잡한 분석 기법이 모든 기간에 걸쳐 정확한 예측 능력을 보여 주는 것은 아니며 정밀한 예측을 위해서는 다양한 분석 대안 및 결과 비교가 필요하다고 주장하였다.

Shin and Jeong(2010)은 부산항과 인천항의 컨테이너 물동량 예측에 관한 연구를 수행하였다. 대표적인 비선형예측모형인 인 공신경망모형과 ARIMA모형에 대한 비교연구를 수행하는데 목 적을 두었고 두 모형의 결합형인 하이브리드모형을 사용하여 다 른 모형들과 예측성과를 비교하였다. 또한 전역해 찾기에 효과적 인 기법으로 알려진 유전알고리즘을 활용하였으며 인공신경망 모형의 대표적인 모형으로 알려진 다층퍼셉트론(MLP)와 시간지 연네트워크(Time Delay Neural Network; TDNN)을 사용하여 예측성과를 비교하였다. 그 결과 ANN모형과 하이브리드 모형이 ARIMA모형보다 뛰어난 예측성과를 보인다고 주장하였다.

Min and Ha(2014)는 SARIMA(Seasonal Auto Regressive Integrated Moving Average) 모형을 활용하여 1994년 1사분기 부터 2010년 4분기까지 총 84분기 동안의 분기별 항만 컨테이너 물동량을 예측하였다. 추정된 예측 모형의 정확도를 검증하기 위해 2011년 1사분기부터 2013년 4사분기까지의 물동량을 예측 하여 실제 물동량과 비교하였다. 또한 ARIMA 모형을 활용하여 추정한 예측 모형과 비교를 통해 분기별 항만 물동량 예측에 있 어서 SARIMA 모형의 상대적 우수성을 검증하였다. 기존 연구 는 월별 물동량 자료를 활용하는 경우가 대부분이나 Min and Ha(2014)는 분기별 항만 컨테이너 물동량자료를 활용하여 단기 수요를 예측함과 동시에 SARIMA 모형의 우수성을 입증하였다.

Kim and Jang(2015)는 VAR 모형과 Bayesian VAR 모형 을 활용하여 환율과 운임지수가 물동량에 미치는 영향을 분석 하였다. 비교 분석 결과, Bayesian VAR 모형이 VAR 모형에 비해 예측력이 상대적으로 우수하다는 결과를 도출하였다. 시 계열 분석의 경우, 차분변환 과정으로 인해 일부 데이터 손실 문제가 발생하는 경우가 존재하지만 Bayesian VAR 모형의 경우 이러한 차분과정 없이 시계열 자료의 불안전성과 변동성 을 반영할 수 있어서 상대적으로 Bayesian VAR 모형이 우수 하다고 주장하였다.

Jeong and Kang(2015)은 통상최소자승모형, 부분조정모형, 축 소된 자기회귀분포시차모형, 벡터자기회귀 모형 및 시간변동계 수모형을 활용하여 국내 총 화물물동량을 예측하였다. 분석결과, 자료의 변동성이 큰 경우, 시간변동계수모형이 우수하며 점진적 추세를 갖는 경우 벡터자기회귀 모형이 우수하다고 주장하였다.

Kim, Oh and Woo(2018)는 외생변수를 고려하지 않고 시계 열 데이터 기반으로 유류화물 물동량을 예측하였다. 외생변수 를 고려하는 경우, 각각의 외생변수들에 대한 예측이 필요하며 이 과정 중 예측 오차범위가 커질 수 있다는 점을 주장하였다. 예측 모형으로는 시계열 데이터의 단기, 중장기의 주기적 특성 의 승법 반영한 새로운 모형인 TSMR(Two way seasonality multiplied regressive model)을 사용하였다. 분석결과, TSMR 은 물동량 예측을 위하여 사용된 ARIMA, 윈터스 모형, 단순계 절에 비하여 예측력이 우수한 것으로 나타났다. 기존 물동량 예 측 모델로 ARIMA가 주로 활용되고 있지만, ARIMA의 제한된 활용범위를 보완하고 오차를 줄인 한 단계 진전된 모델인 TSMR 을 활용하여 더 정확한 미래 예측이 가능하다고 주장하였다.

Lim and Yun(2018)은 케이프선 운임을 대상으로 단계적 회 귀모형과 랜덤포레스트모델을 이용하여 주요 영향요인을 분석 하였다. 요인 파악이 용이한 케이프선 운임을 대상으로 총 16개 의 수급요인을 사전 추출하였으며 요인간의 상호관련성을 파악 하여 단계적 회귀는 8개 요인, 랜덤포레스트는 10개 요인을 분 석대상으로 선정 하였다. 분석결과, 랜덤포레스트의 예측성능이 아주 우수하였는데 수요요인이 주로 선정된 단계적 회귀분석과 는 달리 공급요인이 비중 있게 선정되었기 때문인 것으로 판단 하였다. Lim and Yun(2018)은 운임예측 연구에 있어 운임결정 요인에 대한 과학적인 근거를 마련하였으며 이를 위해 기계학 습 기반의 모델을 활용하였다는데 연구적 의의를 두었다.

Preceding studies on the forecast of volume and shipping index

3. 연구방법

3.1 단계적 회귀분석(Stepwise regression analysis)

다중회귀모형에서 사용할 변수를 축차적으로 하나씩 선택 하거나 제거하여 가장 적합한 회귀모형을 선택하는 방법으로 는 종속변수와 상관관계가 가장 큰 독립변수부터 시작하여 하 나씩 독립변수를 선택하는 방식인 전진선택법(forward selection method), 독립변수를 모두 포함한 모형에서 설명력 이 가장 낮은 독립변수부터 하나씩 제거하는 방식 후진제거법 (backward elimination method)이 있다.

일반적인 다중회귀모형의 수식은 식 (1)과 같이 나타낼 수 있다.

(1) Yt=β1+β2xt2+β3xt3++βKxtK+t모수의 숫자는 K(β1βK)모수β1은 절편(상수)항β1에 대응되는 변수는xt1=1

전진선택법 사용 시 한 변수를 선정하면 기존에 선정된 변 수 중 중요도가 낮은 변수가 존재할 수 있다. 이러한 단점을 보안하기 위해 이미 선정된 변수들의 중요도를 다시 검사하여 중요도가 낮은 변수를 제거하는 방법을 단계적 선택법 (Stepwise selection method)라 하며 단계적 선택법에서 선정 된 변수들을 사용하여 회귀분석을 실시하는 방법을 단계적 회 귀분석이라 한다.

다중회귀모형에서 여러 변수를 투입하는 경우, 단계적 회귀 분석이 타 접근방법에 비해 적절한 접근 방법이다(Shepperd and MacDonell, 2012; Shilhavy and Prokopova, 2017). 따라 서 본 논문에서는 단계적 선택법을 적용하여 최적의 변수 조 합 후 가장 적합한 다중회귀모형을 구성하였다.

3.2 인공신경망모형(Artificial neural network model)

인공신경망 모형은 기계학습과 인지과학에서 생물학의 신 경망에서 영감은 얻은 통계적 학습 알고리즘이다. 인공신경망 은 시냅스의 결합으로 네트워크를 형성한 인공 뉴런(Node)이 학습을 통해 시냅스의 결합 세기를 변화시켜 문제 해결 능력 을 가지는 모델을 말한다. 인공신경망은 입력층(Input layer), 은닉층(Hidden layers), 출력층(Output layer)으로 구성되어 있으며 입력층은 각 입력변수에 노드로 구성되어 있다. 노드 의 수는 입력변수의 수와 같으며 은닉층은 입력층로부터 전달 되는 변수 값들의 선형결합을 비선형함수로 처리하여 출력층 또는 다른 은닉층에 전달하는 역할을 한다. 출력층은 반응변 수에 대응되는 노드로 예측값이 생성되는 층이다(Jeon and Song, 2007). 이러한 인공신경망 모형의 구성을 그림으로 표 현하면 Fig. 1과 같다.

Fig. 1

Artificial neural network model(ANN)

이러한 인공신경망모형 중 2개 이상의 은닉층을 가지는 신경 망모형을 다층(Multi-layer) 신경망 또는 다층퍼셉트론(MLP; Multi-layer perceptron)이라 한다. 다층퍼셉트론의 목적은 입력 벡터 x를 출력벡터 y(x)로 맵핑(Mapping)하는 것이다. 입력층 에서 자료벡터 또는 패턴을 받아들이고, 2개 이상의 은닉층은 이 전층으로 부터 출력 받아 가중을 취한 후 비선형함수로 넘기게 된다. 출력층은 최종 은닉층으로부터 결과를 받아 비선형적으로 결과를 넘겨 목표값을 제공한다. 다층퍼셉트론의 가중치는 학습 과정에서 오차역전파(Back-Propagation) 알고리즘을 통해 갱신 된다(Gunther and Fritsch, 2010). 다층퍼셉트론을 구조화하면 다음 Fig. 2와 같다.

Fig. 2

Modeling multilayer perceptron structure

본 연구에서는 다층퍼셉트론을 활용하여 예측 분석을 수행 하였으며 최적 인공신경망모형 설계를 위해 다양한 관련 Hyper-Parameters를 조정을 통해 실험적으로 오차를 줄여나 가는 시행착오법을 사용하여 최적의 모형을 도출하였다.

3.3 데이터 및 분석기간

본 연구에서는 광양항의 석탄 물동량 및 철광석 물동량의 예 측분석을 위해 석탄 및 철광석 물동량에 영향을 미치는 관련 요인을 선정하였다. 첫 번째, 케이프선 운임지수(BCI)이다. 케 이프선의 경우, 석탄과 철광석을 주로 운송하는 선박으로 케이 프선 수요의 경우, 철광석과 석탄 운송량과 밀접한 연관이 있다 (Lim and Yum, 2018). 두 번째, 입항 선박 척수와 톤수이다. 물 동량의 증감은 선박의 입출항 척수 및 톤수와 밀접한 관련이 있다. 본 연구에서는 출항 선박 척수 및 톤수를 제외하였는데 2018년 기준 석탄과 철광석의 수입량은 경우, 전체 물동량에 약 99.18%를 차지하기 때문이다. 세 번째, 석탄과 철광석 가격이 다. 석탄 가격기준은 FOB Newcastle 6,300Kcal/kg GAR USD/ton을 활용하였고 철광석 가격기준은 Iron Ore Fines cfr main China port 62% -daily- $/dry metric tonne USD/ton을 활용하였다. 네 번째, 한국자원정보서비스(KOMIS)에서 제공하 는 석탄 및 철광석 시장전망지표이다. 시장전망지표는 단일광 종 가격추세 분석 및 리스크 비교분석을 위한 계량적 지표로 개발되었다. 과거 가격변동율과 미래 가격예측을 활용하여 가 격 리스크를 측정하는 확률적 계량지표로 장기 20년간 가격 사 이클상의 상대적인 위치를 측정한다. 0 ~ 100까지 값을 가지며 수치가 높을수록 리스크가 낮다고 예측하는 지표이다. 다섯 번 째는 광공업생산지수이다. 국내 산업생산활동의 수준을 나타내 는 경제지표의 하나로 기준년도 (2015년 = 100)의 생산수준에 비해 비교시점의 생산수준이 어느 정도 인가를 나타내는 대표 적인 경기행동지표이다. 광공업생산지수는 한국표준산업분류 상 광업, 제조업 등을 대상으로 매월 작성하는 통계로서 경기 동향을 파악함에 있어 매우 중요한 경제지표로 이용되고 있다. 또한 정부의 경제정책 수립이나 민간부문의 투자계획수립 등은 물론 학계나 연구기관에서 장단기 경기변화를 분석하는 경우 기초 자료로 사용되고 있다. 여섯 번째, 대미환율이다. 환율변동 은 통상적으로 가격-물량조정효과(Price-volume effect)를 통해 수출입에 영향을 미치게 된다. 따라서 대미환율 데이터를 물동 량 예측을 위한 요인으로 활용하였다.

위와 같이 선정한 총 7개의 관련요인을 요인별 성격에 따라 시장·경제관련 요인과 공급관련 요인으로 구분하였다. 석탄 및 철광석의 시장 가격과 경기행동지표, 관련 산업생산지수 및 환율을 고려하여 시장·경제관련 요인으로 분류하였다. 또 한 2018년 기준 석탄 및 철광석의 물동량의 99.18%가 수입 물 동량임을 반영하여 운송 선박의 척수, 톤수 및 주된 운송선박 의 운임지수를 공급관련 요인으로 분류하였다.

Factor selection and classification

분석기간은 2009년 1월부터 2019년 1월까지 121개월의 월 별자료를 활용했다.

3.4 예측성능 평가기준

예측분석을 위한 모델을 활용하여 도출한 예측값와 실측값 의 비교를 통해 예측모델의 성능을 평가하고자 한다. 모델의 성능평가 기준은 다양하지만 실질적으로 어느 기준이 모델 성 능평가에 활용되어야 한다는 정형화된 기준은 존재하지 않는 다. 하지만 일반적으로 RMSE, MAE, 및 MAPE가 많은 연구 들에서 일반적으로 받아들여지는 평가기준이다(Zhang, Patuwo and Hu, 1998; Paliwal and Kumar, 2009). MAE, MAPE 및 RMSE를 식으로 나타내면 다음 수식 (2), (3), (4) 와 같다.

(2) MAE=1ni=1n|(YiY^i)|

(3) MAPE=100ni=1nYiY^iYi

(4) RMSE=1ni=1n(YiY^i)2

MAE와 RMSE는 평균오차를 나타내는 공통점이 있지만 MAE의 경우 큰 오차에 덜 민감하고 RMSE의 경우 큰 오차에 대해 페널티가 큰 특징이 존재한다. MAPE는 오차와 실측값의 비율로 나타낸 특징이 있지만 실측값이 0이면 값을 가질 수 없 는 단점이 존재한다(Lim and Yun. 2018). RMSE, MAE 및 MAPE는 수치가 낮을수록 우수한 성능이라 해석할 수 있다.

4. 분석 결과

4.1 단계적 회귀분석 결과

4.1.1 광양항 석탄 물동량 단계적 회귀분석 결과

단계적 접근법을 통해 광양항 석탄 물동량 예측을 위한 회 귀모형을 구축하였다. 최종 선택 변수는 7개의 변수 중 입항 선박 톤수, 석탄 가격, 대미환율이며 1개의 공급관련요인과 2 개의 시장·경제 관련요인이 선정되었다. 단계적 접근을 통한 최종 변수 선정을 요약하면 Table 3과 같다.

Stepwise regression(Gwangyang Port-Coal)

단계적 회귀분석을 통해 예측된 광양항 석탄 물동량 예측 값의 객관적인 평가를 위해 2015년 9월부터 2019년 1월까지의 실측값과 비교하면 Fig. 3과 같다.

Fig. 3

Comparison of coal volume measurements and forecasts (Stepwise regression)

단계적 회귀분석을 통한 광양항 석탄 물동량 예측 모형의 성능평가 결과는 Table 4와 같다.

Performance evaluation of coal volume prediction model (Stepwise regression)

4.1.2 광양항 철광석 물동량 단계적 회귀분석 결과

단계적 접근법을 통해 광양항 철광석 물동량 예측을 위한 회귀모형을 구축하였다. 최종 선택 변수는 7개의 변수 중 입 항 선박 톤수, 철광석 가격이며 1개의 공급관련요인과 1개의 시장·경제 관련요인이 선정되었다. 단계적 접근을 통한 최종 변수 선정을 요약하면 Table 5와 같다.

Stepwise regression(Gwangyang Port-Iron ore)

단계적 회귀분석을 통해 예측된 광양항 철광석 물동량 예 측값의 객관적인 평가를 위해 2015년 9월부터 2019년 1월까지 의 실측값과 비교하면 Fig. 4와 같다.

Fig. 4

Comparison of iron volume measurements and forecasts (Stepwise regression)

단계적 회귀분석을 통한 광양항 철광석 물동량 예측 모형 의 성능평가 결과는 Table 6과 같다.

Performance evaluation of iron volume prediction model (Stepwise regression)

4.2 인공신경망모형 결과

최적의 인공신경망모형을 구축하기 위해서는 은닉층의 구성, 활성화함수, 인공신경망 알고리즘 등을 조절하여야 한다. 하지 만 이러한 설정에 대한 정형화된 기준은 없기 때문에 본 논문 에서는 실험적으로 오차를 줄여나가는 시행착오법(Trial and error method)을 사용하였다. 성능평가 기준으로 선정한 RMSE, MAE 및 MAPE를 기준으로 모형별 성능을 평가하였 다. 은닉층의 구성의 경우, 점진적인 증감을 통해 최적구성을 파악하였고 활성화 함수로는 Sigmoid 함수를 활용하였다. 출력 층의 활성화함수의 경우, 선형함수를 사용하였는데 이는 출력 변수 값이 상수로써 의미를 가지는 회귀 모형 훈련을 수행하기 때문이다. 오차함수의 경우, 잔차제곱합(Sum of Squared Errors; SSE)를 활용하였으며 학습알고리즘은 가중치를 가지는 탄력적 역전파(Resilient backpropagation)을 활용하였다. 최적 의 인공신경망모형을 도출하기 위해 앞서 언급한 Hyper-parameters 외에도 학습계수인 Learning Rate 및 중단 기준으로 에러 함수의 편미분(Partial derivatives)을 위한 임계 값인 Threshold 등을 조정하였다.

4.2.1 광양항 석탄 물동량 인공신경망모형 결과

시행착오법을 통해 광양항 석탄물동량 예측을 위해 선정된 최종 인공신경망모형의 요약은 Table 7과 같다.

Summary of artificial neural network model (Gwangyang Port-Coal)

최종 선정된 인공신경망모형을 통해 예측된 광양항 석탄 물동량 예측값의 객관적인 평가를 위해 2015년 9월부터 2019 년 1월까지의 실측값과 비교하면 Fig. 5와 같다.

Fig. 5

Comparison of actual coal volume measurements and forecasts (ANN)

4.2.2 광양항 철광석 물동량 인공신경망모형 결과

시행착오법을 통해 광양항 석탄물동량 예측을 위해 선정된 최종 인공신경망모형의 요약은 Table 8과 같다.

Summary of artificial neural network model (Gwangyang Port-Iron ore)

최종 선정된 인공신경망모형을 통해 예측된 광양항 철광석 물동량 예측값의 객관적인 평가를 위해 2015년 9월부터 2019 년 1월까지의 실측값과 비교하면 Fig. 6와 같다.

Fig. 6

Comparison of actual iron ore volume measurements and forecasts (ANN)

4.3 예측 분석결과 종합비교

광양항 석탄 및 철광석 물동량의 예측분석방법별 예측력비 교를 위해 2009년 1월부터 2019년 1월까지 121개월의 월별자 료를 활용하여 분석을 수행하였다. 단계적 접근법을 통해 최 적의 변수선정 결과, 석탄 물동량의 경우, 총 7개의 변수 중 입항 선박 톤수, 석탄 가격, 대미환율이며 1개의 공급관련요인 과 2개의 시장·경제 관련요인이 선정되었다. 철광석 물동량의 경우, 총 7개의 변수 중 입항 선박 톤수, 철광석 가격이며 1개 의 공급관련요인과 1개의 시장·경제 관련요인이 선정되었다. 인공신경망모형의 경우, 다양한 Hyper-parameters 조절을 통 해 최적의 모형을 선정하였다.

예측 분석결과, 광양항의 석탄 물동량 예측모형은 인공신경 망모형이 단계적 회귀분석보다 우수한 것으로 분석되었으며 인공신경망모형의 성능평가 수치는 RMSE = 200.9544, MAPE = 0.077643, MAE = 158.1102으로 나타났다. 철광석 물 동량 예측모형 또한 인공신경망모형이 단계적 회귀분석보다 우수한 것으로 분석되었으며 인공신경망모형의 성능평가 수 치는 RMSE = 290.6579, MAPE = 0.088063, MAE = 238.2680 으로 나타났다. 최종 선정된 단계적 회귀분석과 인공모형의 성능평가기준에 따른 비교 결과요약은 Table 9와 같다.

Comparison of predictive performance evaluation criteria

예측모형별 예측값와 실측값의 비교는 Fig. 7 및 Fig. 8과 같으며 석탄 물동량과 철광석 물동량 실측값과 비교 시 인공 신경망모형이 단계적 회귀분석 보다 고·저점이 유사하게 나타 나는 것을 확인할 수 있다.

Fig. 7

Comparison of actual values by coal volume forecasting model

Fig. 8

Comparison of actual values of iron ore volume prediction models

5. 결 론

항만의 주요 정책 및 향후 운영계획 수립 시 정확한 물동량 예측에 관한 연구는 매우 중요하며 이러한 중요성 때문에 항 만의 물동량 예측에 관한 연구가 활발히 수행되고 있다. 본 논 문에서는 국내 최대 석탄 및 철광석 물동량 처리 항만인 광양 항을 대상으로 단계적 회귀분석과 인공신경망모형을 활용하 여 광양항의 석탄 및 철광석 물동량 예측모형을 구성하였다.

총 2009년 1월부터 2019년 1월까지 121개월의 월별자료를 활용하였으며 총 7개의 관련요인을 선정하여 공급관련요인 및 시장·경제관련요인으로 분류하였다. 관련요인 선정 시 석탄 및 철광석을 주원료로 사용하는 철강업의 산업특성을 반영할 수 있는 광공업생산지수와 석탄 및 철광석의 시장전망지표를 활용 하였는데 이는 기존 연구보다 산업의 특성 고려하여 변수를 선 정하였다는 점에 차별성이 있다.

예측 분석방법으로는 단계적 회귀모형과 인공신경망모형을 활용하여 두 예측 모형간의 예측력을 비교하였다. 단계적 회 귀분석 결과, 광양항 석탄 물동량 예측의 경우, 입항선박 톤 수, 석탄가격 및 대미환율이 최종 변수로 선정되었고 철광석 물동량 예측의 경우, 입항선박 톤수, 철광석 가격이 최종 변수 로 선정되었다. 입항선박 톤수와 품목별 가격이 석탄과 철광 석 물동량 예측의 공통적인 변수로 선정되었는데 입항선박 톤 수는 대표적인 공급요인 중 하나로 물동량 증감과 긴밀한 인 과관계가 있는 것으로 추정된다. 인공신경망모형의 경우, 모델 성능에 영향을 미치는 다양한 Hyper-parameters를 조정하며 최적 모델을 선정하는 시행착오법을 사용하였다. 모형의 예측 성능평가 기준으로는 RMSE, MAPE 및 MAE를 사용하였다.

분석 결과, 인공신경망모형이 단계적 회귀분석에 비해 광양 항의 석탄 및 철광석 물동량 예측에 우수한 성능을 나타내었 다. 예측모형 중 가장 우수한 성능을 보인 모형은 석탄 물동량 예측 인공신경망모형으로 RMSE = 200.954, MAPE = 0.077643, MAE = 158.1102로 나타났다. 또한 단계적 회귀분석 과 인공신경망모형의 예측값와 실측값을 그래프 상 비교 시에 도 인공신경망모형이 단계적 회귀분석에 비해 고·저점을 유사 하게 나타냈다.

본 논문에서는 단계적 회귀분석과 인공신경망모형을 활용 하여 광양항의 석탄 및 철광석 물동량 예측모형 간 예측력 비 교에 관한 연구를 수행한 결과, 인공신경망모형이 우수한 예 측성능을 보임을 확인하였다. 본 논문에서 활용한 예측분석 방법은 외생변수를 고려한 모형이다. 외생변수를 고려한 모형 은 외생변수의 예측이 필요하며 이러한 과정 중 예측의 오차 범위가 커질 수 있다는 단점이 존재한다. 따라서 향후 외생변 수를 고려하는 모형과 외생변수를 고려하지 않는 모형의 예측 력 비교에 관한 연구가 수행된다면 보다 의미 있는 연구가 될 것이라 기대한다. 또한 기존 대부분의 물동량 예측의 경우, 컨 테이너 물동량을 대상으로 수행되고 있다. 항만의 주요정책 및 운영계획 수립 시 벌크화물의 중요도는 낮다고 할 수 없다. 본 논문에서 수행한 석탄과 철광석 뿐 만 아니라 곡물 및 시 멘트 등 다양한 벌크화물에 대한 물동량 예측 연구가 수행된 다면 보다 효율적인 항만의 정책 및 운영계획 수립에 도움이 될 것이라 생각한다.

References

1. Cho, C. H.. (2008;), “Forecasting the Cement Traffic Volume at the Port of Donghae”, Korea Logistics Review, Vol. 18, No. 1, pp. 33-53.
2. Jeon, C. Y., Song, J. M.. (2007;), “A Study on Application of the Port Cargo Throughput Forecast by the Neural Network Model”, Journal of Shipping and Logistics, Vol. 53, pp. 65-82. 10.37059/tjosal.2007..53.65.
3. Kim, C. B.. (2015;), “Forecasting the Seaborne Trade Volume using Intervention Multiplicative Seasonal ARIMA and Artificial Neural Network Model”, Journal of Korea Port Economic Association, Vol. 31, No. 1, pp. 69-84.
4. Kim, J. E. et al.. (2018;), “An introduction of new time series forecasting model for oil cargo volume”, Journal of Korea Port Economic Association, Vol. 34, No. 1, pp. 81-98. 10.38121/kpea.2018.03.34.1.81.
5. Korea Mineral Resource Information Service. (2019a. ), Iron Ore & Energy Statistics, https://www.kores.net.
6. Korea Mineral Resource Information Service. (2019b. ), Market Outlook Indicator for mineral resources, https://www.kores.net .
7. Lim, S. S., Yun, H. S.. (2018;), “An Analysis on Determinants of the Capesize Freight Rate and Forecasting Models”, Journal of Navigation and Port Research, Vol. 42, No. 6, pp. 539-545.
8. Ministry of Oceans and Fisheries. (2019. ), Gwangyang Port Logistics Information System, http://www.spidc.go.kr.
9. Paliwal, M., Kumar, U. A.. (2009;), “Neural networks and statistical techniques: A review of applications,” Expert Systems with Applications, Vol. 36, No. 1, pp. 2-17. 10.1016/j.eswa.2007.10.005.
10. Park, S. I. et al.. (2012;), “Forecasting the Steel Cargo Volumes in Incheon Port using System Dynamics”, Journal of Korea Port Economic Association, Vol. 28, No. 2, pp. 75-93.
11. Shepperd, M., MacDonell, S.. (2012;), “Evaluating prediction systems in software project estimation,” Information and Software Technology, Vol. 54, No. 8, pp. 820-827. 10.1016/j.infsof.2011.12.008.
12. Shin, C. H., Jeong, S. H.. (2011;), “A Study on Application of ARIMA and Neural Networks for Time Series Forecasting of Port Traffic”, Journal of Navigation and Port Research, Vol. 35, No. 1, pp. 83-91. 10.5394/KINPR.2011.35.1.83.
13. Silhavy, R.,, Silhavy, P., Prokopova, Z.. (2017;), “Analysis and selection of a regression model for the Use Case Points method using a stepwise approach,” Journal of Systems and Software, Vol. 125, pp. 1-14. 10.1016/j.jss.2016.11.029.
14. Statistics Korea. (2019. ), Index of mining and manufacturing industrial product, http://kostat.go.kr.
15. Van Dorseser, J. C. M. et al. (2012;), Very Long Term Forecast of the Port Throughput in the Le Havre – Hamburg Range up to 2100. EJTIR, 12(1), pp. 88-110.
16. Zeng, Q., Qu, C.. (2014;), “An approach for Baltic Dry Index analysis based on empirical mode decomposition,” Maritime Policy & Management. Routledge, Vol. 41, No. 3, pp. 224-240. 10.1080/03088839.2013.839512.
17. Zhang, G.,, Patuwo, B. E., Hu, M. Y.. (1998;), “Forecasting with artificial neural networks: The state of the art,” International Journal of Forecasting, Vol. 14, No. 1, pp. 35-62. . 10.1016/S0169-2070(97)00044-7.

Article information Continued

Table 1

Preceding studies on the forecast of volume and shipping index

Fig. 1

Artificial neural network model(ANN)

Fig. 2

Modeling multilayer perceptron structure

Table 2

Factor selection and classification

Table 3

Stepwise regression(Gwangyang Port-Coal)

Fig. 3

Comparison of coal volume measurements and forecasts (Stepwise regression)

Table 4

Performance evaluation of coal volume prediction model (Stepwise regression)

Table 5

Stepwise regression(Gwangyang Port-Iron ore)

Fig. 4

Comparison of iron volume measurements and forecasts (Stepwise regression)

Table 6

Performance evaluation of iron volume prediction model (Stepwise regression)

Table 7

Summary of artificial neural network model (Gwangyang Port-Coal)

Fig. 5

Comparison of actual coal volume measurements and forecasts (ANN)

Table 8

Summary of artificial neural network model (Gwangyang Port-Iron ore)

Fig. 6

Comparison of actual iron ore volume measurements and forecasts (ANN)

Table 9

Comparison of predictive performance evaluation criteria

Fig. 7

Comparison of actual values by coal volume forecasting model

Fig. 8

Comparison of actual values of iron ore volume prediction models