PT
A inclusão de sistemas fotovoltaicos na rede elétrica portuguesa tem vindo a aumentar
significativamente nos últimos anos, o que, devido à sua natureza volátil, aumenta a necessidade
de uma previsão precisa para manter o bom funcionamento e gestão da rede elétrica. Apesar da
extensa investigação que evidencia as potencialidades de modelos ensemble para a previsão de
energia ao nível da estação fotovoltaica, existe uma falta generalizada de investigação ao nível
nacional ou multirregional. Para endereçar esta lacuna, a presente dissertação pretende explorar
as capacidades dos modelos ensemble para realizar previsões do dia seguinte da potência
fotovoltaica gerada à escala nacional portuguesa. Para concretizar este objetivo, os modelos
ensemble XGBoost, Random Forest, LigthGBM, e um modelo Stacking foram testados. A
metodologia definida focou-se na avaliação destes modelos sob diferentes configurações, como
o número de lags usados como input nos modelos, o tamanho do conjunto de treino e diferentes
números de passos a prever à frente. Foram testadas uma abordagem univariada, incluindo
apenas as observações históricas da potência fotovoltaica, e uma abordagem multivariada,
incluindo variáveis meteorológicas. Os resultados foram comparados com modelos benchmark
e revelaram que os modelos ensemble foram eficazes na previsão de potência fotovoltaica à
escala nacional. Também foi demonstrado que a exclusão de variáveis com pouca importância,
baseada na análise SHAP, resultou numa melhor performance da previsão em diversas
configurações. O XGBoost foi o mais eficaz, alcançando na sua configuração com melhor
performance: um RMSE de 82.13, um MAE de 49.84, e um MAPE de 12.10%.
EN
The inclusion of photovoltaic (PV) systems in Portugal’s power grid has been increasing
significantly in recent years, which, due to its volatile nature, increases the need for an accurate
forecast to maintain the power grid's good functioning and effective management. Although
there is extensive research that shows the potentialities of ensemble models for PV power
prediction at the plant level, there is an overall lack of research at the national or multi-regional
level. To address this gap, this dissertation aims to explore the ensemble models' capabilities in
predicting one-day-ahead PV power generated at Portugal’s national level. To do so, ensemble
models such as XGBoost, Random Forest, LightGBM, and a Stacking approach were tested.
The defined methodology focused on evaluating the different ensemble models under varying
configurations, including the number of lags used as model input, the training dataset size, and
different steps-ahead setups. Moreover, both an univariate approach, which includes only solar
power or lag-related features, and a multivariate approach, where weather variables are also
included, were tested. The results were compared with benchmark models and revealed that the
ensemble models proved effective in PV power forecasting at a national scale. It was also
demonstrated that excluding low-importance features, guided by SHAP analysis, led to
improved forecasting performance in several configurations. Out of the tested ensemble
models, the most accurate was XGBoost, achieving in its best-performing configuration an
RMSE of 82.13, an MAE of 49.84, and a MAPE of 12.10%.