Title
Modelos heterogéneos de sobrevivência: Uma aplicação ao risco de crédito
Author
Alves, Bruno Cardoso
Summary
pt
Para criar modelos de apoio à gestão de cobranças de clientes numa instituição
financeira de crédito, foram estimados modelos de sobrevivência heterogéneos, para
prever a duração até dois acontecimentos: (i) registo do primeiro atraso no pagamento
das mensalidades do contrato de crédito; e (ii) registo de atrasos superiores a 90 dias –
default. Seguiu-se uma abordagem condicional tipo II, utilizando todos os clientes da
amostra para estimar a duração até ao primeiro atraso e uma sub-amostra, com os
clientes que registaram esse primeiro atraso, para estimar a duração até default. Para
cada acontecimento foram testadas as distribuições exponencial, Weibull, log-normal e
log-logística, em modelos agregados e de mistura. A duração até ao primeiro incidente
(i) foi estimada através de um modelo de sobrevivência com proporção de imunes. Esta
proporção resulta de um modelo logístico utilizando o scoring interno como variável
concomitante. Para os não imunes considerou-se que a duração t segue uma distribuição
log-normal, com variáveis explicativas para os parâmetros µ e σ. A duração entre o
primeiro incidente e uma situação de default (ii) estimou-se através de um modelo de
sobrevivência de mistura com 3 segmentos, com uma função de ligação logit
multinomial e assumindo também que t segue uma distribuição log-normal. Neste
segundo modelo apenas foram modelados os pesos do modelo logit, considerando µ e σ
constantes. Os modelos de sobrevivência apresentados incluem maioritariamente
informação recolhida na altura da originação, aplicáveis igualmente como modelos de
profit scoring, estimando o envolvimento na data de default, dado um cash-flow futuro.
en
To create models that support the receivables management in a financial institution,
heterogeneous survival models were estimated to predict time until two events: (i)
having at least one payment overdue; and (ii) 90 days overdue - default. A conditional 2
approach was followed, using all customers of the sample to estimate time until a first
payment overdue. A second model was developed, considering only the sub-sample of
clients who experienced the first overdue. The exponential, Weibull, log-normal and
log-logistic distributions were tested in estimating the time to each event, in aggregate
and mixture models. Time to the first overdue (i) was predicted through a survival
analysis with immunes, with a logistic model to estimate probability of immunity, using
internal credit scoring as covariate. For the non-immunes, a log-normal function, with
covariates for both parameters, μ and σ, was estimated to predict time to first overdue.
The time between the first overdue and default (ii) was estimated by survival mixture
model with 3 segments, with a multinomial logit link function and assuming that time to
default also follows a log-normal distribution. Covariates on the second model were
considered on the proportions of the mixture model, setting the parameters μ and σ as
constants in each group. The survival models presented in this thesis are estimated with
data collected at the beginning of the loan, allowing its application in a profit scoring
model, by predicting the exposure at the time the customer enters into a situation of
default, given an expected cash-flow.