Para este projeto, estaremos explorando dados disponíveis publicamente de LendingClub.com. Lending Club conecta pessoas que precisam de dinheiro (mutuários) com pessoas que têm dinheiro (investidores). Felizmente, como investidor, você gostaria de investir em pessoas que mostraram um perfil de ter uma alta probabilidade de pagá-lo de volta. Vamos tentar criar um modelo que ajude a prever isso.
O clube de empréstimo teve um ano muito interessante em 2016, então vamos verificar alguns de seus dados e ter em mente o contexto. Esses dados são de antes mesmo de serem públicos.
Utilizaremos os dados de empréstimos de 2007-2010 e tentaremos classificar e prever se o mutuário pagou o empréstimo na íntegra.
Mapeamento das colunas:
- credit.policy: 1 se o cliente atender aos critérios de subscrição de crédito da LendingClub.com e 0 caso contrário.
- purpose: O objetivo do empréstimo (possíveis valores "credit_card", "debt_consolidation", "educacional", "major_purchase", "small_business" e "all_other").
- int.rate: a taxa de juros do empréstimo. Os mutuários julgados por LendingClub.com para serem mais arriscados recebem taxas de juros mais elevadas.
- installment: as parcelas mensais devidas pelo mutuário se o empréstimo for financiado.
- log.annual.inc: O log natural da renda anual auto-relatada do mutuário.
- dti: Ratio dívida / rendimento do tomador do empréstimo (montante da dívida dividido pela receita anual).
- fico: a pontuação de crédito FICO do mutuário.
- days.with.cr.line: O número de dias em que o mutuário teve uma linha de crédito.
- revol.bal: Saldo rotativo do mutuário (montante não pago no final do ciclo de cobrança do cartão de crédito).
- revol.util: taxa de utilização da linha rotativa do mutuário (o valor da linha de crédito usada em relação ao crédito total disponível).
- inq.last.6mths: número de consultas do mutuário por credores nos últimos 6 meses.
- delinq.2yrs: o número de vezes que o mutuário havia passado mais de 30 dias em um pagamento nos últimos 2 anos.
- pub.rec: O número de registros públicos depreciativos do mutuário (arquivamentos de falências, ônus fiscais ou julgamentos).