¿Dónde puedo encontrar datos para construir un modelo de prepago de hipoteca usando conceptos de ciencia de datos?

En términos generales, su pregunta es demasiado general para responderla completamente, ya que no especificó, por ejemplo, con qué tipo de hipotecas está trabajando y si ya tiene algunos datos (si tiene algo que está prediciendo prepagos) para, ya debes saber algo sobre ellos). Sin embargo, aquí hay algunas sugerencias generales: si desea crear un modelo de prepago a nivel de préstamo, necesitará datos a nivel de préstamo, y a nivel de grupo podría crear un modelo correcto utilizando solo datos a nivel de grupo, sin embargo, su modelo será mucho mejor con el uso de datos a nivel de préstamo.

  1. Suponiendo que esté interesado en el tipo más común de hipoteca, tasa fija, conforme, garantizada por la agencia, varios proveedores de datos pueden obtener los datos a nivel de préstamo (y los correspondientes a los grupos). La mejor fuente en mi opinión sería 1010data.com, ya que agrega una capa muy agradable de consultas y análisis para manejar grandes volúmenes de información. Los datos reales que alojan provienen de embs.com, por lo que los datos se pueden comprar directamente de ellos, en una versión sencilla. ¿Por qué debe dirigirse a estos (u otros) proveedores para obtener estos datos? Debido a que lo han estado recolectando durante mucho tiempo al eliminarlo de GSE en los lanzamientos, algo que han reconocido como una oportunidad comercial hace mucho tiempo. Puede descargar exactamente la misma información de divulgación y rendimiento a nivel de préstamo, así como los datos del grupo correspondiente del sitio web de GSE, pero solo durante los últimos 3 meses. Ahora 3 meses de historia no son suficientes para construir un buen modelo de prepago, incluso a corto plazo.
  2. Dependiendo del tipo de modelo que desee construir (por ejemplo, a largo o corto plazo, o nivel de préstamo, nivel de grupo o nivel de cohorte), necesitará algunos datos más que no sean los anteriores, pero la mayor parte se puede encontrar en Bloomberg, a la que supongo que ya tiene acceso, y en Internet.

¿Ayudarían las siguientes bases de datos?

FMAC | Freddie Mac | Quandl

FRED | Datos económicos de la Reserva Federal | Quandl

Estos dos son de libre acceso.

[Divulgación completa: trabajo para Quandl]

Puede obtener datos suficientes de los GSE (Freddie y Fannie). Contiene datos de desempeño histórico a nivel de préstamo de 1999 a 2015.

Estos datos están disponibles de forma gratuita aquí Datos de rendimiento de préstamos unifamiliares de Fannie Mae

y aquí para el conjunto de datos de nivel de préstamo unifamiliar de Freddie Mac.