Caso de análisis de datos de reembolso y usuario de préstamo
Información básica: edad, sexo;
Información de autenticación: autenticación de teléfono móvil, autenticación de cuenta, autenticación de video, autenticación de crédito, autenticación de Taobao;
Información de crédito: Calificación inicial, número histórico de períodos de pago normales y número histórico de períodos de pago vencidos;
Información del préstamo: monto histórico del préstamo exitoso, número histórico de préstamos exitosos, monto del préstamo, plazo del préstamo y fecha de éxito del préstamo.
Para el conjunto de datos de cromatografía líquida, formulamos las siguientes cuatro preguntas:
1. Retrato del usuario, incluida la proporción de género, el nivel educativo, los usuarios antiguos, la distribución por edades y otra información.
2. Reserva de capital, ¿cuál es el monto del préstamo diario? ¿Qué tan grande es la fluctuación? Entonces, ¿cuánto dinero necesita preparar la empresa todos los días para garantizar que no haya escasez de fondos?
3. ¿La tasa de morosidad del usuario, la calificación inicial del prestatario, el tipo de préstamo, el sexo, la edad y otras características tienen un impacto significativo en la probabilidad de pago moroso? ¿Qué grupos tienen tasas de morosidad significativamente más altas?
4. Tasas de interés de endeudamiento, ¿qué grupos están más dispuestos a aceptar tasas de interés de endeudamiento más altas?
Limpiar datos
Comprueba el procesamiento de valores duplicados, valores faltantes, coherencia y valores atípicos a su vez. El conjunto de datos está limpio.
1. Analizar los retratos de los usuarios (género, educación, edad, si es la primera vez que pujan).
El 'monto del préstamo' se resume en función de campos como 'género', 'edad', 'si es la primera vez que solicita', 'certificado educativo' y otros campos, y los resultados son se muestra visualmente en un gráfico circular o de barras.
Conclusión:
1. Los clientes masculinos aportan el 69% del monto del préstamo. La posible razón es que los hombres son más propensos a consumir por adelantado y tienen préstamos de mayor monto.
2. La proporción de volumen no objetivo alcanza el 66%, lo que indica que los usuarios tienden a usarlo varias veces y el producto tiene una alta pegajosidad.
3. El monto del préstamo para quienes tienen un título universitario o inferior es mayor, pero puede haber muchos usuarios que no tienen calificaciones académicas certificadas, por lo que los datos son diferentes.
4. El grupo de edad de 25 a 30 años es el que más se endeuda, y el de 20 a 35 años representa más del 75%, lo que los convierte en los principales consumidores de este producto.
2. Análisis de reserva de capital
¿Cuál es el límite diario aproximado de préstamo? ¿Qué tan grande es la fluctuación? ¿Cuánto dinero necesita preparar la empresa todos los días para garantizar que no falten fondos?
Conclusión:
1. El monto del préstamo diario muestra una tendencia ascendente, pero fluctúa mucho todos los días.
2. Conclusión del análisis de pagos mensuales: desde junio de 2015 hasta junio de 2017, el monto del pago mensual mostró una tendencia ascendente y la velocidad de aumento aumentó con el tiempo.
3.201.07 El 7 de enero, el monto del préstamo alcanzó 5204664 yuanes, con una desviación estándar de 2203394. De acuerdo con el principio 3σ, si la probabilidad de un monto de préstamo diario suficiente alcanza el 99,9%, se debe preparar una cuenta de fórmula diaria de 5204664+2203394×3 = 165438+.
3. Analizar la tasa de pago vencido (calificación inicial del prestatario, tipo de préstamo, sexo, edad, monto del préstamo y otras características).
Tasa de pago vencido = número histórico de períodos de pago vencidos/(número histórico de períodos de pago vencidos + número histórico de períodos de pago normales)
Conclusión:
1 La calificación inicial tiene un mejor efecto de predicción sobre la capacidad de pago del prestamista. La reversión de dos niveles de EF puede deberse al pequeño número de muestras. La tasa de pago vencido promedio de los cuatro niveles de ABCD es relativamente pequeña. Los niveles de EF han aumentado significativamente y las empresas deben tener cuidado con ambos tipos de prestamistas.
2. La distribución por edad de las tasas de morosidad es relativamente uniforme y los jóvenes de entre 25 y 30 años pueden centrarse en ella.
3. La tasa de pagos vencidos de APP Lightning es significativamente más baja que la de los otros tres, y la empresa puede considerar una mayor cooperación con los tipos de préstamos "APP Lightning".
4. La tasa de morosidad de las mujeres es mayor que la de los hombres, probablemente porque los hombres en su vida tienen mayores ingresos.
5. Los montos de préstamos inferiores a 2000 tienen las tasas de pago vencido más bajas, y los montos de préstamos entre 2000 y 3000 tienen las tasas más altas.
Puede considerar más préstamos de montos pequeños para reducir el riesgo de préstamos vencidos.
4. Analizar las tasas de interés de los préstamos (calificación inicial del prestatario, tipo de préstamo, sexo, edad, monto del préstamo y otras características).
¿Qué grupos de clientes están más dispuestos a aceptar tasas de endeudamiento más altas?
Conclusión:
1. La distribución de las tasas de interés de los préstamos por edad es relativamente uniforme, con poca diferencia.
2. La tasa de interés crediticia promedio de la calificación inicial es ABCDFDE de pequeña a grande.
3. La tasa de endeudamiento de las empresas de comercio electrónico es significativamente más baja que la de las otras tres empresas.
4. Las mujeres aceptan tipos de interés de préstamos más bajos que los hombres.
5. La distribución de los montos de los préstamos y las tasas de interés de los préstamos es relativamente uniforme, con poca diferencia.
Análisis completo de los conjuntos de datos de cromatografía líquida para las cuatro preguntas anteriores:
1. "Hombres", "clientes habituales" y "jóvenes y de mediana edad" son las categorías principales. de los grupos de usuarios de Paipaidai.
2. Debe preparar 7.283.728 yuanes en la cuenta de la empresa todos los días para garantizar que la posibilidad de que el monto del préstamo sea insuficiente ese día sea inferior al 0,1%.
3. Para el grupo con una calificación inicial de D, la tasa de interés del préstamo es casi la misma que la de E y F, pero su tasa de pago vencido es solo un tercio de la de E y F. Al mismo nivel de ingresos, el riesgo se reduce considerablemente, por lo que debería desarrollar más clientes con calificación D o aumentar su límite de préstamo.
4. La tasa de pago vencido de los préstamos "relámpago de aplicaciones" es mucho más baja que la de otros proyectos, entre un tercio y una cuarta parte de otros tipos de préstamos, y la tasa de interés promedio de los préstamos es aproximadamente el mismo. Igual que otros proyectos grandes, lo que demuestra que "app Lightning" es un socio de alta calidad de la empresa y que la calidad de los clientes que atrae es muy alta. “Paipaidai” seguirá profundizando su cooperación con la “aplicación Lightning”.
5. Los clientes de préstamos en el "comercio electrónico" tienen bajas tasas de devolución, pero sus tasas de morosidad no son bajas. Los ingresos por préstamos de este grupo son pequeños y el riesgo es alto.
6. Desde la perspectiva de género, las tasas de interés de los préstamos del grupo masculino son más altas y el riesgo de morosidad es menor. De alguna manera son mejores clientes que las mujeres, pero no de manera significativa.
Con base en los datos de LCLP.csv, analice la proporción de hábitos de pago de los usuarios (pago total por adelantado, pago anticipado parcial y pago vencido).
El conjunto de datos se agrupa según el monto del préstamo y se divide en cuatro situaciones de pago según el estado de pago y la fecha de pago para las estadísticas:
(1) Pago único pago: su El estado de pago está marcado como "todas las deudas del tema han sido canceladas por adelantado";
(2) Amortización anticipada parcial: su estado de pago es "pago normal", y el actual la fecha de pago es anterior a la fecha de vencimiento;
(3) Pago normal: su estado de pago está marcado como "pago normal" y la fecha de pago actual es la fecha de vencimiento;
( 4) Pago vencido: El estado de pago se marca como "No pago", "Pago vencido" o "Pago parcial".
El histograma porcentual acumulado muestra que en diferentes grupos de edad (15 -20, 20 -25, 25 -30, 30-35, 35 -40, 4), diferentes géneros (hombres y mujeres), diferente calificación inicial (A-F), diferentes tipos de préstamos, diferentes montos de préstamos (65430).
Cuando se agrupan por monto del préstamo, los resultados son los siguientes:
Grupo A (0-2000): el monto total es 28,5 mil millones. (1) Amortización total única: 10,20%; (2) Amortización anticipada parcial: 60,95%; (3) Amortización normal: 16,23%; (4) Amortización vencida: 12,5438+0%.
Grupo B (2000-3000): El importe total es de 70 millones. (1) Amortización total única: 10,21%; (2) Amortización anticipada parcial: 54,96%; (3) Amortización normal: 20,40%; (4) Amortización vencida: 14,43%.
Grupo C (3000-4000): El importe total es 1 millón. (1) Amortización total única: representa el 14,87%; (2) Amortización anticipada parcial: representa el 50,96%; (3) Amortización normal: representa el 21,90%; (4) Amortización vencida: representa el 65.438+ 02,26%.
Grupo D (4000-5000): El importe total es 72,2 millones. (1) De una sola vez: 14,68%; (2) Amortización anticipada parcial: 50,70%; (3) Amortización normal: 22,78%; (4) Amortización vencida: 11,85%.
Grupo E (5000-6000): El importe total es de 51,1 millones.
(1) Amortización total única: representa el 15,70%; (2) Amortización anticipada parcial: representa el 50,30%; (3) Amortización normal: representa el 23,24%; (4) Amortización vencida: representa el 10,76%.
Grupo F (600): El importe total es de 269,2 millones. (1) Amortización total única: 11,69%; (2) Amortización anticipada parcial: 39,38%; (3) Amortización normal: 39,79%; (4) Amortización vencida: 9,15%.
Se puede ver en los resultados estadísticos de la agrupación del monto del préstamo y en los resultados anteriores:
(1) El monto total del préstamo es superior a 6000 yuanes, seguido de 3000-4000 yuanes , lo que indica que 3.000-4.000 yuanes El monto del préstamo es el mayor.
(2) El riesgo de mora de cada grupo de montos es relativamente promedio, siendo 2000-3000 el mayor y 600 el más pequeño.
(3) A medida que aumenta el importe objetivo, la proporción del reembolso anticipado parcial respecto del importe total disminuye, mientras que la proporción del reembolso normal respecto del importe total aumenta.
Por grupos de edad, los resultados son los siguientes:
Grupo A (15-20 años): Importe total 0,13 millones. (1) Amortización total única: representa el 10,44%; (2) Amortización anticipada parcial: representa el 62,90%; (3) Amortización normal: representa el 13,11%; (4) Amortización vencida: representa el 13,55%.
Grupo B (20-25 años): Importe total 86 millones. (1) Amortización total única: representa el 13,43%; (2) Amortización anticipada parcial: representa el 53,2%; (3) Amortización normal: representa el 20,05%; (4) Amortización vencida: representa el 13,32%.
Grupo C (25-30 años): El importe total es de 203.400 millones. (1) Amortización total única: representa el 14,00%; (2) Amortización anticipada parcial: representa el 47,67%; (3) Amortización normal: representa el 26,69%; (4) Amortización vencida: representa el 11,64%.
Grupo D (30-35 años): El importe total es de 149.400 millones. (1) Amortización total única: 12,36%; (2) Amortización anticipada parcial: 43,92%; (3) Amortización normal: 33,82%; (4) Amortización vencida: 9,88%.
Grupo E (35-40 años): Importe total 80 millones. (1) Amortización total única: 10,81%; (2) Amortización anticipada parcial: 44,39%; (3) Amortización normal: 34,67%; (4) Amortización vencida: 10,13%.
Grupo F (40 años y más): Importe total 70,3 millones. (1) Amortización total única: 10,88%; (2) Amortización anticipada parcial: 42,85%; (3) Amortización normal: 37,21%; (4) Amortización vencida: 9,06%.
Se puede ver en los resultados estadísticos de los grupos de edad y en los resultados anteriores:
(1) El monto del préstamo del grupo de 25 a 30 años es el más alto, y el El grupo de 15 a 20 años es el más bajo;
(2) Los hábitos de pago de todos los grupos de edad son básicamente los mismos. En términos de importe, el reembolso anticipado parcial y el reembolso normal son los métodos más utilizados;
(3) El grupo de edad con mayor riesgo de impago es el de 15 a 20 años;
(4) El grupo de edad de 25 a 30 años tiene la mayor proporción de pagos anticipados únicos.
En el grupo de género, los resultados son los siguientes:
Hombre: El reembolso total es de 431,9 millones. (1) El pago único total representa el 13,16%; (2) El pago anticipado parcial representa el 45,78%; (3) El pago normal representa el 30,09%; (4) El pago vencido representa el 10,97%.
Mujer: El importe total a reembolsar es de 158,5 millones. (1) El pago único total representa el 11,42%; (2) El pago anticipado parcial representa el 48,64%; (3) El pago normal representa el 29,11%; (4) El pago vencido representa el 10,83%.
Se puede ver en los resultados estadísticos de los grupos de hombres y mujeres y en los resultados anteriores:
(1) El monto del préstamo de los clientes masculinos es aproximadamente 2,7 veces mayor que el de las clientas. ;
( 2) Los hábitos de pago de hombres y mujeres son generalmente los mismos en términos de monto, pago anticipado parcial > pago normal > pago anticipado único > pago vencido;
(3) Los clientes masculinos tienen un pago anticipado único. El monto del reembolso es mayor que el de las clientas.
(4) El riesgo de pago tardío para las mujeres es ligeramente menor que el de los hombres;
(5) La proporción de amortización anticipada de las mujeres es ligeramente mayor que la de los hombres.
En el agrupamiento de calificación inicial, los resultados son los siguientes:
Grado A: importe total 24.300 millones. (1) Amortización total única: representa el 10,95%; (2) Amortización anticipada parcial: representa el 42,54%; (3) Amortización normal: representa el 39,73%; (4) Amortización vencida: representa el 6,78%.
Nivel B: importe total 129,8 millones. (1) Amortización total única: 7,68%; (2) Amortización anticipada parcial: 37,45%; (3) Amortización normal: 47,65%; (4) Amortización vencida: 7,22%.
Categoría C: importe total 292,7 mil millones. (1) Amortización total única: 14,19%; (2) Amortización anticipada parcial: 49,92%; (3) Amortización normal: 25,00%; (4) Amortización vencida: 10,89%.
Calificación D: El importe total es 131.400. (1) Amortización total única: representa el 14,59%; (2) Amortización anticipada parcial: representa el 49,27%; (3) Amortización normal: representa el 21,85%; (4) Amortización vencida: representa el 14,29%.
Nivel E: El importe total es 10.800. (1) Amortización total única: representa 13,25438+0%; (2) Amortización anticipada parcial: 40,97%; (3) Amortización normal: representa 22,91%; (4) Amortización vencida: representa 22,91%.
Categoría F: El importe total es de 0,15 millones. (1) Amortización total única: representa el 10,75%; (2) Amortización anticipada parcial: 465.438+0,24%; (3) Amortización normal: representa el 20,68%; (4) Amortización vencida: representa el 27,33%.
A partir de los resultados estadísticos del grupo de calificación inicial, podemos ver que:
(1) Los clientes de clase B son los que más se endeudan, representando alrededor del 50% del total. Los clientes b, C y D son los principales prestatarios.
(2) El ratio de amortización anticipada única es relativamente medio, siendo el nivel más alto de D del 14,59%.
(3) El riesgo de morosidad muestra en general una tendencia ascendente con el aumento del nivel, y el nivel de F La tasa de morosidad de clientes alcanzó el 27,33%.
(4) La amortización anticipada parcial y la amortización normal siguen representando la mayoría.
(5) En general, la calificación inicial tiene un importante significado de referencia.
En la agrupación por tipos de préstamos, los resultados son los siguientes:
Comercio electrónico: total 85.700 millones. (1) Amortización total única: representa el 4,22%; (2) Amortización anticipada parcial: representa el 26,93%; (3) Amortización normal: representa el 62,07%; (4) Amortización vencida: representa el 6,78%.
APP Lightning: El importe total es de 74.500 millones. (1) Amortización total única: 8,96%; (2) Amortización anticipada parcial: 61,13%; (3) Amortización normal: 18,68%; (4) Amortización vencida: 11,24%.
Normal: El importe total es de 234,7 mil millones. (1) Amortización total única: 17,16%; (2) Amortización anticipada parcial: 45,09%; (3) Amortización normal: 26,10%; (4) Amortización vencida: 11,65%.
Otros: Importe total 195,6 millones. (1) Amortización total única: representa el 12,46%; (2) Amortización anticipada parcial: representa el 51,33%; (3) Amortización normal: representa el 24,43%; (4) Amortización vencida: representa el 11,78%.
A partir de los resultados estadísticos de la agrupación de tipos de préstamos, podemos ver que:
(1) El tipo de préstamo ordinario tiene el monto total de préstamo más grande, seguido de otros, y el comercio electrónico es el que tiene el mayor monto total de préstamo. similar a la aplicación Lightning.
(2) Las empresas de comercio electrónico con riesgos de morosidad son las más bajas, representando el 6,78%. Los otros tres tipos son similares.
(3) La amortización anticipada parcial y la amortización normal siguen representando la mayoría. Cabe señalar que, además del comercio electrónico, los otros tres tipos de prepago parcial representan una gran proporción.
Se puede ver en los resultados estadísticos de la agrupación de períodos:
(1) El monto del préstamo muestra una tendencia a la baja a medida que aumenta el número de períodos.
(2) Los diferentes comportamientos de pago tienen diferentes resultados bajo diferentes condiciones de préstamo. El pago anticipado parcial y el pago normal son los métodos más utilizados.
(3) A medida que el período del préstamo se vuelve más largo; , los riesgos de mora tienden a aumentar. Los montos vencidos con un plazo de 20 meses representan la proporción más alta, alcanzando el 57,30%.
(4) Los anticipos únicos con un plazo de 13 meses representan el mayor; proporción, alcanzando el 16,77%.
(5) El número de muestras con períodos de préstamo demasiado largos es demasiado pequeño y no se puede descartar la posibilidad.
En diferentes grados (A-F), diferentes términos de préstamo (1-24), diferentes montos de préstamo (0-2000, 2000-3000, 3000-4000, 4000-5000, 5000-6000, 600) esperar.
1) El eje x es el número de días vencidos y el eje y es la tasa de cobro del monto. Diferentes parámetros corresponden a diferentes curvas;
2) El cobro se define como el reembolso dentro de los 90 días posteriores al pago vencido.
La tendencia de las tasas de pago en diferentes grados (A-F) es aproximadamente la misma que la cantidad de días de vencimiento, es decir, la mayoría de las personas pagan dentro de los diez días posteriores al vencimiento, lo que indica que es posible que se hayan olvidado de pagar; Especialmente 4 o 5 días, el reembolso es el número máximo de veces y el monto.
La tendencia de cambio de la tasa de recuperación de monto para diferentes períodos de préstamo (1-24) con el número de días vencidos no es obvia. La mayoría de las personas pagan dentro de los 10 días anteriores a la duodécima cuota, especialmente 4 o 5 días. Pero después de 13 días, la tasa de reembolso después de 10 días sigue siendo muy alta. También es posible que se destaquen valores atípicos debido a la cantidad de datos, pero también indica que las tasas de pago con ciclos de préstamo largos no son lo suficientemente estables.
Los diferentes montos de préstamo tienen un gran impacto en las tasas de cobro. Cuanto mayor sea el monto del préstamo, mayor será la posibilidad de morosidad.
Los datos de LCIS proporcionan todas las ofertas realizadas por este cliente desde 2015 65438 + 1 de octubre. Incluya registros de ofertas y estado de pago. Calcule y dibuje la curva de rendimiento acumulada del inversor desde septiembre de 2016 hasta febrero de 2017 y al final de cada mes.
Llame a la función draw() para dibujar la curva de ingresos acumulativos de cualquier dato del usuario.