第一节 传统人工数据建模
一、 数据建模背景
1、二战后,消费信贷产业在欧美蓬勃发展
2、数据库、数理统计和计算机技术大发展
3、欧美社会征信体系的形成和不断健全
二、三个历史阶段
1、以客户分类为核心的信用分析技术
2、以预测模型为核心的信用评分模型
3、以决策模型为核心的信用评分模型
三、数据模型类型
1、按模型预测的未来表现
2、按模型的数据来源
3、按模型的实证化
4、按模型的对象
四、SCORECARD建模方法论
—— S = SAMPLING 数据选取与抽样
—— C = CLEANSING 数据检测、数据清洗、数据链接与合并
—— O = OPTIMIZATION 数据优化处理过程,包括客户分群(SEGMENTATION)、变量分析与加工、粗分组等
—— R = REGRESSION 利用统计学回归技术构建模型
—— E = EQUALIZATION 将模型转化为评分卡形式
—— C = ConFIRMATION 评分卡评估与确认
—— A = ADMINISTRATION 评分卡实施上线与管理,包括指定管理人,记录评分卡使用情况等
—— R = REVIEW 评分卡跟踪验证
—— D = documentATION 整理记录,完成项目技术文档
五、评分卡六大开发步骤
1、量化评分卡定义(A卡B卡C卡)
2、量化评分卡与专家评分卡
3、区别量化评分卡流程开发步骤
4、浅谈验证评分卡指标
5、评分卡衡量指标-ks值
6、专家评分卡流程开发步骤
第二节 银行数据建模工作的主要矛盾
一、数据存在问题多而解决方法较少
1、 目标变量与数值变量非线性相关
2、 存在大量缺失值
3、 数据来源复杂多样
4、 存在异常值
5、 大量高基数分类变量
二、人员素质要求高而资源配置不足
1、 建模人员,须具备IT技能、数据分析能力以及专业知识
2、 建模人员招聘及相关成本很高
3、 模型使用需要完整的底层架构人员技术支持
三、建模周期特别长而生命周期过短
1、 完整建模周期一般耗时数月
2、 模型的有效生命不超过半年
四、各类建模需求多而建模能力偏弱
1、 所有部门均有建模需求
2、 不同部门建模需求迥异
3、 同一部门在不同地区的差异化需求
4、 模型开发、使用及验证需求各不相同
第三节 数据建模问题根源与解决方法
一、 手工建模过程(AUC值95%)
1、 数据输入(时间不确定)
2、 建模数据预处理(3-5周)
3、 模型设计(2-3周)
4、 建模(2-3周)
5、 模型表现(1-2周)
6、 模型输出
二、 问题根源
1、 专家全程参与手工建模
2、 对专家综合技能要求很高
3、 手工建模耗时过长
三、 如何解决
1、 使用智能建模工具
2、 非专家也能建模
3、 建模效果有保障
4、 建模效率大提升
四、 具体做法
1、 智能建模极大提升建模效率
2、 降低建模门槛,让业务用户主导分析过程
3、 有效抓住业务价值最大化时间窗口
第四节 智能建模架构与智能建模过程
一、 智能建模——预测模型
1、 树相关模型
2、 神经网络模型
3、 回归模型
4、 GBDT
二、 数据预处理
1、 缺失值、离群值
2、 纠偏、平滑化
3、 高基数处理、衍生变量
三、 智能建模过程
1、 自动识别变量类型
2、 生成最佳决策树
3、 机器学习模型迭代
4、 由业务人员进行的策略管理
5、 智能化策略部署
四、 Sas建模流程VS智能建模流程
1、 数据情况
2、 建模效率
3、 模型效果
4、 人员要求
第五节 智能建模案例解析
一、 银行个人分期违约预测案例
1、 传统个人分期违约预测的问题
2、 智能建模工具的应用与数据表现
3、 帮助银行实现收益最大化
二、 银行小微企业信贷客户违约预测案例
1、 传统信贷客户违约预测的问题
2、 智能建模工具的应用与数据表现
3、 帮助银行提升风险防控能力
三、 银行营销场景下模型应用案例
1、 交叉销售模型
2、 客户价值提升模型
3、 产品响应预测模型
4、 客户细分模型
5、 客户流失预警模型