培训天数:3‐4 日
1.银行数据应用的问题
• 互联网金融尤其依赖数据
• 金融业本身就是基于数据与信息的产业
• 数据分析推动了银行的转型与创新
• 未来互联网银行模式
• 传统银行与互联网金融的结合
• 目前的问题:
ü 数据特点与组成
n 数量不够大;维度不够多
n 核心数据、外围数据、常规渠道的数据、社会化的数据等ü 技术不足
n 互联网的流行使得非结构化数据的数量和维度都远远超过传统结构化数据;传统 IT 公司的产品和服务已经不能胜任 2. 银行数据组成
• 系统日志数据
• GIS 地理信息数据
• 在线交易数据
• 客户提供的信息(申请、表格等)
• 社交网络、公共网页得到客户的信用记录以及信用历史
• 和目标客户有类似行为模式的客户数据
• 金融以及经济数据
• 社交网络的数据(个人、家庭计划等)
3. 银行客户全生命周期管理
• 客户身份识别方法——个体精准定向 n
姓名、身份证号、地址、手机号、E‐Mail、SNS 账号、银行卡号 n 用户标签
• 客户分类:人口统计学标签、通用标签、价值标签、长短期购物喜好、金融服务等
• 客户响应率分析
• 客户“健康度”分析
• 客户挽留率分析
• 客户价值提升和维系 4. 银行数据分析应用案例风控:信用卡风险评估 ü追债委外 ü欺诈交易辨别
n 建一个反欺诈统计模型
n 钓鱼网站攻击、信用卡套现、盗刷信用卡、反洗钱 ü信用卡套现识别高风险客户提前催收预警利用海量数据挖掘和算法做贷款业务
• 营销:银行存量客户增值营销细分客户,按照客户行为进行分类 ü优惠推荐、商品推荐 ü微博营销:把微博上用户与银行用户相匹配 ü事件式营销。生活事件(换工作、改变婚姻状况、置房等)带来的营销机会 • 产品设计:银行金融产品设计 ü
信贷需求预测
需求金额预测
• 营业网点分析:
目标客户分析
客户行为分析:电话语音、网络的监控录像:客户走动线路的重叠分析 • 交易故障数据分析
用现在数据的能力把分布在各个地方的原始数据和原始的日志定时每隔一分钟进行收集和抽取放到分布式文件系统里,并建立一些索引提供一个很方便的前端实时的查询
• 呼叫中心记录的分析 ü
客户情感分析
5.数据分析方法和过程
• 业务理解
• 数据理解
• 数据质量问题与预处理
• 数据分析常见陷阱
• 数据分析方法的选择
• 数据分析结果的评价
• 数据分析团队的组建
6.银行数据分析实战案例分析:银行信用卡欺诈与拖欠行为分析用户信用等级影响因素 ü客户信用卡申请数据预处理 ü信用卡申请成功影响因素信用卡用户信用等级影响因素基于消费的信用等级影响因素 信用卡欺诈判断模型基于关联分析的欺诈模型 ü基于判别的欺诈模型 ü基于分类算法的欺诈模型 欺诈人口属性分析 ü欺诈人口属性统计分析基于逻辑回归的欺诈人口属性分析 ü逾期还款的客户特征 ü基于决策树分析逾期客户特征 ü基于回归分析逾期客户特征根据消费历史分析客户特征 ü基于聚类分析客户特征 ü基于客户细分的聚类分析数据分析练习
• 常用的数据分析工具
• 实战练习(提供数据和案例文档)
""