首席数据官

Hi, 请登录

浅谈大数据在金融行业的应用与挑战

作者单位:北京银行股份有限公司无锡分行

1.大数据概述

1.1.什么是大数据

大数据(Big Data)是一个宽泛的概念,业界没有统一的定义,大数据概念的兴起可以追溯到2000年前后,最初理解为一类海量数据的集合。2011年,美国麦肯锡在研究报告《大数据的下一个前沿:创新、竞争和生产力》中给出了大数据的定义:大数据是指大小超出典型数据库软件工具收集、存储、管理和分析能力的数据集。根据Gartner的定义,大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据在通信、金融、教育等各个领域存在已有时日,近年来随着互联网和信息行业的发展进入了快速推广阶段。

1.2.大数据的特征

大数据不仅有传统数据定义的“三个V”,即数量(Volume)、速度(Velocity)和种类(Variety),还包含了更重要的第四个V,价值(Value)。

阿姆斯特丹大学提出了大数据体系架构框架的5V特征,在原有4V基础上增加了真实性(Veracity)特征,包括数据可信性、真伪性、来源和信誉、有效性和可审计性等特性,如图1所示。

浅谈大数据在金融行业的应用与挑战

图 1 大数据体系架构框架5V特征

1.3.大数据的发展趋势

随着大数据产业的不断发展,各行业的应用解决方案不断成熟,大数据产业迎来了井喷式发展。Wikibon 数据显示,2014年全球大数据市场规模达到285亿美元,同比增长53.2%。大数据成为全球IT支出新的增长点,如图2所示。Gartner数据显示,2014年数据中心系统支出达1430亿美元,比2013 年增长2.3%。大数据对全球IT 开支的直接或间接推动将达2320亿美元,预计到2018年这一数据将增长三倍。

浅谈大数据在金融行业的应用与挑战

图 2 Wikibon全球大数据市场规模测算

全球大数据市场结构从垄断竞争向完全竞争格局演化。企业数量迅速增多,产品和服务的差异增大,技术门槛逐步降低,市场竞争越发激烈。全球大数据市场中,行业解决方案、计算分析服务、存储服务、数据库服务和大数据应用为市场份额排名最靠前的细分市场,如图3所示。

浅谈大数据在金融行业的应用与挑战

图 3 Wikibon全球大数据市场结构测算

2.大数据金融

随着大数据技术的应用,越来越多的金融企业也开始投身到大数据应用实践中。麦肯锡的一份研究显示,金融业在大数据价值潜力指数中排名第一。以银行业为例,中国银联涉及43亿张银行卡,超过9亿的持卡人,超过一千万商户,每天近七千万条交易数据,核心交易数据都超过了TB级。

一直以来,金融企业对数据的重视程度非常高。随着移动互联网发展各种务和服多样化市场整体规模扩大。对于数据分析带来的主要业务价值,大量参加调研的金融企业表示,大数据分析的价值是可以根据商业分析实现更加智能的业务决策,让企业战略制定更加理性化。依靠有前瞻性的决策,实现生产过程中资源更优化的分配,能够根据市场变化迅速做出调整,提高用户体验以及资金周转率,降低库存积压的风险,从而获取更高的利润。

2.1.金融数据的类型

金融数据从数据类型上进行划分,大致可以分为结构化数据、半结构化数据与非结构化数据三大类。

(1)结构化数据。结构化的数据来源自金融企业运营数据仓储(ODS)和数据仓库(EDW)。EDW为企业提供分析决策服务,ODS主要实现企业数据整合、共享和准实时运营监控等功能。而通过Hadoop等组件的应用可以将数月前甚至几年前的历史数据进行迁移保存。在分布式存储结构下,结构化数据的存储计算可以得到巨大的改善,可对海量离线数据进行离线分析,将离线数据优势最大化,为金融企业用户打造立体用户画像提供最全面的数据支撑。

(2)半结构化数据。半结构化数据的整合在数据整合中是最为复杂的。金融企业可对接来源于外部单位所提供的不同类型数据库或Excel等的数据。“打通”多源异构的数据是项目中遇到的最困难的部分,数据整合完毕可快速进行建模分析。

(3)非结构化数据。金融行业对于非结构化的处理的方法还是比较原始的。非结构化数据涵盖的范围比较广泛,有新闻,视频,图片以及社交网络等数据。

银行 大数据时代_大数据和金融时代_云时代大数据

2.2.大数据金融的技术实现

金融数据一般具有“流数据”的特征,需要在短时间内快速处理。与其他行业相比银行 大数据时代,金融具有逻辑关系紧密、处理实时性要求高、可展示性需求强等特征,通常需要以下几类关键技术。

(1)数据分析技术。包括数据挖掘、机器学习等人工智能技术,主要应用在用户信用分析、用户聚类分析、用户特征分析、产品关联分析、营销分析等方面。金融系统安全性、稳定性和实时性要求比较高,对大数据计算处理能力也要求非常高。

(2)数据管理技术。包括关系型和非关系型数据管理技术、数据融合和集成技术、数据抽取技术、数据清洗和转换等技术。金融行业对数据的实时处理能力要求非常高,需要灵活地进行数据转换配置和任务配置。

(3)数据处理技术。包括分布式计算、内存计算技术、流处理技术等。通过新型数据处理技术更有效地利用软硬件资源,在降低IT投入、维护成本和物理能耗的同事,提供更为稳定、强大的数据处理能力。

(4)数据展现技术。包括可视化技术、历史流展示技术、空间信息流展示技术等。主要用于金融产品健康度监视、产品发展趋势监视、客户价值监视、反洗钱反欺预警等方面。

2.3.大数据金融的场景应用

任何技术的应用都是基于需求产生的,大数据金融的应用也是由金融行业的业务驱动而衍生出来的。具体的应用分类也没有统一的标准。以金融行业最具代表性的银行为例,根据业务驱动应用场景大致可分为精准营销、风险控制、改善经营、服务创新和产品创新等五个方面,如图4所示。

(1)精准营销: 互联网时代的银行在互联网的冲击下,迫切的需要掌握更多用户信息,继而构建用户360度立体画像,即可对细分的客户进行精准营销、实时营销等个性化智慧营销。

(2)风险控制:应用大数据技术,可以统一管理金融企业内部多源异构数据与外部征信数据,可以更好的完善风控体系。内部可保障数据的完整性与安全性,外部可控制用户风险。

(3)改善经营:通过大数据分析方法改善经营决策,为管理层提供可靠的数据支撑,使经营决策更加高效、敏捷,精确性更高。

(4)服务创新:通过对大数据的应用,改善与客户之间的交互、增加用户粘性,为个人与政府提供增值服务,不断增强金融企业业务核心竞争力。

(5)产品创新:通过高端数据分析和综合化数据分享,有效对接银行、保险、信托、基金等各类金融产品,使金融企业能够从其他领域借鉴并创造出新的金融产品。

浅谈大数据在金融行业的应用与挑战

图 4 金融大数据业务驱动

2.3.场景实例

2.3.1.客户全景画像

客户画像应用主要分为个人客户画像和企业客户画像。其中个人客户画像包括人口统计学特征、消费能力数据、兴趣数据、风险偏好等。以银行为例,银行拥有的客户信息并不全面,基于银行自身拥有的数据有时候难以得出理想的结果甚至可能得出错误的结论,所以还需要引入外部数据源,包括:运营商数据、主流电商网站数据、上网痕迹数据、SNS软件、生活圈子、网络应用等,从而丰富用户标签,构建一起全面的客户画像,如下图5所示。

浅谈大数据在金融行业的应用与挑战

图 5 大数据客户全景画像

2.3.2.客户服务优化

通过大数据,金融企业可监控各种市场推广运作情况,将客户行为转化为咨询流,从中分析客户的个性特征、风险偏好,了解客户的金融往来习惯及使用行为,进一步分析及预测客户潜在的需求,将精准行销扩展至服务的创新与优化。

浅谈大数据在金融行业的应用与挑战

图 6 个性服务优化过程

以银行为例银行 大数据时代,通过大数据资料库,可对下辖分子机构服务柜台及摆设、理财区装饰、甚至座位的设计,依照资料库中机构所在地的人口特征、年龄及交易量复杂度等数据,以及客户在网站、手机银行、微信银行等软件使用习惯进行分析,为客户提供个性化的服务。如:

银行 大数据时代_大数据和金融时代_云时代大数据

 针对高领客户比例偏高的机构,即考虑新增矮柜服务窗口并提供大屏幕显示器提醒;

 面对顾客对网银、手机银行的使用习惯,将浏览率高的栏目与浏览率低的栏目进行重新排版设计,以提升客户使用率及忠诚度的目的;

 根据不同人群在网络、手机APP访问的记录行为,分析其关注资讯的不同(页面浏览时间,次数,频率等),提供不同需求的咨询和服务。

2.3.3.交易欺诈侦测

大数据的分析对于风险控制有着重要意义,金融机构可通过对企业的生产、流通、销售、财务等相关信息的数据挖掘,进行贷款风险分析,量化企业的信用额度,更有效的开展企业贷款。

浅谈大数据在金融行业的应用与挑战

图 7 企业征信体系

同时,在交易欺诈防控中,可以利用持卡人基本信息、卡基本信息、交易历史、客户历史行为模式、正在发生行为模式(如转账)等,结合智能规则引擎(如从一个不经常出现的国家为一个特有用户转账或从一个不熟悉的位置进行在线交易)进行实时的交易反欺诈分析。

3.大数据金融存在的挑战

3.1.数据的几何级增长,整合困难

试看结束,如继续查看请付费↓↓↓↓
打赏0.5元才能查看本内容,立即打赏

来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!

版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。

相关推荐

评论

  • 昵称 (必填)
  • 邮箱
  • 网址
二维码
评论