如何构建银行行业大数据架构分析平台

银行大数据架构发展之路探析

随著银行3.0时代的到来银行业务的在线化、数据架构化将成为常态,如何更好的利用大数据架构盘活内生资源,创造外部价值促进互联網金融发展,成为众多银行关注的焦点

随着“互联网+”发展战略的持续深化,数据架构资源作为驱动企业发展的核心新生产要素成为各个行业转型升级的重要抓手。特别在银行业随着bank3.0的到来,银行业务的在线化、数据架构化将成为常态如何更好的利用大数据架构,盤活内生资源创造外部价值,促进互联网金融发展成为众多银行关注的焦点。

银行积极拥抱大数据架构开发利用数据架构资源,最夶限度地发挥其催化质变的能量笔者从三大层面多个角度进行了系统思考。

        1、大数据架构时代数据架构将成为银行业核心的生产要素の一。数据架构不再只是信息的载体更是一种资源、资产,并结合大数据架构、云计算等技术手段发展将为银行在业务优化、风险管控、客户获取与保留、产品创新、营销服务、管理控制等方面创造持续的经营驱动力。

        2、促进数据架构的持续性的跨界流动才能真正发挥夶数据架构的最大能量无论是银行内部各部门或各系统之间所存在的结构化和非结构化数据架构,还是银行外部跨行业的数据架构流和信息流都必须进行充分的交互与融合、提炼与共享,才能真正发挥大数据架构作为核心生产资料的价值才能发掘出新的业务领域与市場机会,从而提升管控效率与效益        3、注重大数据架构经营与价值变现。数据架构变现价值越来越受到重视从目前大数据架构概念股的熱捧,即可窥见一斑银行自身在运营过程中积累了涵盖客户资源信息、财务信息、信用信息、支付信息、风控信息的海量核心价值数据架构,这是大数据架构时代下银行建立新一轮核心竞争力的关键这种核心的竞争力不同于网上银行等银行产品和服务的信息化经营模式,而是要求银行运用产品经营的理念来经营数据架构注重对数据架构进行价值评估与产品化封装,经过安全处理后形成银行所特有的数據架构再同外部同业或其他行业开展数据架构交易买卖,使大数据架构作为一种商品在市场上进行流通与变现,成为银行价值增长的噺引擎

        在大数据架构时代,一方面银行业是数据架构信息的输入大户,由于其行业特性需要更丰富的信息资源来对其风险管控、营銷服务、客户管理等领域进行强化与提升;另一方面,银行拥有自身独特的数据架构价值资源如何包装与运用他们,更好的去挖掘数据架构自身的价值实现数据架构增值。基于以上两方面需要在银行内部建立起一套清晰合理的业务体系与商业模式

        1、着眼于不同行业用戶需求,依据自身大数据架构优势银行企业可构建多层次、多价值、立体化的大数据架构开放运营体系,建立四类大数据架构业务线

      ┅是基础数据架构业务线:包括数据架构存储空间的对外开放和基础数据架构的单一出售。由于银行IT系统建设较为复杂耗时较长,一般凊况下中小银行的IT核心系统多为租用而来,有条件的银行可借助大数据架构云计算平台的优势,进一步整合数据架构、应用系统资源拓展出租存储空间和应用系统等大数据架构业务,为中小银行提供基于SaaS模式的大数据架构云服务

        二是聚合标签数据架构业务线:银行運用大数据架构技术手段,在整合信用卡系统、电子银行系统、存贷款系统、投资理财系统、风险管理系统等众多系统中存储的海量数据架构时对其进行标签化管理,并通过各类标签数据架构的关联、整合深加工对大数据架构精细化处理后封装出售。        三是专业咨询服务線:在大数据架构时代银行凭借自身在法人客户、个人客户领域的历史数据架构,汇聚行业发展动态、个人消费动态、企业/个人信用情況、投资理财风向等大数据架构信息针对不同需求,开展专业咨询服务如推出第三方征信服务,利用大数据架构技术进行企业或个人信用等级评估;基于金融视角推出特定的行业发展与研判报告为国家经济走势、企业发展、个人消费等领域提供专业化咨询建议等。有條件的银行企业应积极发展大数据架构分析处理技术,在满足自身企业发展、战略决策、营销服务的研判同时强化自身大数据架构分析产品化能力,为最终进入大数据架构专业咨询领域奠定基础        四是数据架构资产交易线:随着银行自身大数据架构整合与提炼能力的逐步加强,一方面是银行能够建立起自有的大数据架构交易集市推出自身特色的数据架构交易产品包,通过自身平台向外界提供数据架构茭易或置换另一方面是银行通过专业第三方大数据架构交易中心,将数据架构资产进行委托代理销售进一步促进数据架构的多边流动與交易,实现数据架构价值最大化

        2、基于银行大数据架构开放运营体系,探索四类多元化商业模式促进大数据架构对外合作实现,保障应用落地、数据架构价值变现

        一是单一数据架构出售模式:基于大数据架构整合处理,进行产品化封装推出数据架构即服务(DaaS)模式,获取数据架构出售收益在这一模式中,银行成为大数据架构资源提供者银行整合自身海量数据架构资源,经过脱敏处理向需求方提供数据架构包,为用户提供全面的、可靠的、有价值、稳定的优质大数据架构资源价值自身不做其他分析、深度加工。银行按照数據架构种类、获取难易度、数据架构整合难易度、数据架构需求量大小等维度对数据架构包进行差别定价通过向需求方收取数据架构购買费用盈利。

        二是数据架构+服务模式:基于大数据架构基础进行增值服务延伸,建立平台即服务(PaaS)模式获取数据架构出售与增值服務收益。这一模式下银行成为大数据架构+应用服务平台提供者。银行向需求方提供所需数据架构并以数据架构为基础,整合应用需求建立服务运营平台,为用户提供个性化大数据架构解决方案(如第三方征信解决方案等)银行按照数据架构种类、获取难易度、数据架构整合难易度、数据架构需求量大小、数据架构分析难易度、行业方案复杂性等维度进行差别定价,向需求方收取数据架构购买费和方案服务费        三是专业服务模式:基于大数据架构分析处理技术,打造标准化专业服务进行产品化封装,获取产品销售收益在这一模式Φ,银行是大数据架构专业服务提供者银行不对外提供数据架构,而是利用自身大数据架构处理技术将数据架构转化为标准服务——夶数据架构存储空间出租与大数据架构专业咨询服务,既能为客户提供安全、稳定、易扩展的存储环境又能为用户提供权威、可信、多視角、深层次的大数据架构咨询价值。银行向需求方收取存储空间租赁费、咨询服务费        四是数据架构交易模式:基于资产运营理念,建竝数据架构交易平台促进数据架构流动、增值,以交易即服务(TaaS)模式获取交易费、会费等收益。这一模式中银行成为大数据架构茭易平台商。银行整合自身海量数据架构资源可建立大数据架构应用商店,通过会员加盟制向会员方提供数据架构的浏览、试用、API下載等服务,并促进会员间数据架构买卖交易银行通过收取会员会费、交易服务费,以及按不同权限等级的数据架构使用费等盈利

        基于銀行核心经营价值环节,积极探索大数据架构应用场景锻造大数据架构业务应用能力,提高银行经营价值链效率

        目前,银行自身数据架构在一定程度上存在不足还需开放合作,吸纳外部数据架构弥补短板,真正实现大数据架构高效、精准应用

        基于银行经营价值链,针对重点经营环节结合外部数据架构,进行针对性的应用能力提升切实锻造大数据架构应用能力,实现大数据架构为银行核心业务垺务促进数据架构向生产力转变。
        银行价值链大数据架构化——面对价值链核心环节的挑战关键在于实现整体银行价值链的大数据架構化,利用大数据架构技术在各个价值链核心环节建立应用能力通过大数据架构促进运营效率的提升。

        针对大数据架构应用能力环节應进一步开展大数据架构应用核心场景研究,通过引进运营商等优质外部数据架构资源提升自身核心经营环节效率。例如通过引用运營商综合信息数据架构,银行针对个人客户可进一步丰富和优化差异化风险定价能力

        良好的商业模式和强大的应用能力,如果缺乏有效嘚支撑保障也会难以实现和落地。银行业大数据架构在构建上层建筑的同时一定要注重夯实基础,在技术和管理支撑保障上要做好鉯下工作:

        未来的业务应用与商务模式,是基于大数据架构的实时智能处理与数据架构开放融合之上传统银行的封闭式IT架构已不能满足ㄖ益发展的业务与管理需要,通过引入云存储、虚拟化、分布式计算、实时流数据架构处理等大数据架构技术破解银行传统IT平台瓶颈,為银行大数据架构应用铺平道路

        建立银行数据架构资产管理平台,建立涵盖采集、加工、使用、评估、优化、下线等数据架构资产一体囮、全生命周期管理实现全行数据架构标准化、规范化治理;并进一步打造专业化的数据架构资产“管家”服务能力,包括资产规划、運营管理、开放管理以及面向不同业务类型的数据架构资产应用,从而为大数据架构时代银行的数据架构资产管理和增值发展提供全面支持

        大数据架构时代,企业的数据架构治理与管理将成为常态基于大数据架构多层次、跨系统、跨部门、跨行业的前端业务应用,需偠底层数据架构的融合与共享打通各系统之间的数据架构孤岛与壁垒,实现系统连动、数据架构互联互通;同时制定数据架构标准实現数据架构的标准化、规范化管理,为顶层的复杂应用提供切实保障

        银行业大数据架构发展前景是光明的,但实现的路途并不平坦目湔在数据架构脱敏、非结构化数据架构挖掘、跨行业大数据架构应用模型优化等方面尚需进一步突破与解决。银行需要联合大数据架构产業合作力量一起攻克,为大数据架构发展扫清障碍

        大数据架构应用是一把双刃剑,它关系到信息安全、客户隐私等交易风险一旦出現纰漏,后果不堪设想通过建立专门配套的大数据架构运营组织,对内进行大数据架构整合、应用、开放与数据架构资产管理;对外进荇数据架构交易变现、合作拓展以及信息安全风险管控并围绕对内、对外的管理内容,建立相应流程、规范与制度实现管理固化,做箌对大数据架构资产的可管可控

}

中国农业银行第四代核心业务系統BoEing建成投产为农业银行打造了业界领先的技术架构和业务架构,不仅在业务服务目标上支持“以客户为中心”和产品快速创新同时以夶幅度的基础架构创新为信息系统更为安全、平稳、高效运行奠定了技术基础,推动了运维管理水平全面提升

当前,在我国经济金融发展新常态下银行业内外部环境正发生着深刻变化。移动互联网、云计算、大数据架构技术迅猛发展使银行业务从适应工业经济的大额低频金融交易向适应网络经济的小额高频交易转变,信息系统面临着业务规模爆发式增长的强烈冲击与此同时,客户、市场和监管对银荇信息系统服务连续性的要求越来越严格商业银行信息科技工作已经迈入了战略深化、架构优化、管理细化的新常态。农业银行第四代核心业务系统BoEing建成投产为农业银行打造了业界领先的技术架构和业务架构,不仅在业务服务目标上支持“以客户为中心”和产品快速创噺同时以大幅度的基础架构创新为信息系统更为安全、平稳、高效运行奠定了技术基础,推动了运维管理水平全面提升

一、信息系统咹全生产面临新的挑战

  20世纪90年代,为满足银行业务发展和运营集约化的需要农业银行设计研发了第三代核心业务系统ABIS。以ABIS为核心的應用体系全面覆盖并较好满足了农业银行各领域经营管理需要以ABIS建设和全国数据架构大集中为标志,农业银行的信息系统安全生产工作步入大型数据架构中心管理模式在科技发展战略上,农业银行始终将安全生产作为头等大事以安全促发展,以发展促安全大力推行准军事化管理,先后引入ISO20000、ISO27001等质量管理体系建立以“快速响应、快速定位、快速处置”为指导原则的“三快”应急处置机制,安全生产笁作取得了良好成效连续5年无重大生产运行事故发生,核心系统主要业务服务时段可用率超过99.96%为农业银行业务经营的稳健发展提供了囿力保障。

  近年来在移动互联网、云计算、大数据架构等新技术的驱动下,基于互联网的各种网络金融业务蓬勃发展给银行信息系统生产运行带来前所未有的压力和挑战。

  一是信息系统运行安全压力倍增基于互联网的电子渠道业务快速发展对银行提出7×24小时鈈间断的服务需求,金融服务向全球化、全天候发展给IT生产运行带来巨大压力。目前商业银行电子渠道交易大幅度增长交易占比增长箌90%以上。银行核心系统日均交易总量以每年约25%的速度增长增量基本上全部来自于电子渠道。在新型商业模式推动下银行业务特征发生ゑ剧变化,小额高频业务占据主流交易量“潮涨潮落”日益频繁,传统的低频交易时段与区域也极有可能出现爆发式交易增长,对数據架构中心并发处理能力带来巨大挑战

  二是信息系统运维工作的复杂度日益增大。随着银行产品的多样化信息系统的交易形态呈現联机实时交易、周期性批处理交易、即时性批处理交易等多种形式,增大了生产运行作业的复杂度同时,为保障国家和社会重大活动、重要时段的服务水平银行能够比较从容地对信息系统进行维护、变更、升级的可用时间窗口很少,给生产运行调度排程管理带来很大難度

  三是数据架构信息安全面临空前考验。几乎是与互联网共生的网络安全问题包括病毒传播、黑客攻击、信息窃密等,已成为銀行数据架构中心的重要安全威胁商业银行必须不断完善金融信息安全保密机制和应急处理机制,提升数据架构中心信息系统的检测、預警、防范、应急处理和自我恢复能力最大限度降低数据架构安全风险,保护客户数据架构安全保障业务持续稳定运行。

  为有效應对日益严峻的信息系统安全生产新形势、新挑战农业银行从技术和管理上双重发力,大力推进系统基础架构优化从根本上提升安全苼产水平。BoEing系统在设计之初就在架构集中统一、应用透明灵活、IT成本降低方面进行了充分考虑。以BoEing系统建设为契机农业银行对核心业務系统和120多个关联系统进行了整体升级改造。BoEing系统上线运行3个多月来各项运行指标平稳,应用效果理想顺利应对多个不断攀升的交易量高峰,IT架构的优势逐渐显现

二、BoEing系统设计中的基础架构创新

  基于新时期的业务需求和对未来业务发展的研究,农业银行在BoEing系统建設中倡导“集约、高效、节能”理念对基础架构重新进行了设计。BoEing系统基础架构继续沿用了核心数据架构在主机平台业务展示与外围應用网关在开放平台的部署方式,同时在通信接入方式、应用负载均衡方式、交易功能部署等多个方面重点进行了优化设计使得新的核惢业务系统可用性和健壮性更强,资源消耗更加节约运维操作更加简洁。

  1.创新主机通信接入模式

  传统的主机系统架构中通常包括一个中间环节,以解决主机上基于SNA通信协议与外围TCP/IP通信协议之间的转换问题这个中间环节的存在,降低了运行效率增大了系统资源消耗,增加了运行故障点农业银行在BoEing系统设计中,在行业内首次将基于主机的三层架构简化为两层架构在主机上直接采用TCP/IP短连接接叺方式,去除了主机接入中间层形成一种扁平化的架构。这种架构构建了一个弹性好、可扩展强的基础平台

  2.提升系统可用性

  茬BoEing系统的两层架构中,以应用层负载均衡设备作为桥梁这道桥梁隔离了数以万计的前台终端设备对后台的直接冲击,可以动态调配交易負载对于主机系统单个逻辑分区(LPAR)或单个交易中间件分区(CICS)可能发生的异常,通过负载均衡设备可自动侦测和规避从而显著提升系统的整體可用性。利用负载均衡设备接入的渐出、渐入机制运维部门的计划性停机维护对交易的影响由5分钟以上降低为秒级的瞬间影响。按照農业银行一年实施6次计划性停机维护估算主机核心业务系统全年可增加30分钟有效对外服务时间。

  3.合理均衡系统的应用负载

  为适應新研发的BoEing体系农业银行对主机系统架构进行了重新设计,在不增加主机资源成本投入的条件下对系统架构进行了大规模的改造。包括增加主机耦合体(SysPlex)中的逻辑分区(LPAR)数将4个应用逻辑分区调整为8个,并同步增加耦合体中系统成员数(Members)增加CICS和DB2的处理单元。基础架构的调整有效适应和支撑了新的应用系统,尽管BoEing系统的应用逻辑较第3代系统更为复杂但通过优化改造,主机CPU资源消耗减少了约10%交易的平均响應时间缩短了约8%,优化效果凸显

  4.简化应用部署架构

  BoEing系统的应用架构是基于金融业务数据架构模型重构的,新的系统整合了银行基础产品的公共构件使很多原先分布于外围系统的产品,包括信用卡、基金、国债、理财产品等整合到核心系统中,使系统架构更加精简系统的可靠性和稳定性提升到更高水平,使日常运维流程得以有效简化

  5.优化功能和数据架构分布

  为缓解业务量的快速增長与昂贵的主机资源投入之间的矛盾,在BoEing系统设计中优化了应用功能与数据架构分布策略将主机中非核心产品和服务剥离至开放平台,形成主机和开放平台融合的基础架构通过将主机系统中实时查询类交易下移到PC服务器集群,单交易对主机MIPS的消耗平均降低了70%左右同时,进一步将历史交易明细数据架构下移到Hadoop集群使历史数据架构交易的存储和查询完全脱离主机系统。这些措施显著降低了主机的运行负載和资源投入

  6.改进应用系统监控方式

  在BoEing系统应用监控功能的设计上,改变以日志采集作为监控数据架构源的方式采用了流量鏡像技术。通过流量镜像技术实现应用监控功能具有明显优势:一是对监控维度和监控指标的适应性和可扩展性强可以灵活地根据运维囷管理需要采集不同维度的数据架构,将监控信息集中于即时的关注点二是这种技术不消耗宝贵的主机计算资源,不因监控功能的需要洏增加主机系统运行压力

三、深化利用新系统架构优势,推进生产运行管理水平提升

  BoEing系统的上线为农业银行安全生产运行和业务快速创新奠定了基础接下来,数据架构中心将充分发挥基础架构领先的优势坚持“生产安全、运行稳定,支持有力、服务高效操作严謹、管理规范”的管理方针,深入推进生产运行体系建设提升生产运行管理水平。

  1.研究和创新容灾体系架构

  BoEing系统更加简洁高效嘚体系架构为农业银行深入研究更加科学、实用的企业级容灾架构打下坚实基础,从而可能突破通常意义的“两地三中心”概念以提升RPO、RTO指标水平为目标,以真正保障业务连续性为宗旨以应用级“双活”、“多活”和自动化、“一键式”切换为特征,以尽量小的建设、运维、演练和管理成本构建出新的容灾技术实现方案。

  2.建设灵活高效的资源管理机制

  BoEing在技术架构上的创新为IT资源循环利用提供了可能。下一步数据架构中心要深入推进IT资源从规模投入向循环利用转变。一是通过实施配电、布线、空调等基础设施优化等举措有效节能降耗,打造资源节约型和环境友好型的绿色数据架构中心;二是采用虚拟化、云计算等新技术增强服务器等系统硬件的可扩展能力;三是完善系统下线和资源回收机制,适时下线投入产出低、耗费资源大的低效IT系统实现运维资源有效运转和循环利用。

  3.推進生产运行量化管理

  建立容量监测指标体系将总分行信息系统、设施设备的重要技术容量指标纳入统一管理,形成全行统一的容量監测指标体系以容量监控为核心,建立各专业、跨专业的容量例行监控和异动指标分析机制对超过容量阈值的情况进行分析。以阈值後评估为抓手定期对阈值达成率、资源消耗率及阈值修订情况进行回顾,动态完善容量监测指标体系

  4.持续提升应急管理水平

  竝足安全生产第一线,将应急管理视角由聚焦事中向事前、事后延伸事前持续加强预警和风险转移,加强监控分析完善预案和演练,嶊进真演实练事中按照“优先恢复系统对外服务”的原则,确定应急处置方案提高应急处置效率,做到快速响应、快速定位、快速处置事后注重将应急经验修改到应急预案中,不断完善应急处置流程在可预期的场景下,探索建立标准化流程和自动化处理措施减少高压环境下人为误操作概率。

  5.强化生产运行数据架构分析与应用

  以生产运行活动中重要容量、交易数据架构为基础建立完整的數据架构资源应用和管理体系,提高数据架构信息资源的可用性和利用率梳理生产运行数据架构服务目录,将例行数据架构统计、报送等工作进行自动化管理提升数据架构服务效率。研究并引入数据架构分析模型开展各专业专题运行数据架构分析和跨领域的综合运行數据架构分析,加强数据架构分析结果应用提升数据架构服务能力。

(文章来源:中国金融电脑杂志)

}

1银行大数据架构风控平台建设方案及应用

金融行业是经营风险的行业风险控制能力是金融机构的核心竞争力。通常而言金融机构一般是通过给客户的信用状况评分来計量贷款违约的可能性,并通过客户的风险水平进行利率定价

而传统的信用测算主要是利用历史借贷数据架构和财务数据架构对借款人嘚违约风险进行分析和判断,这种方法尽管在很长一段时间内被广泛的金融机构所使用但此方法的评价标准单一,评估结果不够全面哃时存在一定的滞后性,更为严重的是这种基于历史数据架构的评估方法无法对缺乏历史借贷数据架构的借款人进行信用风险评估。近姩来金融机构纷纷寻找新的手段,借助新的技术尝试构建新的信用风险评估模型。

大数据架构风控技术正是随着大数据架构处理技术、计算机科技和互联网技术的出现和升级而产生的一种基于数据架构挖掘、机器学习等大数据架构建模方法的信用评估体系目前被金融機构广泛运用到贷前信审、反欺诈、贷后管理和追偿清收等环节中。

大数据架构是指“无法在一定时间范围内用常规工具进行捕捉、管理囷处理的巨量数据架构集合”与传统数据架构集合相比,大数据架构不仅仅体现在规模大和复杂性更为重要的是,大数据架构往往包含了大量的非结构化数据架构包括图片、视频、语音、地理位置等,具有维度广、时时更新等优势金融业,特别是银行业近年来由於业务积累和渠道搭建,聚集了大量数据架构成为大数据架构应用的重要领域。

以银行为例目前银行能够利用的大数据架构主要包括鉯下几个方面:

表1 目前银行大数据架构来源及分类

银行大数据架构管理方面存在哪些问题?

1.数据架构使用效率低:数据架构的加工和使用超强依赖IT人员不能提供自助式数据架构服务。

2.外部数据架构杂乱:外部数据架构源越来越多如微博、新闻媒体、淘宝、电商数据架构等,如何将这些外部数据架构整理、加工成可供行内正常使用的真实、准确的数据架构需进一步探索

3.数据架构类型复杂:数据架构资源非结构化数据架构占有很大比重,且数据架构类型越来越复杂如视频文件、音频文件、图片文件、邮件等,传统的OracleSQL Server等数据架构库不能滿足该类数据架构的存储、搜索和分析。

4.存在大量的数据架构孤岛:银行等金融机构存在不同类型的应用系统数据架构被分散在各个应鼡系统的数据架构库和文件系统中,导致数据架构不能有效的共享;跨系统的、综合性的数据架构搜索、分析困难等

显然,上述数据架構管理方面存在的问题难以单纯靠人工解决那么如何有效地整合和利用银行积累起来的大数据架构资源,让大数据架构资源更高地为银荇的信用评估服务这就需要搭建综合型的大数据架构风控平台。

大数据架构风控平台是一款集大数据架构处理OLAP分析、在线分析、离线汾析、数据架构挖掘、数据架构模型、数据架构可视化展现于一体的综合性大数据架构分析平台,它提供了基于hadoop存储、数据架构立方体预計算的OLAP可视化分析功能使用户通过托拉拽的简单操作即可在亚秒级的时间内完成多维度、全方位的数据架构分析,并以多种可视化方式展示分析结果集成了主流的数据架构挖掘算法和工具,帮助用户快速建立数据架构挖掘模型

大数据架构风控平台的基本特征主要有三個:

1.大数据架构风控平台能够处理的数据架构种类多,维度更广大数据架构风控平台不仅重视传统的信贷变量,还可以分析借款主体的社交网络信息等信息能够为信贷缺失的群体提供基本金融服务。

2.大数据架构风控平台不仅仅关注历史财务数据架构还更加关注借款主體的行为数据架构,能够在充分考察借款人借款行为背后的线索和线索之间的关联性基础上进行数据架构分析降低贷款违约率。

3.大数据架构风控平台对模型可以不断迭代和动态调整机器学习技术使得大数据架构风控平台的风控模型可以将原始数据架构转化成指标需要进荇不断的迭代,不同模型的权重值可以根据样本进行动态调整反过来也能不断改进模型的评测效果。

大数据架构平台的数据架构治理方案

搭建一款集数据架构采集、存储、搜索、加工、分析为一体的大数据架构平台融合结构化数据架构、非结构化数据架构,实现了统一數据架构架构对海量异构数据架构的存储归档,信息组织搜索访问,安全控制分析可视化,以及数据架构挖掘数据架构治理等,洳图1所示

图1 银行大数据架构平台数据架构治理方案

1.数据架构分层: 数据架构是分层次的,不同的数据架构其属性、处理方式、价值都是鈈同的如图2所示:

(1)源数据架构:源数据架构是各个业务系统中生成的大量的业务生产数据架构,应加强备份和归档工作防止数据架构的不完整和损坏。

(2)归档数据架构:归档数据架构又称为细节数据架构平台需要抓取所有的源数据架构进行归档,形成完整的数據架构库

(3)整合数据架构:对细节数据架构进行整合,形成按照主题存放的汇总数据架构集市

(4)指标数据架构:针对客户、员工、管理者,计算生成内容丰富的指标数据架构源为进一步做数据架构挖掘准备丰富的数据架构源。

(5)决策支持数据架构:用于决策分析系统、智能化分析系统数据架构如客户产品推荐、客户细分、销售预测、精准营销等等。

图2 不同数据架构层次的处理方案

2.数据架构整悝:对于历史数据架构来源于行内数据架构平台或其他来自于数据架构库的数据架构行内数据架构可直接用ETL系统工具直接抽取数据架构,其他数据架构库数据架构则可用Sqoop工具抽取放入HBase通道中,从而满足实时历史数据架构的查询需求如图3所示。

(1)文件格式数据架构:矗接使用行内ETL工具直接导入到大数据架构平台中

(2)实时变更数据架构:建立专用通道,支持数据架构实时装载到大数据架构平台中

圖3 行内数据架构和行外数据架构整理

3.抽取数据架构:对现有各种数据架构库的各类数据架构进行清洗、转换、并加载到大数据架构平台。根据代码标准整合数据架构类别,形成数据架构覆盖全面、标准化、规范化的数据架构集市

4.数据架构仓库:大数据架构平台对结构化數据架构采用分布式技术的开源数据架构仓库,支持各种报表软件的访问和第三方软件集成同时满足结构化数据架构的计算和存储。

5.加笁数据架构:大数据架构平台定义对数据架构的各种加工任务主要表现在以下几个方面:(1)数据架构集成:根据原有的数据架构生成噺的数据架构;如根据关联表格设置其他维度生成新的汇总表格等;(2)文件处理:将视音频文件、图片、邮件等转换成识别文字;(3)挖掘数据架构:对平台数据架构进行各类数据架构挖掘处理,如关联分析分类,聚类回归预测等;(4)计算指标:实时计算各类指标數据架构,如计算客户的活跃度价值,忠诚度等

6.分析数据架构:大数据架构平台以可视化方式呈现数据架构查询、数据架构视图、报表等。

银行大数据架构风控平台的建设方案

常见的大数据架构分析平台架构有Hadoop、Spark、Storm、Samza等而基于Hadoop构建大数据架构风控平台具有分布式云存儲和云计算能力,提供了核心分布式数据架构仓库、分布式列数据架构库解决方案还具有良好的扩展性,常用在银行大数据架构风控平囼建设中本文基于Hadoop搭建大数据架构硬件系统,结合JAVA开发实现海量数据架构的分布式存储和处理。

银行大数据架构风控平台是基于PC服务器部署无需购买数据架构库的软件及硬件,实现小时级别的安装部署甚至实现数据架构并行传输,实时数据架构更新服务、查询数据架构秒出结果等等系统整体硬件框架如图4所示。

1.分布式计算和存储根据数据架构量增大快速水平扩展。

2.面向多应用系统多数据架构類型和多数据架构源,实现统一数据架构架构融合结构化、半结构化、非结构化的数据架构,实现数据架构的安全控制和统一建模

3.为其他应用系统提供API接口,实现第三方系统数据架构集成并提供各种数据架构服务

4.以数据架构归档为核心,全面实现数据架构的全生命周期管理和全数据架构搜索、实时数据架构分析可视化以及交互式数据架构发现等

5.支持传统SQL结构化数据架构访问和传统BI软件的集成。

图4 大數据架构风控系统硬件框架图

大数据架构风控平台的软件设计理念和技术能够解决海量数据架构容纳问题、多业务数据架构源整合问题、多数据架构格式转换问题等,如图5所示

1.整个系统软件部分可基于JAVA开发,运行Windows和Linux操作系统上节点同时运行在物理机、虚拟机、Linux、Windows上。

2.所有后台数据架构服务程序可直接运行在JVM上实现灵活、高效的分布式运算。

3.用户使用管理功能可基于J2EE开发WEB用JSF2.0实现,可扩展性强便于②次开发。

4.采用分布式存储和搜索技术数据架构集中平台最根本的要求是处理海量的数据架构,高效融合结构化、半结构化、非结构化數据架构的管理

图5 大数据架构风控系统软件架构

银行大数据架构平台产品应用介绍

通过大数据架构平台内置现成的客户统一画像,根据獲取实时数据架构实现客户精准画像,通过迁移学习、机器深度学习理论对客户360度画像,分析客户行为习惯甚至实现客户精准营销應用,智能推送优质客户资源严格控制风险。如图6所示

图6 银行大数据架构平台产品应用

银行建立大数据架构风控平台可用于信贷客户嘚反欺诈分析、信用等级评估、贷后风险监测预警与催收等环节,严格进行风险防范;重点关注个人客户或企业客户在银行体系内外的负媔信息银行体系内的负面信息包括:信用卡逾期、贷款逾期、黑名单信息等,银行体系外的负面信息包括:P2P/小贷公司等黑名单信息、公檢法的诉讼案件信息、国家行政机关处罚信息(工商、税务、一行三会、协会等)以及网上负面舆情(虚假宣传、误导消费者)等从这些数据架構出发,全面评估个人客户在银行的风险等级为银行的风险防范提供决策支持。如图7所示:

图7 大数据架构平台产品之风险控制

客户画像忣用户行为分析

通过大数据架构风控平台将结构化数据架构、非结构化数据架构、半结构化数据架构统一存放在数据架构模型之中并将外部数据架构与内部数据架构尽可能的匹配,实现对现有客户更加全面、充分、详尽分析如图8所示。

图8 客户全面行为特征分析和指标运算

为了满足线上营销和线下营销相结合的场景数据架构的进入根据营销方式分为实时数据架构、批量数据架构、画像指标数据架构、建竝复杂网络体系和客户智能信用分模型。

(1)实时数据架构:将客户线上行为日志数据架构信息实时推送到大数据架构平台存入数据架構模型之中,实现数据架构标准化、统一化工作并且对实时数据架构进行线上行为实时分析。

(2)批量:每日定时将数据架构汇总到大數据架构平台存入数据架构模型库中,实现数据架构标准化、统一化的工作并对数据架构进行加工。

(3)画像、指标数据架构运算:根据预设的场景进行客户信息全面画像和各项指标运算,从而获得客户的全面特征以及产品特征。

(4)构建复杂关系网络体系实现線上各业务通道场景互通,主要实现基金理财平台、三方支付平台、电商/O2O平台、游戏平台、银行网申平台的互通

(5)创建客户智能信用汾模型:以全网大数据架构为基础,结合大数据架构风控平台以诸多业务驱动为导向,创建客户智能信用分输入:身份证号,手机号;输出:信用评分

根据客户的负债信息、稳定性、负面信息、行为偏好、还款能力、还款意愿等六个维度,结合客户旅游、社交、支付、保险、基金、理财、电商、非银信贷、O2O、银行信息等全网各类数据架构信息依据不同加权比重,建立客户智能信用分

通过深度学习悝论和迁移学习理论对客户进行精准分析,获取客户源并进行理财产品的精准推荐。

使用数学模型算法根据客户或客户群线上连续行為,自动校正客户画像或产品画像之间的关联情况分析从而形成线上产品的推荐服务,产品推荐可按照客户可能关心的内容放在醒目位置自动排序从而有效提升客户体验。

将不同产品或业务交叉推荐根据客户的交易记录分析,识别小微企业客户然后用远程银行来实施交叉营销。

根据客户的理财偏好、资产规模、年龄、工作等维度分析其潜在的金融服务需求,进行有针对性的营销推广

除了内部交叉营销销售、客户忠诚度分析、向上销售等传统的分析性内容外,还需要利用大数据架构平台将行内数据架构与外部数据架构整合,建竝精准营销数学模型寻找更多的营销机会。

5. 精准营销模型建立

(1)寻找理财客户:利用大数据架构平台筛选客户资金在5万及以上的储蓄存款客户不定时的推送理财产品信息;对于行外客户,借助于P2P平台或第三方平台推送的白名单客户可以为其提供理财服务,将资金留茬本行

(2)寻找贷款客户:结合行内数据架构、第三方房产网数据架构以及移动设备位置信息,通过数据架构平台寻找可能购房或购车愙户群体为其提供金融服务。

通过对特定数据架构分析和提取、产品核算对比各类客户的产品使用率、收益率,结合互联网舆情信息对不同客户群设计差异化的创新产品。

根据产品评价指标建设评价模型实现对产品的系统评分,获取每个产品指标数据架构可采用登记评分法对数据架构进行处理,反应每个产品的每项指标在组内产品的排序

针对银行在转型过程中遇到的营销和风控方面的各种问题,杭州金智塔科技有限公司为银行提供定制化的 “知他”银行智能化解决方案系统覆盖储蓄,投资贷款三大银行核心业务,通过各环節的大数据架构分析提升拉新,促活留存的业务效果。帮助银行迅速完成转型

金智塔“知他”银行智能化解决方案主要分为2个核心板块,其一为大数据架构智能风控其二则为大数据架构智能营销。

}

我要回帖

更多关于 大数据分析 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信