马上消费金融风控模型是如何解决金融风控模型大模型中的安全性问题的?


0
分享至
用微信扫码二维码分享至好友和朋友圈21世纪经济报道记者李览青 上海报道在2023年世界人工智能大会上,大模型技术是当之无愧的“话题王”。在通用大模型向前疾驰的同时,大模型技术如何应用于金融等垂直领域,再次成为业界热议的问题。7月6日-8日,在世界人工智能大会举办期间,21世纪经济报道记者专访了马上消费金融首席信息官蒋宁,他坦言,如今市场广泛讨论的大模型是生成式模型,而金融行业真正需要的是多种模型的组合式AI系统,如今大模型技术在金融行业的落地还存在四个方面的挑战亟待突破,目前为解决金融机构的鲁棒性决策问题,依然需要实时人机协作的机制参与。从“小学生”开始培养《21世纪》:模型和强化学习并不是新鲜词,大模型技术和过去相比,在技术层面带来了怎样的变革?蒋宁:强化学习是发展很久的领域,从AlphaGo到现在OpenAI的ChatGPT,强化学习也在发生巨大的变化。强化学习简单来说是基于人输入的策略,机器在执行过程中不断地调整这个策略。AlphaGo当年最伟大的突破在于,过去在封闭环境下机器可以通过强化学习测算博弈获胜的概率,得到一个概率结果,而AlphaGo可以在两者博弈的动态环境下测算胜率,但它不知道最终的结果。今天大模型技术的强化学习是一个开放系统,每个用户输入的内容指令不一样,机器不知道对方会问什么问题,也不知道该如何更好地回答这个问题。但在开放系统下,在不知道对与错的情况下,它通过奖励函数评估出哪个是更好的答案,它不断通过强化学习实现“越用越聪明”,这就是持续反馈机制,这是OpenAI的突破。《21世纪》:国内已经开启“千模大战”,今天人工智能大会上也有很多大模型产品发布,在您看来,您是如何看到国内各家的大模型与OpanAI之间的差异?蒋宁:我认为目前大模型的核心技术能力,是在于持续反馈机制。打个比方,企业推出的大模型相当于博士生毕业,如果没有高质量的语料数据训练来让大模型进行持续反馈,那这个博士生的知识水平就停留在毕业时,很快就会被其他拥有自我反馈机制的AI追赶上。而OpenAI的大模型是从“小学生”阶段就经历了全社会全平台最好的教育,通过巨量数据来进行持续反馈与强化学习,这样才能实现“越用越聪明”。金融领域大模型落地遇四大挑战《21世纪》:今年WAIC大模型技术非常火爆,你认为金融行业适合大模型技术应用吗?蒋宁:大语言模型技术出世后,对金融行业的人工智能技术应用是“强心剂”,首先金融行业有三个特点。第一,第一,金融行业天然是数据密集型、技术密集型行业,其对数据和技术的使用在各行各业中都是最广泛地。第二,金融行业目前面对的挑战很多,如银行线下网点的价值传递效率问题、用户体验问题,都需要机构持续创新。第三,金融行业一直在探索数据资产化,挖掘数据价值,在风险、营销、运营等方面进行尝试。《21世纪》:但是我们看到大模型技术目前在金融行业落地场景还是很有限,你认为存在哪些挑战?蒋宁:我认为挑战是很多的,主要讲四个方面。第一个挑战是关键性任务和动态适应性。在动态系统里,大模型驱动下的人工智能还不具备100%精准决策能力。金融行业的场景不是一成不变的,面对不可预期的外界环境和突发意外情况,大模型并不能做一如既往地给出稳定举措,这给金融机构在人工智能的技术应用提出了一个非常大的挑战。第二个挑战是个性化要求和隐私保护之间的矛盾。金融行业一直希望通过人工智能来实现极致的用户体验,特别是个性化的体验,但这需要个人隐私数据与大模型技术相融合,这样带来的隐私数据保护问题目前还很难有一个解决方案。第三个挑战是群体智能与安全可控。大模型的训练机制决定其需要大量数据来构建增强学习、强化学习的网络,让多方共同打造一个平台,基于这一平台持续贡献数据与反馈,从而让AI实现技能的进化。但目前出于数据安全考量,行业内跨组织、跨机构的数据共享机制仍然需要持续性的探索。第四个挑战是对大数据和基础设施的能力挑战。未来摩尔时代大模型技术的应用需要高速增长的数据能力,对金融机构网络、服务器、芯片、底层架构等等都提出了全新的要求,这也是未来需要突破的。《21世纪》:为应对这些挑战,你认为有哪些技术将被广泛运用?蒋宁:我看到三个关键技术,概括来说是持续学习、鲁棒性决策以及组合式AI系统。持续学习,就像前面所说,它是大模型基于数据的反馈,让系统越用越聪明。如何构建一个增强的访客系统让更多人使用,这就是在线学习、持续学习、强化学习的技术,这方面我们还有很多需要突破。鲁棒性决策,它是指即使面临噪声和突发情况干扰,大模型也可以作出一致性的可信回答,强调的是可信性。金融业和工业领域,0.1%的错误都是不被允许的,合规、安全是最基础、最核心的要求。无论在怎样的动态环境下,AI都需要排除噪声干扰,为客户做出合法合规的决策,这是鲁棒性决策的要求。组合式AI系统,目前大家广泛讨论的AI是生成式大模型,而金融行业需要判别式大模型,必须直接给出正确或错误的结果,二者之间必须有效结合才能发挥更大价值。从两类模型的区别来看,判别式模型的训练成本很高,每个结果标记对、错,都是机器不断学习的过程,但这个结果很难适应变化中的场景,开发成本很高。生成式大模型的训练则是需要全员的不断参与,泛化能力非常强,但它不能生成准确的结果判断。因此这两种技术需要相互融合。金融机构如何试水大模型?《21世纪》:从这些挑战来看,是否意味着目前金融行业的大模型落地还很难?蒋宁:这要结合大模型从人工智能的布局来看,分为四个大类的象限。第一个象限是基础领域,包括生成式AI、判别式AI,这是基础模型领域;第二个象限是在基础领域上的垂直领域模型,像金融垂直领域的模型;第三个象限是在基础领域和垂直领域模型的基础上,创新生产力工具,比如,代码自动扫描,自动生成语句,这是属于工具类的;第四类是象限是应用领域,比如,智能客服就属于应用领域,因为智能客服不可能把大模型、垂直领域模型直接形成智能客服,所以需要第三象限内智能审核工具等应用。目前金融行业在第一象限的基础模型开发还非常困难,我们缺乏持续投入信息数据的反馈机制,但在第三第四象限的工具和应用类别上,已经可以实现大模型技术在部分金融业务场景下的应用了。《21世纪》:目前马上消费有尝试大模型技术的应用吗?主要在哪些方面?蒋宁:结合前面我们说的挑战和技术应用路径,我们提出了“三横三竖”战略。其中,“三横”包括:通过持续学习技术、模型控制、组合式AI 系统形成的安全、合规、可信的鲁棒性决策能力。“三竖”包括:一是数据智能,二是多模态大模型,三是实时人机协作。目前在应用方面,我们开发了智能生成报表的工具,在场景方面我们在智能客服上已经有所涉猎。得益于消费金融公司长期与社会有广泛交流,在中文高质量数据集相对有限的情况下,我们公司历史上累加了将近40PB的客户声音数据,来帮助我们训练人机协作模型,训练人机对话的模型,并且利用大模型技术为人机对话提供更好的帮助。我们基于这样近千亿的数据量和组合模型,结合机器的反馈机制进行强化学习,在不同场景下,把语音、声纹,包括心理学这些模型融合在一起,同时为了应对机器在突发情况下的问题,我们通过人机协作的形式实现鲁棒性决策,这是我们科技方面的核心竞争能力。特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.相关推荐热点推荐
2023-10-19 02:58:44
}
“金融行业作为人工智能应用要求高、场景丰富,是大模型技术和算法突破的沃土。今天发布金融大模型,体现了你们在这方面的技术积累,我也十分期待你们在未来推动大模型应用在金融领域的探索和实践,从而带动和加速金融数字化和智能化的发展。”中国工程院院士倪光南在8月28日金融大模型发展论坛暨马上消费金融大模型发布会上如是表述。本次论坛以“数智融合,渝见未来”为主题,云集了谭建荣、倪光南、孙茂松和杨新民四位院士及100多家金融机构,携手马上消费金融股份有限公司(下称马上消费),共同探讨金融大模型的未来。多位院士点赞马上消费天镜大模型论坛上,马上消费重磅发布了全国首个零售金融大模型——“天镜”,寓意大模型是人类智慧的镜像,推动金融机构高质量发展。基于此,中国信通院、重庆国家应用数学中心和马上消费牵头发起,阿里云、百行征信、北京火山引擎科技有限公司、中关村科金、毕马威、复旦大学金融科技研究院、朴道征信、腾讯云、中国科学院自动化研究所等联合倡议发起的“金融大模型可信安全验证与联合创新行动计划”。马上消费发布首个零售金融大模型“天镜”谭建荣、孙茂松、杨新民等院士与马上消费蒋宁共论金融大模型的可信、安全“今年年初的ChatGPT非常直面,我们感觉到无所不能,但是坦诚讲,在工业领域、金融领域,大模型还有四个关键的难题。”马上消费首席信息官蒋宁开局就直面通用大模型和金融大模型的本质区别。他表示,大模型目前还面临关键性任务和动态适应性、个性化要求和隐私保护、群体智能与安全可信和基础设施的能力四大难题。他举例表示生成大模型,最大的困难是满腹经纶,回答错了他可以不承担风险,比如自动驾驶,它的刹车、提速、转弯、看灯,外界环境都在变化,对象车在变化,所以绝对不能出错,1%的错都会造成生命财产的损失,这就是金融大模型和传统大模型最大的区别。生成式模型它不能做解释,但是金融大模型最主要的模型叫做判别性,它需要做决策,交易决策。拿马上消费的风控来讲,我们有将近2000个模型,20万张表,每天都在变化,但环境不管如何发生变化,让我们的模型错一个,非常不容易,这就要做到可控、安全。这背后是因为马上消费作为以科技驱动的头部持牌消费金融机构,积累了1.79亿的用户,有超2000个模型,10万+变量,近50PB的多模态、高质量的数据等,通过在这些自身数据上做模型精调对齐训练,同时再用推理加速技术实现模型可控,从而相比其他企业更懂金融。马上消费首席信息官蒋宁在金融大模型论坛上演讲这方面,也引发了与会院士和专家的共鸣。关于安全的风险,中国工程院院士、浙江大学求是特聘教授谭建荣举了个例子,北京老太太接到远在美国孙子的视频电话,图像、声音都是孙子的,结果却被诈骗了,因此他说“人工智能时代,眼看的不一定是事实,大家要提高警惕。”而马上消费能探索金融大模型,说明了是行业的领头羊,有了数据和模型,才能从不确定的关系转变为确定的关系,从变量中找出不变量。中国工程院院士、浙江大学求是特聘教授谭建荣在马上消费大模型发布会上演讲而应对AI风险方面,全国政协委员、国际系统与控制科学院院士、重庆国家应用数学中心主任杨新民院士表示,随着大模型的开放开源,深度合成技术的非法使用存在加速积聚的风险。他特别提到了“与马上消费率先在金融领域进行原创性探索”,包括加强深度防伪验证系统,包括人脸识别及生物特征识别验证系统的活体检测、Deepfake伪造检测、对抗攻击与防御、深度学习可解释性等。全国政协委员、国际系统与控制科学院院士、重庆国家应用数学中心主任杨新民院士在马上消费大模型发布会上发布演讲针对提升大模型应用的可信实践,中国信息通信研究院副总工程师王爱华在致辞中表示“可信人工智能实践的路径逐步清晰。人工智能发挥作用越大,它对于安全可信的要求也是越高的。当从业者自身把安全和一些问题作为发展第一要务的时候,说明这个技术在整个领域会进行应用。”中国信息通信研究院副总工程师王爱华在马上消费大模型发布会上发表演讲三纵三横
“天镜”大模型四大核心应用场景亮相在“天镜”大模型发布会上,蒋宁表示,马上消费已形成“三纵三横”的大模型发展技术布局,并领航构建可信、合规、多模态、适配全域、泛化的金融大模型技术能力体系,聚焦行业领先的基础语言特性能力、逻辑和推理能力、语义理解、生成与创作、金融领域能力、安全与合规能力等六大核心领域,进一步推动金融数字化转型产生实质性的飞跃。所谓三纵,是指实时人机协作、多模态智能、数据决策智能,在数据领域实现智能化,实现结构性数据判别式模型的综合能力。三横即是指持续学习、模型合规、组合式AI形成安全、合规、可信的鲁棒性技术能力,确保让模型越用越聪明,同时更稳定、更安全可控。他表示:“我们希望在任何情况下,它给客户的回答,给所有的员工的回答是合规的,并且在任何不可预期的情况下它的结果是稳定的,这来源于马上今天几千个模型,上万个变量形成的模型。”欧洲科学院外籍院士、清华大学人工智能研究院 常务副院长孙茂松非常认可蒋宁的人机协同观点,他认为“大模型的基本定位还是智力劳动者的助手,它不会把一个行业整体取代。生成式人工智能的特点,它一定会出错。因为通用大模型对文本语言比较重视,对数字其实不敏感,所以ChatGPT有时候经常乱说,而金融数据很多都是结构化知识图谱,所以大模型在金融领域有很多挑战。马上消费做了一个很好的示范作用,开了一个好头。” 欧洲科学院外籍院士、清华大学人工智能研究院 常务副院长孙茂松在马上消费大模型发布会上发表演讲基于三纵三横,马上消费人工智能研究院院长陆全围绕引爆企业的数据潜能,打造全能数字员工这一核心,对天镜大模型在汇集智慧、唤醒知识、众创价值、数字分身四大应用场景进行了现场路演和解说: 汇集智慧方面,主要是应用在人工客服场景,通过大模型提炼萃取一线优秀人工坐席客服经验,汇聚成群体智慧,从而拥有一对多服务客户的能力,也可作为人工坐席的辅助角色,帮助推荐、优化回答。据悉,该模型已运行近3个月,意图理解准确率达91%,相较于传统AI的68%有较大提升;客户参与率61%,高于传统模型43%的参与率,也高于人工坐席平均28%的水平;马上消费人工智能研究院院长陆全在金融大模型发展论坛介绍天镜大模型唤醒沉睡知识主要是高效解决了提取、利用非结构化文档中的数据资料的痛点。例如,将企业招股书、财报、经济预测数据等文件上传后,天镜大模型可以深入解析金融领域专业术语、同时查询定位多个不同文档、洞悉金融图表隐含的信息和强大归纳总结能力;众创数据价值主要是为了降低使用数据的门槛。天镜大模型SQL生成平台不再需要代码等专业指令,可直接向AI 说大白话,天镜自动理解需求、展开检索、生成答复,按照人的意思去完成数据挖掘的任务。当前,天镜每日线上SQL生成数量650多次,线上SQL生成可执行比例53.4%,SPIDER标准数据集EX得分75.2,线上使用者满意反馈比例82.3%,表现领先行业。数字人方面,陆全希望打造的“数字外表+智慧大脑+情感内心”三合一数字人,擅理解,有温度,懂心理的智能秘书,或不休不眠的智能“打工人”。他希望能让每个员工都能轻松拥有自己的数字分身,上传自己的资料并定制一些参数后,只需5分钟的训练数据就可以生成“另一个我”,随时可以被唤起,成为人人都拥有的超级助手,代替员工完成大量工作。论坛上,蒋宁表示马上消费已经在金融领域跑出了“马上速度”,未来已来,马上消费将持续拓展虚实共生,做可信开放的数字融合体。据了解,本次论坛由重庆两江新区管委会、重庆市科学技术局、重庆市经济和信息化委员会、重庆市人力资源和社会保障局、重庆市地方金融监督管理局、重庆市大数据应用发展管理局、重庆市科学技术协会共同主办,马上消费、两江产业集团承办,北京中关村科金协办。}

我要回帖

更多关于 金融风控模型 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信