今天给各位整理分享关于知识图谱信用卡的知识,其中也会对信用卡 图进行解释,如果能碰巧解决你现在面临的问题,别忘了关注收藏本站,现在开始吧!
本文目录一览:
互金风控进化史:人工、实地到智能大数据走过哪些曲折?
今天大家都已经习惯了线上秒批、数字信用等基于人工智能和大数据的风控体系。但是追溯到十几年前,数字风控却付出过惨重的代价。十几年一路走来,随着大数据以及人工智能等技术的不断完善,互联网金融才真正让大数据风控走向完美。
日前,在玖富集团开放日上,玖富首席数据科学家、首席风险官谷颖讲解了人工智能的应用要素和发展阶段,揭示了智能风控的进化史。
(玖富集团开放日)
从互联网金融祖师爷的垮掉说起
NextCard是互联网金融行业绕不过的一个案例。这家公司堪称互联网金融的祖师爷。NextCard总部设在旧金山,通过互联网发放信用卡的公司。公司提供一套VISA卡网上信用审批系统,并为使用者申请者提供互动服务。
(维基百科关于NextCard的介绍)
在这家公司的征信体系之中,信用资料较少的申请人,只需在这里存有一定额度的存款,就可申请到信用卡。和今天很多互联网金融项目相似,NextCard主打短平快借贷,在当时备受美国用户的喜爱。从1996年推出到2001年的第三季度,NextCard积累了120万个信用卡账户,未偿余额达20亿美元,其成本却比传统做法低70%。
NextCard几乎拥有今天互联网金融企业的所有特点,甚至今天很多中国互联网金融项目都与之相似。不过,遗憾的是,2002年9月,NextCard遭到联邦证券监察机构的调查并宣告破产。破产的最大原因是因为该公司的客户主要都是一些被其他信贷机构拒绝的消费者,导致欺诈、坏账的激增。
然而,NextCard把许多属于客户故意拖欠不还的普通信用坏账归为“欺诈”损失(“欺诈”损失被归纳于一次性损失,财务上不需要相应的储备金),它需要大量增加储备金来预备将来的信用损失,导致其丧失流动资金,不得不宣布破产。
回到15年前来看,NextCard错误很明显,主要是这三点:
1、在征信把关层面上就已经出现了漏洞
对于美国银行来说,影响审批额度的主要因素包括客户基本特征(包括男女、年龄、教育程度等等)、客户风险暴露情况(社会收入、债务情况、还债能力综合评估)、现有的社会表现(房贷还款情况、其他银行信用卡使用情况等)。但NextCard高估了人性,明显对用户的信用水准期待过高,忽略了信用欺诈的严重性,导致公司破产。
2、在风控层面上也缺乏合理的预警机制
按道理来说,在公司出现坏账时,应该加强储备金,以此抵御风险,但是NextCard几乎没有设置坏账红线,甚至也没有为坏账准备对冲风险的储备金,仅仅只是把坏账归纳为一次性损失,这样的损失过多的情况下,最终只会导致坏账如滚雪球一般越滚越大。
3、迷信线上审批,缺乏线下人工风控把关
在那个时代,线下人工把关是风控不可缺少的一环,很多小微企业的信贷甚至需要风控人员到现场查看生产现场,结合生产工艺,了解生产组织情况,固定资产更新情况。风控不仅仅是资本和金融层面的事情,更需要真正深入到产业之中,去了解一家企业的运行状况。显然,NextCard缺乏对线下的把控,以至于全盘皆输。
“人肉”风控的必不可少与逻辑悖论
NextCard的垮掉本质上是线上风控、征信技术有限,无法战胜人工的结果。在传统金融机构、小贷公司中,不仅仅有一整套严格的审核标准,需要贷款人提供各式各样繁琐的资料,而且风控人员甚至还会自己的经验判断,在面对一些特定行为特征、生活习惯的客户会首先有一个自己的直观打分判断,这些是长期经验累积的结果。想要拿到一笔贷款,金融机构、贷款公司会付出很高的人力、物力、时间成本。
玖富作为中国最早的互联网金融服务公司之一,如今已经有11年的历史,在行内颇受好评。这家金融服务公司当年为确保资产项目的真实、安全、可控,通过非常严格的完整审核体系的层层筛选,内部建立了独立的线上风控模型,并引入了实地征信风控合作。
不过,实地风控体系依然会存在各式各样的逻辑悖论。
对于金融企业来说,风控模型和风控体系需要非常有经验的金融从业人士来进行把控,比如说,银行的风控模型的出发点主要是测量借款方的还款能力,一般来讲,模型包含了两部分的评判,即客观性的和主观性的。客观性的主要是数据类型,能量化的。如公司的年度审计财务报告,银行流水,缴税金额等,这些数据放在已设定好的模型里就能给出个分数或等级,做为参考。
但光靠客观数据还不够,比如说这公司所在的行业是淘汰落后的行业(如钢铁、水泥等),那么评级可能需要有些降级,再比如说公司的管理人在该行业的经验年限的长短,都会影响到这家公司的风险,所以这部分就得靠人为主观的去做些调整。
因此,人在传统风控体系中起到了很大的作用。比如说,需要人工标记坏样本的方式来记录坏样本订单号,人工通过相关黑信息关联找出来的标记样本。系统设计是尽可能多的和并且尽可能精准的的收集到坏样本。
但是人毕竟是计算能力有限,而且对复杂的征信环境缺乏整体把控能力。在人工审核过程中,很容易出现样品偏差的问题。比如说,你发现骗子符合某些聚集特征,你指定策略1进行打击后,骗子的这种欺诈手段被控制,以后的损失案例都不具备这样的聚集特征。如果坏样本的收集时间在策略1上线之后,这个时候模型训练的结果极有可能出现满足聚集特征的风险低,不满足聚集特征的交易反而风险高,也就是说聚集特征的权重是负数。
另一个问题在于,金融行业的劳动力成本正在逐年上升。在传统金融尤其是传统信贷服务领域,我国传统信贷能服务的客户群仅占总人口的15%左右。传统信贷服务需要依托线下网点展开,资质审核、合同签订等流程都需面对面进行,服务效率低下,最终的结果是一方面风控人员不足,另一方面是单纯的线下人肉风控也缺乏对风控体系的百分百把控。
智能风控三阶段究竟解决了哪些问题
对此的应对方案是两个:一是引入在金融领域对于征信体系有能力建构一整套完整风控模型的人;第二个才是把大数据、人工智能引入到征信体系之中,进行智能风控。
今天BAT三巨头上手互联网金融的时候,几乎都在不断引入能够驾驭风控模型的人,以此根据不同行业,不同数据建构起不同的风控模型。玖富也在不断引入风控模型的把关人,比如说首席数据科学家兼首席风控官谷颖。谷颖博士在回国之前曾在华尔街投行工作达十年之久,其团队更连续六年在全美固定收益策略、量化研究领域排名第一。而且在一批成熟金融人才的研发下,玖富也构建起了“火眼”风控系统。
玖富的“火眼”风控系统形成了线上化、机器化、模块化的风控构架体系。充分利用大数据分析技术建立独特的风控体系,具有处理高效、风险可控、成本低、边际效应明显等特点,能够可以提早发现用户早期逾期表现,并能有更多的时间进行调整。
根据她的说法,人工智能应用在金融领域有三个阶段。第一个阶段是机器学习(ML)阶段,即互联网金融为代表的金融机构全面渗透到所有模型建设中;第二个阶段是自然语言处理(NLP)阶段,即国内大量互联网贷款和征信公司都在大量使用自然语言处理技术;第三个阶段是知识图谱(KG)阶段,即大量使用知识图谱进行反欺诈分析。“火眼”风控系统恰恰覆盖了这三个阶段的所有应用,也是目前比较完善的风控系统。
机器学习(ML)阶段解决的核心问题在于,让风控模型自动学习、自动匹配各项数据,在模型内发现异常,揪出信用黑户。尤其是机器学习算法能够根据数百万消费者案例,如:资产、履约、身份、偏好、社会关系及借贷情况等进行开发和训练,利用算法评估预测用户是否会违约、是否会按时归还贷款等。
自然语言处理(NLP)阶段解决的问题则是可以在个人及企业主页、社交媒体中发现蕴含着与违约风险深度关联的深层含义,通过复杂的词向量模型将文本转化为计算机能够识别和计算的词向量表征,并基于深度学习技术对其进行特征提取,最终运用成熟的分类器网络将文本数据与违约风险实现高度的风险挂钩,而通过传统方式很难充分挖掘其风险价值。
知识图谱反欺诈(KG)分析恰恰是最重要的一个环节,因为知识图谱反欺诈需要把所有技术融合在一起,构建图谱,从中发现欺诈行为。这也是很多互联网金融公司目前在主攻的方向。
因为在过去,反欺诈人员需要根据借款人提供的信息,查找多方面资料,进行不同属性的比对,从而发现不良征信人。这种工作复杂而枯燥,为了识别团伙欺诈,往往需要收集、整理、分析各种维度的数据,工作量更是成倍增加。而知识图谱反欺诈能够把把每个客户的信息、以及网络上公开的信息织成一张巨大的关系网,并通过可视化的图形将这种关系展示出来。结合反欺诈部门的经验,找存在欺诈的客户。
写在最后:
虽然如今大部分平台都在采用“大数据技术”来做风控,但审核结果严重趋同,现状不容乐观。真正大数据风控技术需要多云数据源(平台积累、征信机构、同业共享)来支持风控审核模型决策,这恰恰是中国互联网金融企业最需要发展的方向,也是必然需要走过的曲折道路。
中腾信如何利用知识图谱技术,实现风险管理中的实时应用?
中腾信的金融科技实力提升从应用效果来看知识图谱信用卡,公司自主研发的知识图谱技术知识图谱信用卡,可以有效识别传统类型的欺诈团伙,知识图谱实现了在中腾信风险管理中的实时应用,为欺诈风险防控、信用风险管理提供了新维度,特别是可以对传统类型欺诈团伙的有效识别,提升了风险管理能力;针对近百亿级多种维度的数据进行处理以及社区发现算法的优化,实现了贷前应用秒级响应;划分了数万个网络社区,并对好坏社区进行分类处理,能够支持客群组合管理、额度管理等方面的正面及负面应用;对存量客户实现了多度关联关系的识别;基于社区的关联关系生成了上百个关键社区变量用于风险规则设置及评分模型优化等等。
大数据与商业决策关系
大数据与商业决策关系
今天,我们正处于决策成本产生巨变的爆发点,过去那些想尽办法都无法获取的数据,在今天唾手可得,而当有些表面上完全不相关的行业数据关联起来时,居然产生了新的商业价值。更重要的是,过去,我们更多地是带着问题去寻找能够验证自己观点的数据,而今天我们却可以使用数据去预测可能出现的问题。海量数据可以使人的智慧得到更大的发挥,并变得更加规模化。大数据的本质是人,数据研究的极点就是莫测的人性。我们一旦掌控了数据之后的数据,就会拥有制胜未来商业的无敌利器。
假定数据是脏的
在处理数据的时候,会像污水处理厂一样,每一步都问自己要如何处理这些污水。这种情况的出现,到底是因为数据源脏了,还是因为数据提炼过程做得不好?美国有一家初创公司,专注于与地理位置相关的数据收集、整理和查询服务。它将地理位置的相关指标,按照酒店和旅馆等属性划分为不同细类,对外提供基于位置信息的实时查询,为包括美国最大点评网 Yelp在内的多个知名应用提供底层数据服务。
这家公司最令人印象深刻的是,它对于所收集来的数据会提供一个数据质量评分,以反映数据的可信度和质量水平。它会对这些数据的源头以及对处理数据阶段所用的算法进行评分。也就是说,这家公司在提炼数据的每一个阶段都进行了数据化管理。
这家公司的做法让我们看到了一个趋势,也是一个非常重要的趋势。因为它首先已经接受了数据源肯定是脏的和数据源一定会被污染的事实。所以,它在处理数据的时候,会像污水处理厂一样,每一步都问自己要如何处理这些污水。这种情况的出现,到底是因为数据源脏了,还是因为数据提炼过程做得不好?这个过程我们一定要区分,而且这样的区分是可取的。这家公司是假定数据是“脏”的来做数据管理,而不是假定数据是稳定的。而且,假定数据是“脏”的来处理数据,在大数据时代将是一个非常重要的趋势。
事实上,我们今天在处理的大数据,依然只是冰山一角,而更大的数据都隐藏在我们的语言中,比如我们说的话和写的字。所以,将来我们要准确地从互动中抓取数据,也一定要依赖对自然语言的处理。现在,美国的很多数据研究人员都在瞄准非结构性数据,即语言处理这一领域。
学会慢慢淡化数据
数据是有优先值的,在数据中有些是特别核心的,有些即使缺失了也没有多大问题。所以,我们要学会真正坐下来盘点那些对公司最有价值、对用户最有价值的数据。
想要确定数据的优先值,就要先解决以下几个问题。
一是数据的标准化。在大数据时代,我们需要一个标准化的东西供我们进行交流。二是我们到底如何对接和交换数据,如何在交换的时候保持数据的稳定性。比如自然语言,比如在无线和 PC不同场景下受到的影响,这些情况都会滋生出许多新问题。第三个重要的问题是数据的存储,这将涉及数据的时效性这一问题。有人曾经提出过一个很有价值的观点,即现实中,网站最大的场景变化就是网站改版。因为重新设计网站,本身就影响数据,比如公司的详情页和首页,任何改变都在影响数据。如果在 1~3年后,你才说得出数据的这一改变是由于促销、用户行为或是改版引起的,那这一数据就已经没有任何价值了,这就是数据的时效性。所以,美国出现了一个概念叫数据淡化( Data Decay),意思很明显,数据会慢慢淡化。我们要更清楚地认识到,数据是有优先值的,在数据中有些是特别核心的,有些即使缺失了也没有多大问题。所以我们要学会真正坐下来盘点那些对公司最有价值、对用户最有价值的数据,这是一个非常重要的趋势。
重要的是数据和数据之间的关系,而不是数据本身
大数据价值的实现,在于数据与数据的连接。
Google做了一件非常惊人的事情 —— Google甚至能在不明白某个网页语言的情况下,知道其内容是什么。试想一下,如果你懂俄语,看出俄语网页里在讲什么当然很简单。但是,如果你仅仅通过看字词的排列和网站的分类,就知道网页的内容,这是不是很令人惊叹?
这就是知识图谱,它是一个无穷无尽的世界。事实上,知识图谱并不是数据,而是数据和数据之间的关系。但这里有一个非常大的弊端,就是数据的储藏量非常大、储存的方法也很复杂,且稍微改变一点点关系的定义,整体就会产生巨大的变化。
比如说,有一个知识图谱在说电商平台用户之间的关系,那数据信息就非常庞大了。试想一下,今天电商平台里有多少个用户跟你有关系?假如说有 25个人,那么 25个人的关系就演变成了 25×25条关系。这时候,我再问你“什么是关系”、“见过就算关系,还是一起买过东西叫关系”的问题就具备了一定的难度。
关系建立的维度是无限大的,而且定义稍微改变一下,整个存储和整个数据库都会发生变化。所以,知识图谱的把控是有难度的。举个贴近我们生活的例子,比如说银行很早之前就给你开办了信用卡,决定银行这一决策的不是你的个人关系而是总关系。银行决定是否贷款给你,是要看你爱人做什么职业以及你家中其他人的经济情况如何。当这种种关系关联起来时,就会产生一个极为重要的知识图谱。
以往我们谈大数据时候的本钱,莫过于“我有这种数据,你没有”。在未来,数据和数据之间的关系才是重中之重,而不是单纯的数据本身。
以上是小编为大家分享的关于大数据与商业决策关系的相关内容,更多信息可以关注环球青藤分享更多干货
北京知识图谱科技有限公司怎么样?
简介:北京知识图谱科技有限公司成立于2017年,公司主要业务是基于自己核心的知识图谱平台技术开发面向行业的人工智能产品服务,目前已在(公检法、军事、科技)情报分析、智能金融、智慧司法、农业健康智能问答、智能客服领域进行产品的开发和推广。公司技术覆盖从数据采集到数据清洗、知识提取、知识表现、知识推理、动态本体建模存储、关联分析、可视化、问答系统、语义检索等知识图谱核心技术。
法定代表人:吴刚
成立时间:2017-05-31
注册资本:108.696万人民币
工商注册号:110108023525668
企业类型:有限责任公司(自然人投资或控股)
公司地址:北京市海淀区中关村大街18号B座9层909室342号
知识图谱信用卡的介绍就聊到这里吧,感谢你花时间阅读本站内容,更多关于信用卡 图、知识图谱信用卡的信息您可以在本站进行搜索查找阅读喔。
还没有评论,来说两句吧...