AI方法论 0.02秒拦截每笔风险交易背后的 慧安金科CEO黄铃 (ai的研究方法)
“落地时一地鸡毛。”
当前的人工智能,在金融领域的实地应用依然存在很多瓶颈。
但在不少人看来,如果没有AI,传统银行业或许在不久的将来,会像一个僵而不死的“巨兽”,虽然行动如故,但腐朽如影随形。
金融科技的出现,改变了这一现状。人们想知道,这些力量对金融而言,只是“流于表面”还是真有“洗髓伐骨”的功效?
为此,雷锋网《AI金融评论》策划了「AI能否解决金融刚需问题」系列选题,借同一个话题,对不同背景的受访者、产品和客群各异的企业们进行采访,期望在不同的商业和技术认知下捕捉观点碰撞的火花。
在首篇采访中,冰鉴科技CEO顾凌云分享了 AI金融产品是「鸡肋」还是「鸡腿」?》
本系列选题的第二篇文章,由慧安金科创始人/CEO黄铃讲述他眼中AI和金融之间的关系。
以下为黄铃的所感所想:
第一次POC,很紧张
第一次经历,总是最难忘。
在首次和大型股份制银行合作时,我们就遇到了颇为棘手的难题。
当时,这家银行希望将全部的海外交易数据进行风险评估。
我们需要对每一笔交易,做非常复杂的「特征提取」和「基于机器学习模型的风险评分」,并对高风险的交易进行预警和拦截。
而每笔交易留给我们处理的时间,只有0.02秒。
团队对整个流程进行了梳理,并进行了一系列测试。
首先,这笔交易是属于正常交易?还是银行卡盗刷?我们需要对交易的性质做出非常精准的判别。而不管是「特征提取」还是「模型评分」,都需要能够辨别交易是否属于欺诈。
于是,我们对大量的欺诈交易行为进行了分析学习,并将它在机器学习建模里体现出来。
当然,即使你做了很多交易行为的分析,算了几万个甚至几十万个特征指标,但是由于线上系统只有20毫秒,绝大部分指标都用不了。
所以我们又对大量的指标进行清理、组合和挑选,把它浓缩到几千甚至几百个指标,顺利的在0.02秒之内完成计算和评分。
为了同时满足准确率、覆盖率以及响应速度,我们从采集数据、发现欺诈行为、找到区分正常交易和欺诈交易的特征值到选择最具有代表性的特征,每一步都进行了大量的学习和分析。
当时,团队4~5人,整整经历了一个多月,才把整个流程和系统全部搭建完成。
这才最终使得我们赢得了这家银行的认可,中标了系统。
人工好,还是智能好?
早期的AI金融公司在投标时,客户时常会有这么一丝顾虑:人工经验好还是智能技术更好?
其实直到现在,这个顾虑在很多业务流程中仍旧存在。
其实人工和智能是互为补充的,具有完全不一样的属性。
人工,可以在自己已有经验基础上做非常复杂的推理,能够根据一些蛛丝马迹做复杂的关联和分析,挖掘出潜伏非常深、伪装特别像的风险 。
但是,人工也有几方面的问题。
第一,要成为一个非常有经验的专家,需要长时间的积累和沉淀。这样的人才非常稀少, 也很难培养。
第二,「人工」处理数据的“带宽”非常有限,一天只能处理几十个案件,发现很少的问题。
而对于机器智能来说,「人工」的劣势,恰恰是它的优势。它有足够的带宽处理海量的数据,还可以按照一些推理规则或者机器学习模型,帮助人们减少工作。
我们可以通过准确率、覆盖率这两个量化指标,对人工智能产出的效果进行全面评估。通过ROI来判断这个人工智能项目是否取得了良好的效果。
按照目前的发展来看,AI在人脸识别、文本识别以及我们在做的风控、合规和监管等场景,效果都非常好。
有些领域,AI的水平和能力甚至超过人类,比如风控合规监管,机器可以达到人类97%或者98%的水平。
但是相比人类,特别是非常资深的专家,AI的推理能力还是远远不够。
比如在智能风控领域,我们就遇到了许多复杂、具有挑战性的问题。
首先,在信贷风控中,存在着大量的欺诈分子,他们会使用多种变化的行为,来隐蔽身份,即使有经验的风控专家都不一定辨别出。
其次,我们需要用全面、多维度的角度分析,当一个人申请信贷的时候,还款能力如何?
如何使用数据、对数据特征分析以及如何把特征组合起来,产生一个准确高效的信贷风控模型,其实是非常有挑战性的,十分需要有经验的AI人才。
如何补齐AI的短板?这也是我们的重点研究方向。
如果人们对目标的定义不明确,会直接影响AI的实际使用效果。
如果是没有以前的历史标签数据,或者标签里有很多错误,AI要自主的去做学习挖掘,其实是非常困难的事情。
在这种缺乏足够先验知识的情况下,开发无监督和半监督的机器学习算法,是一种很好的解决方法。
如果我们可以针对一些特定的场景,比如说在风控合规领域,用「无监督学习」去分析大部分正常人的行为,然后用异常检测的方式,区分风险分子和正常人。
但是,在某些特定的场景下,AI金融产品确实满足不了客户的需求。
比如在金融产品智能营销领域,即使模型和推荐模型做的效果再好,也是很难通过少量的产品满足消费级用户的全部需要。
而在面对To B客户时,如何教育客户,让他们选择符合自己需求的产品,并为客户提供咨询服务是极为重要的。
首先,你得懂对方的业务,懂对方业务里的碰到的困难、问题和挑战。
第二,与客户沟通交流时,你需要用业务的语言,而不是用算法理论的语言。用业务的语言,给客户讲述我们是如何通过这些AI产品帮助客户解决痛点问题的。
我对行业的一些认识
在AI金融领域从业多年,我对金融业务和金融产品的理解在不断加深。
金融行业有非常多的产品,比如贷款产品,包括对公业务里保理、贴现、票据等。
以前,我们技术人员可能不理解它们背后的原理。但是,当你深入了解这些产品后,你会发现,它们的设计非常巧妙, 会让你耳目一新,学到很多东西。
不光是AI金融行业,AI在任何一个行业的落地,不只是一个技术问题,更是一个业务问题。
如果你想让AI的落地,真正通过技术解决客户日常业务中碰到的问题,你必须去了解客户的业务是如何运转的,它存在的挑战和风险是什么。
第二,AI实际上在不断的预测未来。
它不像我们过去做个模型,只要采集好静态数据预测就能很准确。
实际生活中数据是不断变化的,AI在这个动态的世界里需要不断的自我学习,才能持续准确的预测未来。
想要将未来预测的准确、稳定还可靠,是一件非常有挑战的事情。希望大家能做好准备,沉下心来脚踏实地,真正做一些能够稳定、持续预测未来目标的AI系统。 (雷锋网)雷锋网
原创文章,未经授权禁止转载。详情见 转载须知 。