金融领域的几个行业巨头正在积极实施机器学习技术,以改进运营并指导多个部门的战略。迄今为止,机器学习算法已在该行业中用于检测欺诈、补充传统信用评分、评估贷款申请、预测客户流失、自动执行通信以更有效地为客户提供服务以及识别股票市场交易模式。
一些公司已经在其机器学习工作中每年节省了数十万个工时,而其他公司尚未部署模型。目前,机器学习仍然是一种“锦上添花”的技术,但很快就会成为保持竞争力的必备技术。您可能已经围绕实施机器学习程序进行了一些对话,但您应该从哪里开始呢?以下是金融机构正在实施的机器学习的四个应用。
1. **欺诈检测**
机器学习在金融领域最常见的应用之一是欺诈检测。欺诈检测算法可用于在几秒钟内解析来自数千条交易记录的多个数据点,例如持卡人身份数据、卡片发行地、交易发生时间、交易地点和交易金额。为了实施欺诈检测模型,在数据集中应该已经存在多个准确标记的欺诈实例,以便对模型进行适当的训练。一旦模型在交易数据中检测到异常,就可以编程通知系统,以便在模型识别可疑交易的瞬间提醒欺诈检测服务。
欺诈检测是一种异常检测算法。这些算法也可以应用于公司其他领域的 数据集,以服务于不同的目的,例如网络入侵检测。这就是一些公司发现投资企业数据科学平台比购买现成模型或针对性分析解决方案更有价值的原因之一。
2. **信用评分**
许多贷款机构看到了开发定制信用评分模型的好处,这些模型利用机构自己的客户活动数据来更好地预测授予新信贷额度的风险或机会。通过这样做,他们可以减少因贷款冲销、利息收入延迟以及试图收取逾期付款的维护成本而产生的逾期成本。
为了保持最准确的信用评分,随着有关逾期付款或新债务的新的数据的获取,客户会不断地重新评估。机器学习算法用于在新的数据输入时更新这些分数。信用评分算法本质上是预测算法,应使用过去贷款的数据进行训练,前提是存在足够好的和坏的贷款数据来有效地训练它们。这些预测算法也可以在宏观层面用于评估风险并预测市场走势。
3. **自然语言处理用于合同**
近年来,许多自然语言处理(NLP)算法是使用Python开发的。对于金融机构来说,NLP算法可以被训练来阅读和解析合同,从而减少数小时的重复性劳动。摩根大通开发了这种文本挖掘解决方案,他们称之为COIN(合同情报)。COIN通过解析文档以查找某些词语和短语来帮助分析商业贷款合同,每年为公司节省360,000个小时。
4. **自然语言处理用于客户反馈**
NLP模型被构建并应用于社交媒体、电话转录和客户服务聊天平台上的客户通信。NLP可用于分析评论以了解情绪和意图。通过NLP,机器可以对客户反馈进行分类,以帮助银行和金融机构更好地了解客户的整体情绪,大多数投诉的内容以及发现模式以识别改进领域。它们还可以被训练识别问题模式,以便在它们发展成影响更多客户的大规模问题之前就解决它们。
跟上创新的步伐
最先进的机器学习算法几乎总是在开源社区中创建(如视觉和音频数据处理)。这个社区的创新速度之快,使得数据科学家能够访问开源包和库变得必不可少。那些希望支持和执行上述用例的组织现在正在将他们对开源社区的了解和喜爱运用到实践中,并通过一个集中管理、可扩展的**开源数据科学平台**赋能其数据科学家进行协作和部署。这使他们能够将模型适应其独特的业务案例,并从少数模型扩展到数百名数据科学家,拥有数千个模型。