比赛内容:
本届挑战赛共设置了三道创新赛题:''拒绝推断"、''特征挖掘"、''多金融场景下的模型训练",赛题全面涵盖了机器学习、迁移学习、知识图谱、文本挖掘等多个支撑金融服务的技术领域。融360为大赛开放了千万级的海量脱敏数据,旨在给竞赛选手带来真实业务场景下的实践体验。
无论从赛事的设计理念,还是到对技术考察的把握,本届比赛都将对学界和业界产生非常重大的参考意义。
赛题一:拒绝推断
【技术领域】半监督学习+迁移学习
在金融信贷场景中,机构只向通过审核的用户放款,也只能获得放款用户的还款情况,却无法观察到大量拒绝用户的还款情况。在模型验证过程中,不能检验模型对拒绝用户的判别能力,而且随着迭代,样本会越来越偏离总体用户的真实情况。导致模型失效,大量坏账出现,直接带来巨大经济损失。因此,在真实观测数据有偏的情况下,如何保证模型对放款用户和拒绝用户都有良好的排序能力,是亟待解决的问题。
分析任务:
1、 处理用户征信数据,提取数据特征;
2、 根据样本特点,抽取合适的训练集进行建模,保证模型在训练数据和验证数据的效果。
赛题二:特征挖掘
【技术领域】知识图谱+文本挖掘
融360是中国最大的网络贷款平台,一端连接贷方的上亿个小微企业和个人消费者,另一端连接借方的数千家金融机构和数十万款金融产品。除了撮合借贷业务之外,平台最重要的职责之一,就是提供必要的风控服务:对用户的逾期情况的判断。
分析任务:
1、 处理用户行为表现数据,筛选显著入模特征,解释特征的生成方式及意义;
2、 利用特征建模,精确预测用户的逾期还款情况。
赛题三:多金融场景下的模型训练
【技术领域】数据挖掘
在业务中,融360积累了不同时期、不同金额、不同期限、不同利率、不同市场环境下的大量借贷订单。所以融36
来源【首席数据官】,更多内容/合作请关注「辉声辉语」公众号,送10G营销资料!
版权声明:本文内容来源互联网整理,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 jkhui22@126.com举报,一经查实,本站将立刻删除。