朱明杰:“降维”使用搜索技术,为金融用户画像 |“35 岁以下科技创新 35 人”中国榜单专栏

bigdataway 提交于 周一, 04/16/2018 - 17:57

自 1999 年起,《麻省理工科技评论》每年都会推出“35岁以下创新35人”(Innovators Under 35)榜单,旨在于全球范围内评选出被认为最有才华、最具创新精神,以及最有可能改变世界的 35 位年轻技术创新者或企业家,共分为发明家、创业家、远见者、人文关怀者及先锋者五类。

2017 年,该全球权威榜单正式推出中国区评选,并已公布并首届评选结果。现在,《麻省理工科技评论》正式开设“35岁以下创新35人”中国榜单专栏,以人物报道的形式帮助中文读者了解这些来自中国的新生代科技力量。

朱明杰·远见者

从神童到AI金融风控先锋

获奖年份 :2017年

年龄 :34 岁

职位 :氪信创始人兼 CEO

获奖事由 :结合高维数据处理和机器学习技术,融合大型金融场景打磨形成的强大知识系统和经验,提出场景化风控解决方案和产品体系,以超越人工定义的深度及广度对数据进行价值挖掘。

“风控”是银行等金融机构的命门,在中国蓬勃崛起的信贷市场,传统的人工风控审核方式不仅效率低,而且可以参考的信息维度有限,朱明杰也许是将AI在金融行业落地的风控第一人,将顶尖的数据挖掘能力从互联网领域迁移到金融行业。

考入学霸云集的中国科学技术大学少年班,似乎只是学生时代的朱明杰永远处在金字塔尖惯性的延续——从小学到高中永远第一名,屡屡斩获物理、数学竞赛奖项,最终高考“考砸”也没跌出省前五名的范畴。

中科大少年班是中国科学界的传奇,从1978年开始招收早慧少年,出现过大量行业领袖,除了科学家,互联网领域的代表还有百度总裁张亚勤、百度联合创始人马东敏等。

真正进入计算机这个行业,是2004年朱明杰大学毕业,进入另一个高手云集的团体,走出无数顶尖华人计算机科学家的微软亚洲研究院(MSRA)。

作为少年班系唯一的入选者,他成为微软亚洲研究院和科大第一届联合培养的计算机博士,开始“一边写代码一边发论文”。在微软研究院的几年,正好见证和参与了信息时代两大巨头AI对决的战役。

当时,谷歌用机器取代雅虎的人工搜索,占领了互联网时代的信息入口,微软All IN最优秀的人才发力搜索,朱明杰开始在老师沈向洋博士领导的团队里追赶谷歌。朱明杰注意到一篇文章介绍谷歌并没有把机器学习用在搜索核心的排序上,将文章转给同事并引起热议,其后,微软在互联网的海量数据集上用机器学习的方法,快速赶上了谷歌的排序精度, 这场搜索的战争最终造就了今日的谷歌和Bing搜索,而朱明杰收获了与顶级计算机科学家和工程师合力打造全世界最大的AI系统的经验。

理解知识和语义,构建知识图谱是建造AI系统的核心。博士毕业以后,朱明杰远赴德国师从知识图谱的泰斗、国际大规模数据库协会的的主席、马克思普朗克研究所计算机科学研究所所长Gerhard Weikum博士,研究大规模语义图挖掘。

虽然继续做学术研究,但一边是谷歌和facebook真的改变了世界,一边是国内BAT日渐壮大,朱明杰在计算机研究方面的注意力慢慢转向工业界—— 他发现学界研究的趋势开始跟着工业走,互联网业界的冲击让他下定决心,回国,撸起袖子,弄脏手,投身工业界。

图丨《麻省理工科技评论》“35岁以下科技创新35人”中国榜单颁奖典礼上的朱明杰

2010 年,朱明杰加入雅虎中国,担任北京研究院搜索科学团队负责人,领导雅虎搜索机器学习平台核心算法工作,支撑雅虎搜索和广告的机器学习排序、用户意图理解以及个性化系统。雅虎之后,他主导了eBay搜索机器学习排序到产品优化提升工作,后又组建了携程大数据部门用以提升业务智能化水平。

在互联网巨头工作的日子,朱明杰感到互联网的数据应用已经很充分,但是通过数据提升效率在传统行业还有很多机会。 于是,在 2015 年,他创立了一家布局金融风控业务的人工智能企业——氪信科技。

朱明杰发现,与美国等发达国家不同,中国的金融服务市场非常庞大, 但其中具备征信数据、能够让金融机构“放心服务”的人群占比很低。 他创立氪信科技的初衷,是通过数据和人工智能的手段去刻画中国众多还没有得到合适金融服务的人的金融画像,从而为金融机构和企业提供基于金融风险预测和产品精准营销的能力,使他们在大幅降低信贷审批成本、提高通过率的同时,降低逾期率,并更好地理解这部分原“白户”人群,最终使更广泛的人群得到相应的金融服务。

图丨朱明杰

之所以在创业时选择金融科技领域,是因为朱明杰相信技术必须要到商业环境里检验其价值。金融行业已经沉淀了大量数据、在金融最核心的风控领域AI相比人工的优势明显,人工智能似乎能在此最快落地,产生实际价值。

近年来崛起的互联网金融,以下沉的客群和激增的规模搅起了信贷领域的变革,也对金融机构的风控能力提出更高要求:市场方面,客户行为与金融风险频繁演化;客群下沉,对新客户知之甚少;业务量巨大,人工大规模审批成本高企;线上获客,欺诈成本低;群体欺诈多,有组织、有规模团伙进攻频发。技术角度,传统方式处理互联网的海量非结构化、稀疏的弱金融数据,难以充分挖掘数据的金融价值,同时传统模型迭代周期长、耗时久,难于有效应对金融市场快速变化,这些困扰严重制约金融机构的展业和业务能力升级。

针对上述问题,氪信的策略是使用他们的AI引擎,产生出人工不能加工的特征,同时投入大量的时间和积累建立金融领域的全域知识图谱。金融系统的图谱可以将不同来源的数据整合起来,把过去大量没有用上的数据和金融的表现联系起来,构建反欺诈和风控引擎。

对朱明杰来说,他最关心的,是通过自己的实践,让每一个人在有金融需求时都能以合适的价格,享受到及时的、有尊严的、方便的、高质量的金融服务。

分类