揭秘阿里价值百亿的深度学习算法

深度学习
深度学习
编辑 | 陈思

阿里妈妈是阿里巴巴集团旗下的,国内领先的大数据营销平台,拥有阿里巴巴集团的核心商业数据。每天有超过 50 亿推广流量完成超过 3 亿件商品推广展现,覆盖高达 98% 的网民。智能数字化营销是阿里妈妈重要的营销形态,其实数字化营销并不只是我们普遍认为竞价词拍卖、搜索推荐等技术,在这个社交数据爆炸的时代,我们完全可以利用 AI 技术加上大数据分析,从用户的更多数据中分析用户的行为,记录他的喜好,这也是 AI 技术在工业界成功的应用场景之一。机器学习技术的应用改变了数字化营销的效率和形态,阿里妈妈结合机器学习、深度学习等人工智能技术,在内容理解、用户理解、用户行为预估、智能出价、商品周期优化等方面进行数字化营销的技术和业务创新。

作为推动工业级深度学习应用的先行者之一,阿里妈妈从 2015 年开始一系列探索,并在 2016 年尝试了第一代深度学习算法,在后续几年里,深度学习算法模型不断更新迭代,为阿里妈妈带来了大量红利。以阿里妈妈定向广告场景为例,深度学习算法直接带来的收入增长红利在 2018 年就已经超过百亿。

关于深度学习和机器学习在阿里妈妈内部的应用,InfoQ 曾经采访过 阿里妈妈深度学习算法平台负责人朱小强老师。他提到人工智能技术在互联网行业核心业务实践应该分为两个阶段。第一阶段从 2010-2015 年之间,机器学习技术在谷歌、百度等这样的大公司开始赋能业务,规模化落地。但这个过程中大家发现工业界的数据规模实在太大了,企业需要付出很高的成本去训练算法模型,所以后来出现了大规模分布式机器学习架构和 Hadoop、Spark 等大数据架构的兴起。

第二阶段是 2016 年初开始,以广告、推荐和搜索为代表的互联网公司开始发现,新一轮爆发于学术界和传统 AI 领域(如语音、图像等)的深度学习浪潮,也给互联网技术带来了全新的机会。

过去的机器学习模型本身相对来讲比较固化和简单,还是偏重以人工先验设计加工的数据模式为主,但这一代的深度学习技术带来了更彻底的变革。首先深度学习本身的模型容量更大、变化更丰富,可以针对具体的场景数据进行模型的自由定制;其次,模型的设计变得更加简单,基于标准化的深度学习训练框架可以非常容易地实现一个全新的算法模型并进行大规模的分布式训练,普通的算法工程师就能轻松完成这个过程。而在以前的大规模机器学习阶段,需要非常强大的专业团队花费大量时间才能定制式地研发出一个工业级可用的新模型算法;此外,当模型训练出来之后,现在已经有一个非常体系化的流水线来支持任意复杂算法模型快速部署到线上提供服务。

阿里妈妈从 2015 年底开始进行工业级深度学习的探索,2016 年启动大规模深度学习框架以及算法的研发,到 2017 年的时候,阿里妈妈已经走在了深度学习的主航道上面,核心算法已经全部深度学习化,取得了显著的发展。这成为了业界的一个技术样本间。今天业界很多企业在看到了这条道路的可行性后,也纷纷跟随头部企业的脚步、开启了大规模的深度学习技术升级的浪潮。

在今年 11 月的 AICon 全球人工智能与机器学习技术大会 上,朱小强老师将会来到现场跟大家分享深度学习技术在阿里妈妈内部的发展现状。作为现任阿里妈妈深度学习算法平台负责人、兼任定向广告 & 信息流广告排序技术团队负责人。他主持了三代核心算法架构(大规模、深度端到端、深度实时化)的设计和落地,驱动了深度学习对阿里广告技术的全面变革与创新,领导了阿里开源深度学习框架 X-DeepLearning 从 0 到 1 的自研、从 1 到开源演进的全过程。相信到时他一定会带来很多技术干货,感兴趣的朋友可以点击下方 “阅读原文” 了解详情。

标签
推荐