BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Google Play的应用发现,第2部分:使用相关App的个性化建议

| 作者 刘志勇 关注 3 他的粉丝 发布于 2017年2月14日. 估计阅读时间: 5 分钟 | AICon 关注机器学习、计算机视觉、NLP、自动驾驶等20+AI热点技术和最新落地成功案例。

本系列的第1部分中,InfoQ翻译并分享了如何利用机器学习深入了解与App相关的主题的讨论,以便在Google Play应用商店上提供更好的搜索和发现体验。在这篇文章中,Google Play小组的软件工程师Ananth Balashankar、Levent Koc和项目主管Norberto Guimaraes讨论了一个深度学习框架,以根据用户以前下载过的App和他们所用的App上下文为用户提供个性化的建议。

Google Play应用商店的访问者提供有用且相关的应用推荐是我们应用发现团队的主要目标。然而,对与App相关联的主题的理解仅仅是创建最合适用户服务的系统的一部分。为了创造更好的整体体验,还必须考虑用户的品味并提供个性化的建议。如果没有,“你也可能喜欢”的建议对每个人来说看起来都一样!

发现这些细微差别需要了解App的功能,以及App与用户相关的上下文。例如,对于狂热的科幻游戏者,类似的游戏推荐可能是感兴趣的,但是如果用户安装健身App,则推荐健康食谱App可能比五个以上的健身App更相关。由于用户可能对下载已经安装的App或游戏的补充更感兴趣,除了根据与App(“类似App”)相关的主题提供推荐内容外,我们还会提供基于App相关性的建议(“您可能也喜欢”)。

在决定安装决定之前(左)和当前安装正在进行(右)时,您可能还会看到类似的App和App建议。

一个特别强的上下文信号是应用相关性,基于先前的安装次数和搜索查询次数。作为示例,已经搜索并且玩很多图像密集型游戏的用户可能偏好图像密集型的App,而不是更简单的图形应用。所以,当这个用户安装赛车游戏时,“你可能也喜欢”的建议包括与“种子”相关的应用程序(因为它们是图像密集型的赛车游戏),排名高于赛车App和更简单的图像游戏。这允许个性化更为精细,其中App的特性与用户偏好更为匹配。

要在建议中包含这个App的相关性,我们采取双管齐下的方法:(a)离线候选生成,即除了所讨论的App之外,其他用户已经下载的潜在相关App的生成,和(b)在线个性化重排序,其中我们使用个性化ML模型重新排序这些候选。

离线候选生成

找到相关App的问题可以被表示为最近邻搜索问题。给定一个App X,我们想找到k个最近的App。在“你可能也喜欢”的情况下,一个简单的方法是基于计数的方式,如果许多人安装App X和Y,那么App Y将被用作App X的候选种子。然而,这种方法很刺手,因为在巨大的问题空间中难以有效地学习和推广。由于Google Play上有超过一百万个App,可能的App对总数超过〜。

为解决这个问题,我们训练了一个深层神经网络,以预测用户在安装之前安装的下一个App。在这个深层神经网络的最后层的输出,嵌入通常表示给定用户已经安装的App类型。然后我们应用最近邻算法来找到在训练的嵌入空间中给定的种子App的相关App。因此,我们通过使用嵌入表示App来修剪潜在候选的空间来执行维数降低。

在线个性化排名

在上一步骤中生成的候选表示沿着多个维度的相关性。目标是向候选分配分数,使得它们可以以个性化的方式重新排名,以便提供被制作成用户的整体兴趣并且仍然保持用户安装给定App的相关性的体验。为了做到这一点,我们采取应用候选人的特点作为输入到单独的深层神经网络,然后使用用户特定上下文特征(区域、语言、应用商店搜索查询等)实时地训练用户以预测相关App与用户特定相关的可能性。

个性化相关App的架构

这项工作的一个好处是,重新排序内容,如相关的App,是应用商店实现应用发现的关键方法之一,可以为用户带来巨大的价值,而不影响感知的相关性。与控制(没有重新排名)相比,我们发现App安装率从“您可能也喜欢”的建议中增加了20%。这没有带来用户可察觉的延迟变化。

在本系列的第3部分中,我们将讨论如何使用机器学习来阻止那些试图操纵我们用于搜索和个性化的信号。


感谢杜小芳对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

问题 by Li Eric

这句是什么意思?“小芳请注意,这个数字,排版可能会丢失,请提请文强注意这点”

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

1 讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT