BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

您现在处于全屏预览
关闭全屏预览

计算广告技术之大数据下的短文本相关性计算
录制于:

| 作者 王峰 关注 0 他的粉丝 发布于 2015年7月13日 | QCon北京2018全面起航:开启与Netflix、微软、ThoughtWorks等公司的技术创新之路!

亲爱的读者:我们最近添加了一些个人消息定制功能,您只需选择感兴趣的技术主题,即可获取重要资讯的邮件和网页通知

32:24

概要
在计算广告系统中,尤其是搜索广告系统中,每次广告的展示都会涉及到用户、客户以及媒体三个实体间利益的平衡。虽然这三者利益的表述和评价在形式上会有很大的区别,甚至从表面上看还会存在一定的矛盾,但是从基础上来看,三者的利益最终在相关性上达成了一致。相关性高的展示不仅可以提升用户的搜索和浏览体验,而且也会提高客户广告的转化效果ROI,进而推动媒体、搜索引擎广告收益的提升。在广告系统相关性中,最核心的问题就是查询和关键词的语义相关性计算。然而,受到计算文本过短、文字歧义较大、长尾问题过多、准确率和覆盖率要求过高等因素的制约,用户查询词和广告之间相关性计算问题对于从业的算法设计人员来说始终是一个巨大的挑战。本报告就搜狗搜索广告团队实际经验,对广告系统中短文本相关性的常用计算方法以及在广告系统中的具体应用进行分享和探讨。

个人简介

王峰, 搜狗搜索广告研发部高级经理/资深研究员, 硕士研究生毕业于清华大学计算机系。在搜狗从事搜索广告相关策略研究多年,主导完成了搜狗搜索广告展现核心策略系统的搭建,见证并主要参与了搜狗商业产品从无到有、从有到强的过程。目前在搜狗负责PC搜索广告展示研究的工作,承担着搜狗最大变现产品线PC搜索产品线的主要策略技术支持,职责包括广告召回和相关性计算、点击率预估、个性化策略以及搜索竞价机制设计等相关工作。对于互联网营销,尤其是搜索引擎广告中涉及的相关核心技术有较深的理解。在文本相关性、自然语言处理以及大规模数据挖掘和机器学习算法设计和实现方面,尤其是在实际系统的工程实践中算法的应用和调优有着丰富的经验。

QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、杭州、旧金山召开。自2007年3月份首次举办以来,已经有包括传统制造、金融、电信、互联网、航空航天等领域的近万名架构师、项目经理、团队领导者和高级开发人员参加过QCon大会。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT