BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

李海鹏:创业公司要寻找技术驱动与业务驱动的平衡点
录制于:

| 受访者 李海鹏 关注 1 他的粉丝 作者 InfoQ 关注 13 他的粉丝 发布于 2016年7月28日 | QCon上海2018 关注大数据平台技术选型、搭建、系统迁移和优化的经验。
16:56

个人简介 李海鹏 (Leo Li) 拥有丰富的互联网行业大数据相关的实战经验,热衷于利用数据和技术来解决商业问题。作为现任LinkedIn资深经理,Leo带领团队开发的数据产品,对LinkedIn营收的高速增长做出了巨大的贡献。在加入LinkedIn之前,Leo曾负责Amazon在线显示广告平台的产品设计,以及互联网广告平台类初创公司的商业智能和运营。

QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、杭州、旧金山召开。自2007年3月份首次举办以来,已经有包括传统制造、金融、电信、互联网、航空航天等领域的近万名架构师、项目经理、团队领导者和高级开发人员参加过QCon大会。

   

1. 各位InfoQ的网友大家好,现在我们是在QCon2016北京现场,作客专访间的是LinkedIn的李海鹏!第一个问题是这样,现在有一种趋势,很多公司的招聘已经倾向于在GitHub上面寻找人才,而不单单依靠简历形式。请问这种招聘方式会给linkedln带来哪些影响?

李海鹏:这是非常好的一个方向,linkedln做的事情是一个平台,我们的愿景是为全球的职场人士提供服务。这两者并不是冲突,而是更加融合的过程。我也看到越来越多的程序员愿意把自己的github放到linkedln上面做展示。从垂直的领域角度来讲,linkedln是作为professional social network平台跟垂直招聘细化会并行。所以我觉得这是一个很好的趋势,能够更多的帮助公司找到更好的程序员。因为原来通过面试很短暂的过程很难发掘一个人的所有潜力,原来很多公司从opensource project的committer里面招人,这都是一样的,从公司角度来看两者是相辅相成的关系。

   

2. 目前linkedln有没有新的数据产品推出的计划?

李海鹏:linkedln作为一个公司,每次推出的产品都是以数据为主的数据产品,包括从招聘解决方案到营销解决方案、到销售解决方案,到最后会有一个学习解决方案,这是我们去年收购Lynda.com以后,后续会推出这样的产品和服务,具体时间只能等待公司的发布,但是我希望这个产品能够帮助更多人学习到更多技能和知识,让他们在职场上更加进步。

   

3. 这个产品会采用哪些比较前沿的技术进行产品的开发?

李海鹏:在今天分享的技术框架里,我不觉得做数据的应用或者数据的产品是一个纯前沿技术应用的过程,我觉得更多的是把商业数据和工程相辅相成,互相达到一个水到渠成的融会贯通的能力。像我们开发一些新的数据产品的时候,没有特意去想一定要用什么新的技术,或者这个新的技术一定对我们有多么大的帮助,更多的是从业务角度、从用户本身找出来这个价值。在我看来,因为我们已经有非常强的数据的架构和数据的团队,所以可能不见得会有特别多更新的技术。

   

4. 作为linkedln的数据产品经理,您招团队的时候觉得团队成员必须具备哪些技能?

李海鹏:这是个特别好的问题,首先我不能算一个产品经理,我带团队做很多类似的开发,我招人相对来说不拘一格,因为在我看来想做好数据应用和数据产品需要很丰富的知识,要懂得一些商业,要懂得一下数据的处理方式,更要懂得一下工程理念。

分享一个很有意思的案例,我过去曾经招过一个艺术家,是真正的艺术家,不是所谓的文艺青年,我团队这位艺术家有一段时间是靠卖画为生的,从逻辑上看完全是左脑右脑有区别,这样的人从传统的招聘方式是不可能招聘到团队里来的。我更看重的是他快速学习能力和他的热情。因为我们看技术,如果QCon把历年技术分享拿出来,你会发现技术变迁真的很快,一两年就会有一个崭新的趋势和方向,如果按照过去的技能去招聘的话,痴心的脚步永远赶不上变心的翅膀,你就会落后于这个时代。所以我招人时更看重他有没有快速的学习能力和热情。像我招聘的这位艺术家非常成功,给公司创造非常多的价值。

   

5. 现在国内外有很多数据驱动业务的公司,包括创业公司,都在讲数据驱动业务的概念,但是感觉有点务虚,我们认为linkedln做得比较成功,从您的角度来讲linkedln为什么能够落地,而且有这样的优势?

李海鹏:从几个方面去想,第一个,很多公司说是数据驱动的公司,但是它的决策和决定并不是数据驱动的,像我们公司CEO分享了,他每天起来会看很多公司的KPI,这样自上而下的数据驱动的思维方式,能够让公司在数据应用方面更加好。第二点,看不同的行业和不同的团队和公司所处的阶段,比如O2O这样的行业,市场竞争非常激烈,根本没有那么多时间真正挖掘它现有数据的价值,所以它最后没有办法去做到数据驱动。另外,我看到有一个比较有意思的事情,就是我们看到硅谷和中国这些创业公司的对比,这边是技术驱动,这边是业务驱动,完全在两个极端的公司都做得不好,一定要在中间找个平衡点,硅谷的公司相对更偏向于技术驱动,而中国的公司更多以业务驱动,以业务驱动经常是KPI驱动的,很多时候迫使放弃很多能力,因为你要很快的把这个结果进行交付。像我今天分享的销售智能方面的东西,如果是技术驱动的公司,愿意花很多时间和精力去提高销售智能,这样能够让我的revenue快速增长,但是如果是业务驱动的公司,最简单的办法是多招一些销售人员和做更多地推来达到KPI,这两种不同的公司文化也是其中的一部分原因。

不光是Linkedln,硅谷很多公司把自己作为一个技术公司来定位,这样数据驱动的能力能够和技术结合得更加得好,business data和engineer要做到一个很好的平衡,而不是一方过于主导另一方。

   

6. 对于一些普通的公司来说,除了数据驱动业务,然后业务支持数据,挖掘公司数据的价值,您觉得比较难的环节是什么地方?

李海鹏:比较难的环节其实是在人才,我们在硅谷也深有感触,人才永远是公司的核心竞争力。不同的人才流动会造成你公司排名或者产品很大的差别,这是第一点,人才上面的缺失。第二点,是对数据挖掘的经验和理解。我个人可以分享一些我理解的方式,原来我们过多的偏重于算法本身或者挖掘技术本身,这个算法比那个算法快,那个算法比这个算法牛,实际这是非常错误的,太过于技术极端,而没有和业务、商业线结合起来。

比如做一个training你很多时候要做feature selection,假如一个feature都没有在你做数据的时候加进来,因为你完全跟业务线脱离,那你这个模型是不可能做到非常好的效果。举个简单的例子,之前在美国面试一个candidate,他在游戏公司里面做fraud detection和duplicate account,就是玩游戏你会有很多小号,做一些对你比较有益但是对平台不是那么有益的活动,当你发现你用了一个正确的数据,不需要用特别复杂的算法,也能够把这个事情做得特别好。所以对于数据挖掘来讲,太多人注重于算法本身,而没有注重怎么把算法和业务线结合起来,找到对你有帮助的数据。

   

7. 对于数据驱动业务,如何区分自然业务的增长和数据驱动业务增长这两个部分?有没有什么比较好的方法或者标准验证它?

李海鹏:很多硅谷公司采取的都是像AB测试,就能够把新的feature和通过数据做出来的决定的效果和之前做个AB的对比,知道哪些是增长。互联网公司用这套相对来说简单易用的ABtest的流程的话,这个对公司帮助是很大的。

   

8. 实际上国内在AB测试方面应用没有那么广,大的互联网公司会用。

李海鹏:很多人觉得我是一个非常小的公司,现在可能用户也没那么多,即使做AB测试,significant没有办法达到统计意义,所以觉得做了也没用。但是你会发现很多公司上线一个功能,网站就宕了。很多时候不光是当你有一个极大的用户群体,去做两个feature的比较,甚至你要上线一个产品,也需要做一个小规模的测试。像硅谷不光是linkedln,任何一个公司都有非常庞大的AB测试framework,因为我们用户数量极大。同时在线运行的ABTEST可能每天有几万个,我们可以通过它的指标和KPI做一个非常好的决定,这就是我们所谓的数据驱动。很多公司可能连这个东西都没有,那它怎么去做数据驱动。所以一个互联网公司的AB测试概念或者简易流程还没有的话,它很难去做真正的数据驱动。

   

10. 可以,因为很多创业公司都叫“数据公司”。

李海鹏:这个要分层级来看,首先从最底层infrastructure这个level来看,我很早就预测过像mapreduce,他不是非常的efficient,一定会有更新的data structure替代它,我个人看到原来是两个极端,一个是传统的data warehouse,里面有很多好的东西,比如index,另外一块是完全distribute的infrastructure,可能很多东西都没有,用的最笨的方法,只不过因为集群比较大,所以能够把它算出来。现在的趋势是两者会慢慢走向结合,原来在单机或者单个data warehouse上的优化慢慢会到Hadoop集群上来,把两者的优势在infrastructure level发挥得淋漓尽致,这是在infrastructure level我看到的一个趋势。

另外一个趋势,我自己认为随着数据越来越多的媒体化,这个概念就是原来我们看数据很多时候是以数字或者文本为主。到今天随着生活多样化的变化,很多照片或者视频的数据应用会越来越广,以后肯定会有越来越多类似的framework出来,像Google开源了tensorflow人工智能这种框架去处理feature selection这个艰难的工作,比如类似照片和视频是非常好的,以后更相对专业一些针对不同具体use case的framework会越来越多。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT