BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

大数据在Etsy产品开发中的角色定位
录制于:

| 受访者 Nell Thomas 关注 0 他的粉丝 作者 Harry Brumleve 关注 1 他的粉丝 发布于 2013年9月13日 | AICon 关注机器学习、计算机视觉、NLP、自动驾驶等20+AI热点技术和最新落地成功案例。
13:18

个人简介 Nellwyn Thomas是Etsy公司数据团队中的一位分析师,她的工作与产品、营销以及工程领域关系密切,旨在监控、创建、更新并完善Etsy公司的产品组合。在进入Etsy之前,她曾在纽约的两家小型初创企业负责过分析及产品类工作。她是哈佛大学的毕业生,并且拥有宾夕法尼亚大学的硕士学位。

软件正在改变世界;QCon大会旨在促进企业软件开发领域的知识与创新的传播;为实现这个目标,Qcon面向从业者,旨在帮助开发团队中影响创新的团队领导、架构师、项目经理以及工程主管等。

   

1. 我是Harry Brumleve,现在我们正在旧金山的QCon 2012大会现场。今天到场的嘉宾是Nell Thomas,您能向我们简单介绍下自己和工作的情况吗?

好的,我叫Nell Thomas,是来自Etsy公司的一名数据分析师。我们的工程师及分析师团队非常优秀,一直在努力帮助企业通过数据更好地完成工作。

   

2. 您为什么选择分析师这条道路呢?

事实上,一直以来,分析数据并从数据的角度审视行为就是我根深蒂固的思维方式。我在大学里学的是心理学专业,在那里我有机会在实验室中把自己的想法加以验证,而这也逐渐成为我做出决定的一种常用手段。从大学毕业之后,我进入一家初创公司工作,这是一家金融服务类企业,需要通过数据掌握公开交易股票的态势;这对我来说是个同时学习数据收集、数据分析与建模以及数据传播的绝佳机遇。由于交付的内容只能是文字而非数字,因此通过清晰准确的表达来阐述分析结果就成了我工作中的重要组成部分。在此之后,我又进入另一家开发网络产品的初创公司,在那里我学习了产品创建的相关知识。最后我来到Etsy,负责利用数据帮助开发团队了解什么样的产品能够同时满足厂商与用户的诉求,我对目前的状况非常满意。

   

3. 在Etsy公司里,您所使用的数据来自何处?

我们主要有两大数据源。首先是交易数据,也就是描述用户交易或登录会员账户的这一类数据,属于规律性关系数据库;非常简单。第二类是数据集,这些数据更加散乱、体积也更大,其中包含的用户站点活动——例如查看访客记录、点击主页、搜索框输入信息、偏好产品等——也相对更具趣味性;这部分数据我们会利用事件日志系统进行收集。
我们将数据保存在Hadoop当中进行处理,同时利用一些更为复杂的技术在必要时将数据提取出来。有时候我们也需要利用一套名为Vertica的数据仓储方案同时存储上述两类数据集,旨在帮助具备SQL技能的工作人员同时对二者加以分析。总体来说,我们一直在努力提高数据的可访问性,这样大家就能够在不具备编程技能的情况下提取数据了。虽然要想理解数据含义、分析技能仍然不可或缺,但尽可能压低数据使用门槛对我们而言非常重要。

   

4. 那一般来说,这些数据最终会用于哪些方面呢?

我得说我们每天需要面对的各类数据太多了,企业必然会产生大量运营指标,我们则以此为基准了解网站的运营状况。在产品开发方面,我们会把数据应用在流程的每一个环节中。尝试确定我们所要创建的产品、理解创建的具体过程、在创建完成后对其进行迭代、对一款产品做出反思甚至直接撤销,我们希望确保自己准确理解以上环节所产生的影响。我们会在网站中进行大量实验,当然也会利用数据及统计分析推导由变更衍生出的结果。另外,我们也在尝试将数据与决策制定流程相结合,并推广到产品型组织以及整个企业当中——其中包括营销、公共关系、高级管理及技术支持等多个部门。

   

5. 如果这些数据在Etsy公司中能够实现高度可用性,会给企业的日常运营带来怎样的影响?

我认为在一般情况下,正如前面提到的,我们每天都会对企业运营状况进行审视,弄清楚网站的运转状况;不过出于规划或优化的考虑,我们一般不会干涉日常工作内容、而是将目光放在长期变化带来的影响上。就我个人看来,实时分析的确能给短期变更或小规模影响带来优化效果;不过我们更希望能从长远角度展开思考。因此,从日常角度来看,我们进行的实验或执行的临时分析也许会帮助产品经理或市场经理改善规划,但与能够指导未来一个、两个、三个月甚至一年的宏观指导方案相比,这样的效果实在是微不足道。

   

6. 您真的在把数据合并到Etsy公司的组织结构当中吗?

我们投入大量精力来实现这一目标。我们组建了专门的数据团队,从两个方面对基础设施进行调整,旨在确保我们能在收集准确数据的同时将其交付给企业。我们还努力培养独立团队之间的关系,这样同时身处多个团队的分析师就能负起联络的职责,帮助其他成员理解数据、进行补充分析、将数据翻译为可执行项目。举例来说,我同时在销售工具团队、搜索团队以及营销团队工作,这样他们不仅能获取到来自团队内部的数据并加以使用,也能与其它团队互通资讯、加深理解、将数据转化为生产力。

   

7. 从传统角度看,产品开发工作需要有销售、宣传以及业务分析人士的共同参与。目前这一格局似乎遭到破坏,我们是否需要修复这种关系?数据在这方面的指导效果是不是要好于用户需求?

在Etsy公司中并不存在明确的市场营销或业务等划分,我们倾向于将其称为驱动产品决策的部门,其中包括工程师、产品经理、产品设计师等在产品开发团队中举足轻重的成员——我更喜欢这个名字。所以在用户需求方面,我认为数据的作用并不是取代用户需求,而是要利用数据来明确并传达用户需求。而且一般情况下,数据集文化意味着企业中的每位员工都会思考如何对待数据、使用数据、解读数据并最终使其明了易懂。而且,我们的工作就是激励他们这么做,我们取得了优异的工作效果、我们永远能做得更,而且我们有能力将客观数据作为决策的重要支点,无论是面向未来的规划还是针对过去的反思。

   

8. 利用数据启发决策的理念也能够帮助您判断新特性或者测试是否成功。您是否认为数据可能成为Etsy公司未来决策制定工作的辅助手段?

大家在制定决策时必须需要参考多方面因素,而数据只是其中的组成部分之一。它的作用很重要,而且在我们看来效果显著。就以实验为例,我们可以借此量化两种可能性方案之间的差异。有时候设计思路会出现两种截然不同的发展方向,其中一种可能使用较大的按钮、另一种则使用较小的按钮。这时我们需要在A|B测试中分别观察它们的实际表现。这种处理方式使我们能够明确差异所带来的不同效果,而不必全凭主观感受进行盲目选择。也就是说,当我们评估哪种测试更适用于全局或者如何阐述某种实验的结果时,必须先要将其整合到对产品的深入理解当中。因此辅助手段可能带来好处也可能引发弊端,我更偏向于把它视为一种更强大、更可靠的工具组合,但绝不能作为需要考虑的惟一因素。

   

9. Etsy公司的分析师需要改善客户及营销人员的实际体验,这种对分析及数据的关注要如何贯彻到用户体验当中?

Etsy是一个由买家和卖家共同组成的市场。Etsy中的卖家销售手工制品、葡萄酒或其它日常品,有些卖家还会在我们的网站中处理所有小型企业运营事务。我们希望能让这一思路更加透明化并更具启发性。我们打造了一款名为“Shop Stats”、面向卖家的分析工具。卖家能够随时查看、将推荐资料纳入店铺、整理最受欢迎货品清单或者弄清人们在访问店铺时最常搜索的关键字是什么。作为企业,Etsy公司利用数据制定决策,我希望我们的卖家们也能运用这一机制。

   

10. 并不是每家软件厂商都能在企业内部通过数据文化获得收益。在企业中我们该如何推动新工具数据文化的普及或起步?

我认为数据有时候确实会显得太过专业甚至可怕、不能为每个人访问并使用;我还认为推广数据文化的第一步在于通过数字培养安全的评估环境。就我个人而言,可能会从问题而并非数据本身开始入手……也就是我们希望回答的那些问题。例如产品或企业的关键性指标是什么,我们打算如何对其做出修改、如此评估这些修改、实现修改需要哪些辅助因素。如果大家不能指明这些问题并提前找出答案,那即使拥有全世界的数据也无济于事。大家可能会让努力落空、也可能被海量数字淹没而找不到正确方向,因此我会先在思维方式、组织方式上下一番功夫,弄清该如何使用这些数据。至于数据文化的另一个重要方面,我认为在于回顾以往决策、利用数据进行反思。我们已经聊了很多利用数据做出预先思考,如规划、迭代或优化,但是现在需要回过头审视过去我们做出的决定、总结由此带来的影响……也就是决策的实际效果。
我认为其中的核心在于诚信,进行评估之后利用数字直接向决策者做出反馈。虽然数字本身并不是惟一的答案,但我要再次重申,请诚实并明确地强调数字在制定决策中的重要地位。

   

11. 您看到过其它由分析引导的决策制定机制吗?

我认为大家都接触过以分析为主导的理念,而且大数据最近一段时间迸发出强大的吸引力,并成为很受欢迎的决策试金石。在我看来,这种情况将继续持续下去,我也很看好这一趋势。无论是Etsy公司还是其它企业,我都坚信我们将逐步见证数据影响力由过去的CSV、表格或Excel文件向更广阔的空间渗透,并且成为从业人员技能储备的重要组成部分。因此,我预计专业分析团队将仍然存在,只是其中会设置一些专门考查数据、使用数据并以此作为主要工作内容的新成员。这可能是未来最具可操作性的发展方向。

Nell,感谢您做出的精彩发言,希望您在QCon大会上过得愉快。

也感谢您的采访。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT