大咖直播:数据驱动的产品决策和智能化

主题一是数据和产品的结合。本文以Stitch Fix为例,阐述了数据科学如何渗透到产品的不同环节。

Stitch Fix是一家数据驱动的电子商务公司,面向新的服装零售。它致力于帮助用户找到适合自己的风格。它主要为那些没有时间去购物,不擅长穿着和试穿,想要追求时尚和其他特征的用户群服务。

缝合修复所有销售来自推荐,这是盲盒模式。用户在收到产品之前没有预览过,这意味着他们需要猜测用户喜欢哪些衣服。如果你猜错了,它会消耗造型师服务和双向物流的真正金钱和白银成本,所以对准确性的要求非常高。

如下图所示,从普通用户的角度来看,使用缝合修复主要分为三个步骤。

大咖直播:数据驱动的产品决策和智能化 Set.1用于回答个人风格问卷。之后,你会收到五件相配的衣服。试穿之后,你会留下你喜欢的,免费归还你不喜欢的。

Stitch Fix鼓励用户从尺寸、价格、版本、风格和颜色等维度对每件服装给出反馈,这将有助于数据科学团队更好地了解用户和服装之间的匹配情况。

在处理用户风格时,穿着和试穿的风格分为七个纬度:古典、浪漫、波西米亚等。每个用户在每个纬度上的得分为1到4。根据用户的得分,可以大致看出用户的穿着和合身风格。

数据科学团队占员工总数的1/4。这也意味着数据科学渗透到产品的许多环节并发挥其应有的价值,如仓库分配、用户与设计师的匹配、用户肖像、人与货物的匹配、库存管理等环节。示例1:仓库配送当发出用户请求时,有必要决定从哪个仓库为用户交付货物。仓库的选择和交付需要考虑许多因素,包括运费、运营时间、仓库风格和用户风格匹配等。基于这些因素,建立了仓库与用户的匹配度指标。</p >例2:用户和设计师的匹配当用户发出请求时,根据用户和造型师之间的交易历史、用户评分和数据匹配进行造型师匹配。</p >示例3:用户肖像“缝合修复”用户肖像不仅为算法服务,也为造型师服务,因此它需要一些能被人们解释和理解的用户肖像。</p >

大咖直播:数据驱动的产品决策和智能化大多数用户肖像来自用户填写的个人问卷,包括基本纬度肖像和与服装相关的,如用户的体型、颜色、价格偏好等。案例4:人与货物的匹配在这里,我们主要共享两个级别的数据和模型。数据级别包括:用户肖像、商品标识、商品概括特征(图像、标签)和多维反馈。推荐算法中的数据存在问题,如项目样本不平衡、数据回流导致的误差、特征和反馈数据缺失、折扣导致的偏差等。在模型层面(2016年),有混合效应模型、因式分解机、DNN、word2vec、LDA等。</p >

大咖直播:数据驱动的产品决策和智能化示例5:库存管理在库存管理方面,有许多问题需要解决,如哪些货物可用,哪些货物需要进口,进口多少,分配哪些仓库,哪些库存需要清理。什么样的商品似乎是一个简单的问题,但缝合修复是特别的,因为商品的库存实际上只占所有商品的40%。有大量的货物在返回仓库或从仓库到用户的途中,所以我们需要做模拟和库存快照来处理它们。

通过这些产品的上述链接,我们可以找到使用数据来提高效率、定义和解决问题的机会,以及使用哪些技术来实现这一目标?在这里,我们主要分享三个共同关心的主要问题:度量标准的选择和分析、组件测试和用户配置文件。

度量的选择和分析

大咖直播:数据驱动的产品决策和智能化在Stitch Fix中,我们关注转换率、GMV和保留率这三个核心指标。选择测量指标可以参考三点:数据源的可靠性、指标与结果的相关性、信号质量和灵敏度。

缝合固定常用分析包括漏斗、组、多纬度等。下图显示了一个组分析的示例。

大咖直播:数据驱动的产品决策和智能化例如,可以根据到达时间和一阶时间将用户分成相等的标签和组,然后观察某些指标在一定时间范围内的变化。对于时间跨度,可以选择相对较短或相对较长的时间跨度。

如下图所示,将为不同客人获取时间的用户保存比较结果。

大咖直播:数据驱动的产品决策和智能化总的来说,从1月到7月,第一个月的保留期正在提高,这意味着需要在渠道获取方面提高所获取用户的质量。此外,可以看出,随着时间的推移,用户的保留会产生平台效应。在最初的四个月里,用户每月的流失相对较大,随后用户的保留趋于稳定。</p >抗体试验在Stitch Fix中,AB测试主要面临两个挑战,即离线交易造成的延迟和设计师的人为因素。</p >

当在线算法改变时,造型师需要为每个用户进行匹配,加上物流,导致7到10天的延迟。

造型师的人为因素主要是由于造型师的惰性。举一个更极端的例子,如果算法想要提高产品的单价,但是造型师想要向用户推荐一些价格适中的产品,这将影响结果。

这里需要提醒的是AB测试要谨慎,应该注意以下四点:

实验正交设计:实验1: uid尾数为奇数对偶数实验2: uid尾数(0,1)对2

用户适应曲线

小流量实验与全流量在线之间的差异

实验效果叠加:每季度开展6.1%的实验。然而,整体提升只有3%

,这意味着肖像需要公司内的多部门合作,同时也将因多部门合作带来挑战,主要体现在数量与应用的脱节以及多业务需求的近似。事实上,生成肖像需要采取三个步骤,即收集肖像需求、构建标签框架和填充数据。

在实际过程中,如果你想打破游戏,有以下三个建议:

放弃大而完整的框架,推回商业场景(价值)

自动生成标签(手段):规则或算法

有效的标签管理机制(可持续性)

用户肖像用户肖像是公司内部基础数据的构建,也就是现在大家经常提到的数据中心。肖像对于推荐业务、用户操作和渠道肖像有相当大的指导意义。

第二个主题是数据和人的结合。在Stitch Fix中,算法和造型师的结合被用来帮助用户进行推荐和匹配,这可以被认为是一个人机耦合系统。人机耦合系统将面临哪些挑战?

在人机耦合系统中,造型师扮演人的角色,处理非结构化数据,进行1v1情感交流,具有创造性,因此算法开发时可以避免边缘条件。

其他人会对这个场景更加敏感,例如,当秋天来临时,什么样的衣服适合中西部的人,造型师会对此更加敏感,并提出更好的建议。

在人机耦合中,虽然1 1大于2,但人机耦合也面临以下问题:

人将成为速度和规模的瓶颈:订单分配与设计师的工作时间不匹配。

测量人和机器对彼此的价值

算法的多反馈渠道:用户反馈和设计师选择的优化目标

算法应该仔细选择。

大咖直播:数据驱动的产品决策和智能化这种人机合作不仅仅基于机器算法,也不仅仅基于手工操作。机器可以承担更重、更重复性的劳动工作,还具有大量的工作记忆和长期记忆,同时人们可以更好地处理非结构化数据,可以进行审美评价,还可以与客户建立良好的人机关系。</p >

第三部分是数据和团队的结合。该部分主要介绍了分析、算法和数据开发在整个数据团队中是如何结合的,以及在公司的架构体系下,整个数据团队是如何与业务团队合作的。

Stitch Fix数据团队主要分为四个部分。底层数据开发团队可以构建数据平台和数据仓库,数据科学家可以提高效率或制作部署工具。

以上三个团队分别对应业务、客户团队、推荐团队和库存团队。

对于数据团队的建设,有三个定位原则可供参考:

以业务和产品为核心。关注产品和业务,为数据创造真正价值

数据科学团队应结合基础设施部门和业务部门的耐心支持,特别是服务跨度长的公司的决策层

公司,并与特定的工程和产品团队成为一个有机整体,目标一致

在实际操作中,请注意还将面临以下问题:

分析结果将如何落到实处?如何做地基分析

分析和处理数据需求和数据驱动的业务,处理数据是一件被动的事情。数据团队经常面临为业务部门提取数据的任务,但同时,数据团队也需要积极推动业务,这可以被视为如何在被动和主动之间进行协调。

在确保数据平台稳定性的同时,数据平台团队还尽可能开发帮助数据科学家更好地进行数据流、部署代码和在线工具。

极牛网精选文章《大咖直播:数据驱动的产品决策和智能化》文中所述为作者独立观点,不代表极牛网立场。如若转载请注明出处:https://geeknb.com/2923.html

(36)
打赏 微信公众号 微信公众号 微信小程序 微信小程序
主编的头像主编认证作者
上一篇 2019年11月7日 下午3:31
下一篇 2019年11月7日 下午9:17

相关推荐

发表回复

登录后才能评论
扫码关注
扫码关注
分享本页
返回顶部