2014-03-14 14:42:18 来源:CSDN
3月12日下午,CTO俱乐部走进企业系列活动此次带领大家走进的是位于北京静安中心的当当网。当当网CTO熊长青、当当网技术部无线产品总监李建、当当网算法研究员鞠奇、CSDN &《程序员》总编刘江、CSDN CTO俱乐部负责人李力及来自50多家企业的CTO俱乐部会员参加了本次活动。

当当网CTO熊长青致开幕词

CSDN &《程序员》总编 刘江
CSDN &《程序员》总编刘江主持本次活动,当当网CTO熊长青致开场词,他代表当当网以及总裁李国庆欢迎大家的到访。他细数了当当网这十几年的发展,当当网最初由卖图书音像制品在行业内树立了一定的口碑,到上市后逐步将业务面扩展至日用百货、服装等其他品类商品。尤其是服装这个品类,这两年可以说是异军突起,就目前“书”和“非书”这两部分业务对比看,“非书”类产品销售额占比已经远远超过“书”的品类。
熊长青说,在整个行业中,当当网的销售规模已经超过所有网上卖书的竞争对手的总和。在整个全国出版物的市场中,每卖出去4本书,基本上有1本就是当当网卖出的。
熊长青:技术实力是竞争力来源
在谈及当当网的核心价值主张时,熊长青说:“便捷省心的用户体验就是核心价值主张。我们强调品种齐全,质优价惠,我们致力于成为中、中高端顾客网购首选。这是当当网公司自己在这个行业的定位。” 当当整个公司的文化首先强调的是服务,强调服务于客户,精益求精,这也是为什么这么多年,当当能够在起起伏伏的行业环境下面,尤其是最近两年,竞争对手疯狂成长的背后,它还能够在增速,扩张的速度、损益等保持一个比较好的平衡的原因,熊长青这么总结说。
在当当网,技术是怎样的一个定位?熊长青在现场给出了详细的解释,他说:“我们认为当当的技术是成就公司的核心竞争力。因为零售或者是做电商这个行业,它不是生产者,服务是解决商品交易部分的服务,它是中间人的角色。大家都知道,零售行业是全地球上,可能是人类历史最古老的行当,从物物交换,到有货币以后货币交换,一直就有零售。在这里已经是非常成熟的一个行当了。它的成功,一定要靠精细化的运营。怎么从供应商那里拿到好的价格?知道从供应商那里订多少货才能卖出去,不然卖不出去?进一个试销不对路的产品,到最后还得退给供应商,成本就耗费在这里公司,损益就没有办法保障。无论对消费者,还是对供应商对信息技术要求是非常高的。它的利润来源就看你利用这些信息,利用这些技术手段来怎么样精益化的程度高相关。我认为这是公司竞争力的来源。”
“毕竟是电商这个体验跟传统线下店体验是不一样的。线上购物体验是什么样的?最后是发挥现在技术的能力,包括大数据这些能力。”熊长青说。
在当当怎么评价什么是好的产品?“我们觉得好的产品有很多:比如米开朗其罗的大卫雕塑、苹果的手机等,也就是开行业之先河,深受用户青睐,经受时间考验,签上自己的大名而倍感荣耀,这就是KPI优异的产品。”熊长青如是说。
李建:用精益的思路去做设计
在之后的主题分享环节,首先由当当网技术部无线产品总监李建带来主题为“精益产品设计与实战”的演讲。话题主要分为四部分:第一,讲一下什么是精益?第二,什么是精益产品设计?介绍怎样完成精益产品设计;第三,如何执行精益产品设计;第四,最后分享一下这次PPT是怎么写出来的。

当当网技术部无线产品总监 李建
李建介绍说,精益的来源来自于精益创业和精益生产,这是日本丰田提出来的。现在买车的环境大家都知道,有的买车要预订再生产,原来不是这样的,原来是生产一批车,把所有车生产出来再去买。但是存在风险控制非常大,如果卖不出去,成本及供应链会出现问题。所以改变了供应链和生产系统。让整个生产系统很精益,这就是精益的来源。
“我们发现一个需求的时候,实际上这时候我们就开始执行了,执行之后,中间发现了很多的需求,不是我们想象的,真正的目的地在这儿,我们要经过很多曲折才能大家目的地。原来的资源可能支撑到第二个节点的时候就可以了,但是在后面的时候,可能没有后续资源了。团队信心在第一次需求错误判断之后会逐渐减小,这也是后续失败和产品不能下去的主要原因,”李建解释道,“通过精益之后会怎么样呢?通过精益后,我们最开始设想的目标确实是这个地方,但是我会及时调整方向,不断地会逼向真正的目标,最短的路径不是直线,肯定是曲折线,没有一个公司可以马上解决需求,这就是精益的思想。”
李建将精益创业的实战归为三部分:第一,列出A计划。做什么事?解决什么需求?问题在哪里?第二,找出风险最高的部分。为什么是最高的呢?实现一个项目,有很多风险,如果风险最高的实现不了,一定要面对这个风险。因为最高的都验证不了,这些事肯定不能实现,所有要先验证风险最高的;第三,系统测试计划。怎么测试?就是不断地跟用户聊,聊完以后得到一些数据反馈,不断优化产品,不是一下把产品开发出来,用数据直接验证,这是核心思想。
有意思的是,最后的分享环节李建拿本次分享会自己的演讲PPT的“出炉”过程做例子,其实这次PPT的创作过程也是利用了精益设计的思路。“第一步接到需求,调研产品上想听的内容。在座的都是什么人?我看了一下每期的活动,参加的人是什么人。开过的选题是什么?大家关注的是什么?然后确定PPT的目录,我先写一个。然后找第一轮人聊,看大家愿不愿听,更改PPT.写第一章,我确定第一章之后,找技术人员又分享。大家听了以后有什么感触给我反馈,然后把PPT写出来了。最后我先在内部进行分享,再次改PPT,不断地改,直至今天来这儿给大家分享。”李建介绍说。
现场提问:
提问:规模比较大的公司,像当当,或者京东,淘宝,讲究的是整个系统架构想的非常的完善。我做一个项目,所有的前台,后台,整个流程想的非常的完善。这种公司用精益做事的话,精益是小步快跑,本来就有矛盾和冲突。当当体量也比较大,当当会遇到这种问题,你怎么解决的?
李建:刚开始做精益的时候,困难也很大,有的需求不能大做了,还说出合理的理由,确实是这样的。早期的时候,我们用这个方法,有一些需求挡不会去就做了,效果确实不好,也让业务,包括整个前面的需求部门意识到,不能随便提没有用的需求,后续占了很多资源。当当网整个资源分配也是这样的。业务部门提的需求,包括产品需求,都有整个KPI的考核。类似当当网的技术部是一个外包,给你提供这个服务可以,但是你是用你的资源来解决你的问题。开始执行的时候,业务可以提很多需求,矛盾就来了,我们不给他们做,我们只能给你们做小的。他们说不行,后续没有资源了,他们就开始跟我们协商。得到前期的验证验知是很关键的。
整个团队内部实现这个确实很艰难,尤其是整个产品团队。开发团队好推进。但是产品经理职责需求比较多,接的活比较多,比较困难。做了很多工作,中间做了很多方法,实践中得到这个意识很重要,对他本身也是有收获的。我提倡的内部创业机制也是比较提倡的,所以积极性比较高,所以执行起来比较顺畅。
鞠奇:小算法 大收益
鞠奇可以说是当当网的幕后技术大牛,据说通过算法调整,给当当网带来了非常可观的经济效益,还因此获得了总裁奖。这位年轻的算法员去年从意大利博士毕业,在当当网CTO熊长青以及当当网技术部副总裁傅强的光辉下,加入当当从事算法研究。来了之后发现当当网的大数据完全超出自己的预期,当当的数据从业务角度来说主要分为两大块,一个是图书,另外一个就是百货。

当当网算法研究员 鞠奇
图书是当当的起家之本,百货作为公司今年战略重要的一部分,是要发力的地方。鞠奇在图书这块分享的是图书的推荐和图书的评论处理,做了一些小的算法改进。在百货这方面,他从最直接能够抓住用户心理的品牌角度进行了一些挖掘。
“图书推荐这块,第一部分是最佳拍档的优化。这个里面我首先回顾一下我们最常用的关联规则,并提出了关联规则里面存在的几个问题。然后我们发现这几个问题,严重影响了我们线上的效果,进一步分析了内在的原因,发现大部分都是我们”大单“引起的。就是同一个订单里面有很多件商品。因为当当图书卖的很多,有很多活动,所以大家很愿意把很多次购买意图,放到一个订单里面,形成一个大单,影响我们最佳推荐的效果。真正的大单需要被分解还原用户的意图。”鞠奇说道。
[page] “存在的第一个问题是必然两本书存在不同的订单里面,他们共同购买意义应该是不一样的。怎么处理?我们就思考,任何订单里的两本书之间的关联权重,需要考虑,这个订单里面有多少其他商品,其他商品多少个。越多的,这个权重比较低,如果就是两本书,它的权重就比较高。针对这种思考,我们做了一个处理;第二个问题,即使在不同的订单共同出现了相同的商品件数,我们发现这个商品可能是一个畅销品,关联过万,这个过百。这本书跟很多关联,某两个之间的关系弱于其他之间的关系。从这个想法出发,我们做了一个类似IDF的处理;第三个问题,偏好意图混淆,怎么还原消费者的意图。哪些商品是偏向于一次性购买的。考虑到加入购物车的时间点,我形成一个大件,我买很多书,但是我不可能一次性做出决定,我一次可能只对我一种偏好做决定,把它放到我的购物车里面,在某个节点上一次性购买。我们会考虑加入购物车的因素,来进行分解。然后有的时候加入购物车的时间还不够,我们可能会考虑书和书之间主题相关的一致性。我看到的和我买到的可能相似,我的兴趣可能不断的变化,但是我一次购买的意图是一样的。我从加入购物车的时间来做一个分解,或者我从所有的图书里面的一个内容的相似性方面做一个分解。综合上面三个策略,我们就做出更合理的整体关联权重。”鞠奇仔细解释道。
在讲到有关评论排序推荐时,鞠奇举了自己身边的例子,“前两天我妈从老家打电话,我侄儿已经好几岁了,让我在当当网上找几本书买给他,哪本书卖的比较好?我就找童书榜Top3及其对应的评论,前面评论都是‘商品不错’、‘正版’等,再看看客户评分这么高,评论这么多,我想看到的评论到底在哪呢?为什么那么难?这个问题已经困扰了我们,也包括我们总裁好久了。怎么让用户决策,找到他想看的东西呢?”鞠奇继续说道“通过算法,把五星级的、加赞的或者有文艺评论的提到前面去,把比较普通评论的、‘不错',比较’二‘的评论打压。其实就是大数据加自然语言处理的事。”
最后,结合当当网2014年战略,鞠奇谈到了有关百货方面的工作,因为当当网的百货品类比较多,用户买了这个再买其他什么东西,这就是互补类别的计算。当完成互补类别计算后,怎么确定品牌是否具有相同的风格或者质地,是否有相同的档次,怎么确定这些呢?“我们从一批优质用户着手,找到这批优质用户,我觉得这批用户提供给我们的数据比较靠谱,所以我们会挖掘优质的用户。得到优质用户数据之后,我们在他们点击基础上,进行品牌相似性的计算。”鞠奇介绍说,“ 2014年我们会从图书音像转到百货。百货里面品种非常丰富。我们的用户都发愁买什么百货,老板也不知道用什么吸引用户。我们最直接、最简单的方法,就是通过品牌。用户越来越偏向使用品牌,去找品牌。觉得质量有保证。电商发展品牌,像天猫一样,发展商城,发展店铺,更有利于我们的经营。”

现场Q&A环节
主持人:算法团队有多少人?
鞠奇:现在确切来说算法团队在建立之中。
傅强:我们定位算法研究员不带人直接汇报给我,我现在的职位当当网技术部的副总裁,我汇报CTO,负责开发工作,跟他汇报层级的开发总监,很资深的经理。他之所以不带人,不消耗和人、团队打交道的精力,老老实实做算法。你的几行代码,一个小参数,给当当能多赚好几千万。
提问:我想请教一下鞠奇,你这里做了很多高深的东西我不太懂。其实还有一个层面,你对用户心里的分析,这方面是一个非常很根深的东西,关于心里分析这块能不能分享一下经验,用户消费,心里过程,或者心里分析?
鞠奇:您确实很厉害,一下就看出来了。其实那些所谓的您听不懂数学公式,那些很简单,这方面的硕士、博士都可以知道,都可以应用。在数据挖掘和心理学这方面,怎么把数据公式和算法和实际的业务数据结合起来,这是最难的一件事。我整个PPT里面讲了4个主题,我用一个最简单的算法,就是TF-IDF,我把这个东西贯穿到很多主题里面,我在不同的场景里面做了不同的应用。TF-IDF大家都知道,但是我用到品牌计算里面,用户挖掘里面,用户评论里面去。我们的算法很简单,怎么样结合我们的数据,把数据吃透了,把它们进行有效的融合。
怎么样调查用户的心里?一部分和我们产品总监论述的和调研有关,更大的一部分,如果你是有心的人,你会设身处地的,有替别人思考的习惯,就会设身处地的为用户考虑。
提问:最近网上流传一篇文章,我们招聘的时候,面临的是每个应聘的开发人员简历很漂亮,做了很多项目,一对他进行测验,最基本能力都不能证明。当当在招聘技术人员来的时候,是以什么样的衡量方式招过来的非常好的人才。

当当网技术部副总裁 傅强
傅强:在招聘方面,把关比较严格。比如说我们在流程上做保障。面试,是不是有两个开发经理以上做。比如说招算法员一定要找鞠奇这样的算法研究员。工资要的比较高的,我们觉得比较资深的人我一定要过,一轮过去,一个面试者从下午两点,一直到晚上9点出办公室,要不要,当场半小时以后我们讨论清楚了,立刻打电话,回家路上就可以接到一个offer.我讲的都是层层筛选,通过三轮甚至四轮。四轮本身是流程的一种,在这四轮中,每个人的面试角度不一样。
比如说算法职位,做个案例。比如说第一轮有算法本身技术的,我选几个模型,你了解程度是什么,一定问很细节的问题。第二个面试官从工程的角度,做算法方面,工程水深水浅,我们从细节问,实实在在有没有碰过,甚至到参数,你碰过,我就能问到。第三轮从项目,对互联网的感觉。第四轮到我,我会问人本身的素质。每人下来,每个人的关注点也会不一样。虽然都是一个小时,但是每个人过一个小时之间,每个人没有重复的题目,这个人说了5个小时的话,这个是什么样的人,我们基本上看清楚了。轮数多,从多维度角度观察。我们招聘的失败比较少,是个位数,或者一只手就能数过来的。

会后CTO俱乐部会员参访当当网
主题分享会后,CTO俱乐部会员在当当网的各位演讲嘉宾带领下,参观了当当网的办公环境、数据监测平台等。
免责声明:本网站(http://www.ciotimes.com/)内容主要来自原创、合作媒体供稿和第三方投稿,凡在本网站出现的信息,均仅供参考。本网站将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。本网站对有关资料所引致的错误、不确或遗漏,概不负任何法律责任。
本网站刊载的所有内容(包括但不仅限文字、图片、LOGO、音频、视频、软件、程序等)版权归原作者所有。任何单位或个人认为本网站中的内容可能涉嫌侵犯其知识产权或存在不实内容时,请及时通知本站,予以删除。
