你觉得滴滴钉钉企业版版应该怎样完善自己的产品和服务

本文整理自滴滴出行消息队列负責人 江海挺 在Apache RocketMQ开发者沙龙北京站的分享通过本文,您将了解到滴滴出行:

  • 在消息队列技术选型方面的思考;

  • 为什么选择 RocketMQ 作为出行业务的消息队列解决方案;

  • 如何构建自己的消息队列服务;

滴滴出行消息队列负责人Apache RocketMQ Contributor,大学毕业后一直在做消息队列领域相关的技术、产品和垺务积累了丰富的实践经验,沉淀了不少关于消息队列的思考

滴滴出行的消息技术选型

初期,公司内部没有专门的团队维护消息队列垺务所以消息队列使用方式较多,主要以Kafka为主有业务直连的,也有通过独立的服务转发消息的另外有一些团队也会用RocketMQ、Redis的list,甚至会鼡比较非主流的beanstalkkd导致的结果就是,比较混乱无法维护,资源使用也很浪费

一个核心业务在使用Kafka的时候,出现了集群数据写入抖动非瑺严重的情况经常会有数据写失败。

  • 随着业务增长Topic的数据增多,集群负载增大性能下降;

  • 我们用的是Kafka0.8.2那个版本,有个bug会导致副本偅新复制,复制的时候有大量的读我们存储盘用的是机械盘,导致磁盘IO过大影响写入。

所以我们决定做自己的消息队列服务

首先需偠解决业务方消息生产失败的问题。因为这个Kafka用的是发布/订阅模式一个topic的订阅方会有很多,涉及到的下游业务也就非常多没办法一口氣直接替换Kafka,迁移到新的一个消息队列服务上所以我们当时的方案是加了一层代理,然后利用codis作为缓存解决了Kafka不定期写入失败的问题,如上图当后面的Kafka出现不可写入的时候,我们就会先把数据写入到codis中然后延时进行重试,直到写成功为止

经过一系列的调研和测试の后,我们决定采用RocketMQ具体原因在后面会介绍。

为了支持多语言环境、解决一些迁移和某些业务的特殊需求我们又在消费侧加上了一个玳理服务。然后形成了这么一个核心框架业务端只跟代理层交互。中间的消息引擎负责消息的核心存储。在之前的基本框架之后我們后面就主要围绕三个方向做。

  • 迁移把之前提到的所有五花八门的队列环境,全部迁移到我们上面这里面的迁移方案后面会跟大家介紹一下。

  • 功能迭代和成本性能上的优化

  • 服务化,业务直接通过平台界面来申请资源申请到之后直接使用。

这张图是我们消息队列服务嘚一个比较新的现状先纵向看,上面是生产的客户端包括了7种语言。然后是我们的生产代理服务在中间的是我们的消息存储层。目湔主要的消息存储引擎是RocketMQ然后还有一些在迁移过程中的Kafka。另一个是Chronos它是我们延迟消息的一个存储引擎。

再下面就是消费代理消费代悝同样提供了多种语言的客户端,还支持多种协议的消息主动推送功能包括HTTP 协议 RESTful方式。结合我们的groovy脚本功能还能实现将消息直接转存箌Redis、Hbase和HDFS上。此外我们还在陆续接入更多的下游存储。

除了存储系统之外我们也对接了实时计算平台,例如FlinkSpark,Storm左边是我们的用户控淛台和运维控制台。这个是我们服务化的重点用户在需要使用队列的时候,就通过界面申请Topic填写各种信息,包括身份信息消息的峰徝流量,消息大小消息格式等等。然后消费方通过我们的界面就可以申请消费。

运维控制台主要负责我们集群的管理,自动化部署流量调度,状态显示之类的功能最后所有运维和用户操作会影响线上的配置,都会通过ZooKeeper进行同步

我们围绕以下两个纬度进行了对比測试,结果显示RocketMQ的效果更好

这张图是Kafka和RocketMQ在不同topic数量下的吞吐测试。横坐标是每秒消息数纵坐标是测试case。同时覆盖了有无消费和不同消息体的场景。一共8组测试数据每组数据分别在Topic个数为16、32、64、128、256时获得的,每个topic包括8个Partition下面四组数据是发送消息大小为128字节的情况,仩面四种是发送2k消息大小的情况on 表示消息发送的时候,同时进行消息消费off表示仅进行消息发送。

先看最上面一组数据用的是Kafka,开启消费每条消息大小为2048字节可以看到,随着Topic数量增加到256 Topic之后,吞吐极具下降第二组是是RocketMQ。可以看到Topic增大之后,影响非常小第三组囷第四组,是上面两组关闭了消费的情况结论基本类似,整体吞吐量会高那么一点点

下面的四组跟上面的区别是使用了128字节的小消息體。可以看到Kafka吞吐受Topic数量的影响特别明显。对比来看虽然topic比较小的时候,RocketMQ吞吐较小但是基本非常稳定,对于我们这种共享集群来说仳较友好

上面的一组的3条线对应Ack=3,需要3个备份都确认后才完成数据的写入下面的一组的3条线对应Ack=1,有1个备份收到数据后就可以完成写叺可以看到下面一组只需要主备份确认的写入,延迟明显较低每组的三条线之间主要是Topic数量的区别,Topic数量增加延迟也增大了。

上面兩条是同步刷盘的情况延迟相对比较高。下面的是异步刷盘橙色的线是同步主从,蓝色的线是异步主从然后可以看到在副本同步复淛的情况下,即橙色的线4w的TPS之内都不超过1ms。用这条橙色的线和上面Kafka的图中的上面三条线横向比较来看Kafka超过1w TPS 就超过1ms了。Kafka的延迟明显更高

如何构建自己的消息队列

面临的挑战(顺时针看)

  • 客户端语言,需要支持PHP、Go、Java、C++;

  • 决定用RocketMQ但是没看过源码;

  • 上线时间紧,线上的Kafka还有問题;

使用RocketMQ时的两个问题:

  • 客户端语言支持不全以Java为主,而我们还需要支持PHP、Go、C++;

  • 功能特别多如tag、property、消费过滤、RETRYtopic、死信队列、延迟消費之类的功能,但这对我们稳定性维护来说挑战非常大。

针对以上两个问题的解决办法如下图所示:

  • 使用ThriftRPC框架来解决跨语言的问题;

  • 簡化调用接口。可以认为只有两个接口send用来生产,pull用来消费

主要策略就是坚持KISS原则(Keep it simple, stupid),保持简单先解决最主要的问题,让消息能夠流转起来然后我们把其他主要逻辑都放在了proxy这一层来做,比如限流、权限认证、消息过滤、格式转化之类的这样,我们就能尽可能哋简化客户端的实现逻辑不需要把很多功能用各种语言都写一遍。

架构确定后接下来是我们的一个迁移过程。

迁移这个事情在pub-sub的消息模型下,会比较复杂因为下游的数据消费方可能很多,上游的数据没法做到一刀切流量这就会导致整个迁移的周期特别长。然后我們为了尽可能地减少业务迁移的负担加快迁移的效率,我们在Proxy层提供了双写和双读的功能

有了这两个功能之后,我们就能提供以下两種迁移方案了

生产端双写,同时往Kafka和RocketMQ写同样的数据保证两边在整个迁移过程中都有同样的全量数据。Kafka和RocketMQ有相同的数据这样下游的业務也就可以开始迁移。如果消费端不关心丢数据那么可以直接切换,切完直接更新消费进度如果需要保证消费必达,可以先在ConsumerProxy设置消費进度消费客户端保证没有数据堆积后再去迁移,这样会有一些重复消息一般客户端会保证消费处理的幂等。

生产端的双写其实也有兩种方案:

业务那边不停原来的kafka 客户端只是加上我们的客户端,往RocketMQ里追加写这种方案在整个迁移完成之后,业务还需要把老的写入停掉相当于两次上线。

业务方直接切换生产的客户端只往我们的proxy上写数据。然后我们的proxy负责把数据复制同时写到两个存储引擎中。这樣在迁移完成之后我们只需要在Proxy上关掉双写功能就可以了。对生产的业务方来说是无感知的生产方全程只需要改造一次,上一下线就鈳以了

所以表面看起来,应该还是第二种方案更加简单但是,从整体可靠性的角度来看一般还是认为第一种相对高一点。因为客户端到Kafka这一条链路业务之前都已经跑稳定了。一般不会出问题但是写我们Proxy就不一定了,在接入过程中是有可能出现一些使用上的问题,导致数据写入失败这就对业务方测试质量的要求会高一点。然后消费的迁移过程其实风险是相对比较低的。出问题的时候可以立即回滚。因为它在老的Kafka上消费进度是一直保留的,而且在迁移过程中可以认为是全量双消费。

以上就是数据双写的迁移方案这种方案的特点就是两个存储引擎都有相同的全量数据。

特点:保证不会重复消费对于P2P 或者消费下游不太多,或者对重复消费数据比较敏感的場景比较适用

这个方案的过程是这样的,消费先切换全部迁移到到我们的Proxy上消费,Proxy从Kafka上获取这个时候RocketMQ上没有流量。但是我们的消费Proxy保证了双消费一旦RocketMQ有流量了,客户端同样也能收到然后生产方改造客户端,直接切流到RocketMQ中这样就完成了整个流量迁移过程。运行一段时间比如Kafka里的数据都过期之后,就可以把消费Proxy上的双消费关了下掉Kafka集群。

整个过程中生产直接切流,所以数据不会重复存储然後在消费迁移的过程中,我们消费Proxy上的group和业务原有的group可以用一个名字这样就能实现迁移过程中自动rebalance,这样就能实现没有大量重复数据的效果所以这个方案对重复消费比较敏感的业务会比较适合的。这个方案的整个过程中消费方和生产方都只需要改造一遍客户端,上一佽线就可以完成

说完迁移方案,这里再简单介绍一下我们在自己的RocketMQ分支上做的一些比较重要的事情。

首先一个非常重要的一点是主从嘚自动切换

熟悉RocketMQ的同学应该知道,目前开源版本的RocketMQ broker 是没有主从自动切换的如果你的Master挂了,那你就写不进去了然后slave只能提供只读的功能。当然如果你的topic在多个主节点上都创建了虽然不会完全写不进去,但是对单分片顺序消费的场景还是会产生影响。所以呢我们就洎己加了一套主从自动切换的功能。

第二个是批量生产的功能

RocketMQ4.0之后的版本是支持批量生产功能的。但是限制了只能是同一个ConsumerQueue的。这个對于我们的Proxy服务来说不太友好,因为我们的proxy是有多个不同的topic的所以我们就扩展了一下,让它能够支持不同Topic、不同Consume Queue原理上其实差不多,只是在传输的时候把Topic和Consumer Queue的信息都编码进去。

第三个元信息管理的改造。

目前RocketMQ单机能够支持的Topic数量基本在几万这么一个量级,在增加上去之后元信息的管理就会非常耗时,对整个吞吐的性能影响相对来说就会非常大然后我们有个场景又需要支持单机百万左右的Topic数量,所以我们就改造了一下元信息管理部分让RocketMQ单机能够支撑的Topic数量达到了百万。

后面一些就不太重要了比如集成了我们公司内部的一些监控和部署工具,修了几个bug也给提了PR。最新版都已经fix掉了

接下来,再简单介绍一下我们在RocketMQ在使用和运维上的一些经验。主要是涉忣在磁盘IO性能不够的时候一些参数的调整。

5.1 读老数据的问题

我们都知道RocketMQ的数据是要落盘的,一般只有最新写入的数据才会在PageCache中比如丅游消费数据,因为一些原因停了一天之后又突然起来消费数据。这个时候就需要读磁盘上的数据然后RocketMQ的消息体是全部存储在一个append only的 commitlog Φ的。如果这个集群中混杂了很多不同topic的数据的话要读的两条消息就很有可能间隔很远。最坏情况就是一次磁盘IO读一条消息这就基本等价于随机读取了。如果磁盘的IOPS(Input/Output Operations Per Second)扛不住还会影响数据的写入,这个问题就严重了

bydefault)。推荐把它打开主从都要开。这个参数打开の后在客户端消费数据时,会判断当前读取消息的物理偏移量跟最新的位置的差值,是不是超过了内存容量的一个百分比(accessMessageInMemoryMaxRatio= 40 by default)如果超过了,就会告诉客户端去备机上消费数据如果采用异步主从,也就是brokerRole等于ASYNC_AMSTER的时候你的备机IO打爆,其实影响不太大但是如果你采用哃步主从,那还是有影响所以这个时候,最好挂两个备机因为RocketMQ的主从同步复制,只要一个备机响应了确认写入就可以了一台IO打爆,問题不大

RocketMQ默认数据保留72个小时(fileReservedTime=72)。然后它默认在凌晨4点开始删过期数据(deleteWhen="04")你可以设置多个值用分号隔开。因为数据都是定时删除嘚所以在磁盘充足的情况,数据的最长保留会比你设置的还多一天又由于默认都是同一时间,删除一整天的数据如果用了机械硬盘,一般磁盘容量会比较大需要删除的数据会特别多,这个就会导致在删除数据的时候磁盘IO被打满。这个时候又要影响写入了

为了解決这个问题,可以尝试多个方法一个是设置文件删除的间隔,有两个参数可以设置

另外一个就是增加删除频率,把00-23都写到deleteWhen就可以实現每个小时都删数据。

默认情况下所有的broker都会建立索引(messageIndexEnable=true)。这个索引功能可以支持按照消息的uniqId消息的key来查询消息体。索引文件实现嘚时候本质上也就是基于磁盘的个一个hashmap。如果broker上消息数量比较多查询的频率比较高,这也会造成一定的IO负载所以我们的推荐方案是茬Master上关掉了index功能,只在slave上打开然后所有的index查询全部在slave上进行。当然这个需要简单修改一下MQAdminImpl里的实现因为默认情况下,它会向Master发出请求

欢迎加入钉钉企业版级互联网架构交流钉钉群,群号:

-> 欢迎关注“阿里巴巴中间件”加入中间件开发者群,与技术同行

}

原标题:阿里无招:在钉钉点一丅就可以分享别人先进的管理方式 | 钛度专访

钛媒体注:以钉钉企业版为用户的产业互联网,正在呈现与消费互联网完全不同的运行规律——免费、补贴、流量、入口、关系链等经过消费互联网多年验证的手段在产业互联网竟然都不那么灵验了。

产业互联网的游戏规则是什么谁会成为最后的赢家?可能现在谁都不知道答案但我们至少可以不断提出问题。

2017年钛媒体将会密集访谈产业互联网的大咖风云囚物,由钛媒体联合创始人刘湘明领队探寻问题的答案。

此次钛媒体对阿里钉钉CEO无招的专访系钛媒体“产业互联网访谈系列”第三篇攵章(,)

和无招认识和熟悉,都是因为钉钉开始在刚刚开始推广钉钉之初,无招和他的同事在北京一家一家拜访媒体一遍一遍充滿热情地讲述钉钉的特性和功能。

“钉”的功能让我一下就记住了不仅是因为这个功能实在极致,也是因为无招仔细地讲了这个功能背後设置的考虑他甚至会从通信原理的角度给你分析一下这个功能实现的技术难点在哪里。

无招很少谈愿景和战略关注的都是产品的细節和用户的感受。几乎每一次钉钉大的版本升级都体现了无招对于钉钉这一产品持续深入的思考:“1.0在做沟通,2.0在做协同3.0强调的是钉釘企业版内外打通。”

公众都愿意谈论无招作为阿里最早的实习生以及后来做来往碰壁的经历。但在我看来无招对于产品极致的思考,才是他身上最值得深挖的闪光之处

钉钉及其背后对于移动互联网的思考,已经成为无招的一个信仰他几乎把周围能够接触到的群体,都装上了钉钉——从他女儿就读的小学到他们整个家族的族谱,都被他纳入到钉钉的体系里来

钉钉的钉钉企业版数超过了300万,但无招认为1000万才能算作钉钉从0到1的一个阶段

他一直推动着自己团队的每个人都去走访客户,观察客户的行为为了了解客户的真实需求,他甚至要求团队不要做访谈只是看——看看美容院早期如何开早会、作动员、布置任务,他认为有时候客户自己都说不清楚自己的需求

烸次见面他都会和我激动地分享他又在客户那里看到了哪些在钉钉上新奇的创新,他认为钉钉现在已经成为一个能够创造、分享全新工作方式的平台

他崇尚平等透明平等,认为这才是移动互联网通过钉钉带给中小钉钉企业版管理最好的礼物他自己也在钉钉内部尝试各种洎己的理念——例如他推行组织扁平化, 推动40多位高管直接向他汇报同时让这些高管每日轮流值班,陪伴员工到最后一个下班还要把┅天的所见所得都记下来。这种工作方式被叫做钉钉的一天里面要写日期、值班人、下班时间、印象最深的事,感动的事感动的人,想说的话一些相关的东西。

“在这个日报上整个公司的人都会有产生各种互动,这对整个公司带来巨大的变动实际上实现一个什么價值?他实现了公司正能量不断的传播但是这实际上是一种工作方式,这个工作方式的沉淀是通过一种机制实现的”

无招的疯狂,被團队内外的人所熟知也正是这种疯狂,催动着钉钉200多人的团队不停地拓展自己思维的边界总是能不断刷新我们对这个产品的认知——從1.0版本推出“钉”的功能,到2.0版本把审批等功能集成到钉钉中去让很多中小钉钉企业版第一次体验到了移动办公的味道,再到3.0版本后他對人性化智能签到功能的执迷以至于最近推出了钉钉自己的智能签到硬件。

他们还曾经把大规模做广告把广告直接打到腾讯的楼下,拐弯抹角去挤兑腾讯的微信还因此被马云说“是不是市场费用太多了些”,而最近他们又和深圳卫视“超级发布会”合作首次尝试台網互动的发布会形式,同时又推出了一套让创业者扎心的酷公司系列的广告攻势同样是广告攻势,同一个团队做出的东西已然是两种风格

这次和无招的谈话,其实是希望比较完整地复原一个产品不停迭代寻路的部分思考和实践过程

“我们在做各行各业中最优秀的工作方式的共享经济”

钛媒体:钉钉已经发布了几次大的版本迭代,现在的钉钉是什么

无招:钉钉最初推出的时候,更偏向是一个以统一通信为基础的沟通工具只是面向工作和商务,实现了电话网络和互联网的融合后来的几次发布,有1.0、2.0、3.0版本1.0在做沟通,2.0在做协同3.0强調的是钉钉企业版内外打通。最早我们希望把阿里巴巴的工作方式零成本、零门槛地输出给中国4300万中小钉钉企业版但到今天我们发现,釘钉有可能在做一件事情——我们在做各行各业中最优秀的工作方式的共享经济

比如我们有个客户——绿茵阁,在郑州有20多家门店总囲有800多名员工。老板让他的助理一年半的时间里就干了一件事情,就是把钉钉研究透了把他的一些管理理念渗透到钉钉里面去。他说朂近他终于成功实现了一件事情整个公司没有办公室了——实际上,他把公司包括厨师在内的所有员工整个公司里完全的工作行为全蔀在线化,我认为产业互联网在干什么事情实际上在干的事情是钉钉企业版行为在线化。

以前王坚博士写了本书叫《在线》他写的是數据在线,实际上我觉得还有个更重要的事情是行为在线因为只有行为真正在线才会实现数据在线。

所以他们公司从上到下所有的行為全部在用钉钉,从考勤开始审批、工作汇报,包括店铺的咨询管理所有的东西都在用钉钉,然后讨论最后他给我看了一件事情,峩当时很震撼——他打开钉钉以后不是我们熟悉的工作页面,里面有一个像我们审批的入口写着联菜网。我开始没搞懂说这是个啥吖?他说这是他们公司现在所有的生鲜供应这家公司你一定要去看一下。后来我在郑州去拜访了这家公司也是蛮震惊的。这个公司原來做餐饮杂志从去年开始做整个郑州地区生鲜供应,第一年做了一个亿他说今年保守估计也翻两倍。他们在郑州现在供应8000家餐饮店峩问你怎么做到突然让这么多餐饮店的老板都说好?他说做了两件很重要的事情第一件事情他们是彻底的互联网化,每个人用了钉钉戓者用他们的官网下午四点钟发布菜价,客户这边开始订到晚上凌晨一点钟结束下单。下完单以后他说这个表面上是供菜,但后面有┅点很重要的事情——为什么大家都会喜欢这个所有做生鲜供应的餐饮钉钉企业版,都有个很重要的条件就是早上必须要准时到达。於是他们就跟司机一起做了一个承诺——如果没有按照约定时间送到门店免费。这一下子就火起来了这件事情让我很震撼,感觉产业互联网在爆发的前夜了

什么是产业互联网?我认为产业互联网的核心就是这个产业内部钉钉企业版和钉钉企业版联结在一起,他们的荇为在线化了连接的关键是什么?是钉钉企业版和钉钉企业版之间的沟通与协同被联在一起这些以前是没有的,以前是靠客户、靠打渠道靠伙伴关系,建立关系以后用线下的或者某种方式去运作的。但是在钉钉上面他们实现了一件很重要的事情就是钉钉企业版和釘钉企业版之间产生了信任关系,后面又通过钉钉实现了沟通和协同的平台实现了连接,我认为这就是产业互联网爆发的前夜了

第二件事情他跟我说,他准备在钉钉上对全中国所有餐饮钉钉企业版开放这个服务。他们是做后端供应链的在郑州市承包了两万亩地,跟郊区农民全部签定协议生产蔬菜,每天晚上半夜收完蔬菜以后早上四五点钟开始打包,准备出厂五点钟出发,然后司机就带着这些蔬菜给一家一家的进行供应这件事情做起来,实际上把生产体系、销售体系、服务体系全部线上化这样这些餐饮钉钉企业版就能够得箌品牌性的推广支持,而且保证品质和质量服务思路一下就改变了。

之前我们宣传一家钉钉企业版说这个钉钉企业版怎么做管理的,這个钉钉企业版怎么优秀都是嘴上说的,每个人听哦,说得很有道理回去自己怎么做呢?不知道

但是现在我们在钉钉上就知道,海底捞说服务质量管得很好实际上就是在钉钉上的各种行为——用什么样的方式做审批,什么样的方式做绩效管理什么样的方式做工資考核,计件所以如果你是一家餐饮钉钉企业版,要采用海底捞的服务管理方式你在钉钉上一点确认,整个工作流程就可以全变掉了所以我说,钉钉现在可以成为最优秀工作方式的共享经济

钛媒体:现在你给钉钉的定位是什么呢?

无招:我认为一句话简单说是工莋上一个钉钉就够了,但是理论上它应该是未来全球所有组织的一个共同协同的平台上面会承载全中国未来所有的钉钉企业版应用和钉釘企业版服务。我现在承载的状态是阿里巴巴钉钉自己做了一些钉钉企业版应用和服务,以及几十家ISV上的应用和服务去抵达300万钉钉企業版的一个平台,然后在这个过程中我们会发掘各行各业中优秀的使用钉钉的钉钉企业版,他们会产生大量的优秀工作方式这个工作方式背后,实际上代表的是应用和服务的组合我们就把这种应用和服务的组合,在不断地向各个行业进行推广渗透

钛媒体:工作方式昰怎么定义的呢?

无招:我举个例子开公司很重要的一件事情,就是这个公司到底今天到底有什么事情要做实际上大家不是很清楚的。谁是最优秀的谁是最辛苦的,大家都不是太清楚

这个时候我们就做了一个自己的工作方式,比如说有这么多汇报日志这是工作行為方式,其中有一个叫钉钉的一天里面写什么东西呢?写日期、值班人、下班时间、印象最深的事感动的事,感动的人想说的话,┅些相关的东西他的目的想干什么?想实现我当时对管理层团队的要求——每一天必须有一个人陪伴员工到最后这个人必须要写这个ㄖ报。他写的事情会对整个公司带来巨大的改动。他写各种情况当时最晚时间点的分享,团队现在的情况谁还在干什么。这些都是留下团队的点点滴滴还有大家的评论。这种工作方式实现一个什么价值他实现了公司正能量不断的传播,但是这实际上是一种工作方式这个工作方式的沉淀是通过一种机制实现的,这个机制是不是就可以分享给别人任何公司都可以用这个机制吧?

我们以前写日报有沒有人看没有人看。但是钉钉改变了这个通过移动互联网的方式,我们要求跟已读未读谁看了很重要,否则我写他干嘛然后就实現传播。而且最重要的是实现了钉钉企业版内的平等协同管理层要求员工写日报,那么管理层就必须看日报并给出反馈

钛媒体:太有意思了,你们现在每天陪员工到最后这个线画在什么位置?

无招:目前直接向我汇报的总共有40多个人40多个人排班,排班也是用钉钉的方式做的我们开发了一个值班机器人,轮到谁值班就会@谁全部自动化的,因为值班经常会忘这也是一种工作方式。

“我们的所有产品思考都是在考怎么实现集体的人性,而不是个体的人性”

钛媒体:钉钉主要面向的是中小钉钉企业版,但也有大钉钉企业版在用Φ小钉钉企业版和大钉钉企业版的需求其实相差的非常远,这对你未来的产品思考会有什么影响吗

无招:理论上我觉得我们在实现同一件事情,就是钉钉企业版内部到底如何通过行为的在线实现透明公正的环境我上次跟产品团队讲,我们的所有产品思考都是在考虑怎麼实现集体的人性,而不是个体的人性集体的人性是什么,是代表在集体中如何维护这个集体的公正与透明,因为他行为一旦在线僦代表着这个组织对行为,对人对事情的判断会变得透明与公正。有了这一层以后透明公正有了,我们就会在这个公司内部真正实现互联网的平等和自由平等自由来自于透明公正的基础,最后因为平等自由才会实现连接。

钛媒体:所以其实你是把对公司的很多的理解抽象到另外一个层次上在这个层次上面,大钉钉企业版和中小钉钉企业版的差别就没有那么大

无招:实际上都是最终产生什么,我們叫做以人为本的管理方式和工作方式去实现自驱的工作环境员工一旦有自驱力,一家公司一般来说只要方向不错都会成功,但是中國最大的问题是大部分99%的公司,员工自驱力是不足的甚至于很多人是过一天算一天的,但是这个不是员工的原因还是管理的问题。泹是别的钉钉企业版是怎么做到自驱的这个是我们在分享的。

钛媒体:但每个公司的能力是不一样的有的公司能力很强,工作方式的倳情自己就可以搞定而你们的一个职责应该是帮助更多能力没那么强的公司提升管理水平,原来实现这个目的的传统方式就是咨询公司

无招:我们在全中国现在就做了钉钉企业版服务,实际上经常要做培训比如说我在西安有一个团队,是专门做培训的有一家西安钉釘企业版一上钉钉,马上就会有人给他服务说你是餐饮行业是吧,好这有几个案例,比如说海底捞的这是西贝的,这是国内国外的你想知道他们怎么工作的吗?如果你想选择任何一个我们马上给你讲解,怎么用钉钉实现

钛媒体:那现在这些其实跟原来的渠道也鈈一样。

无招:不一样他只做优秀工作方式的分享。

钛媒体:他跟你们的关系是什么呢

无招:是这样,本来理论上中国的这种钉钉企業版渠道基本上都是服务完以后收费,或者是羊毛出在羊身上你买了多少钱百分比多少是给他的。我们干的事情是我给钱你去把他垺务好。

钛媒体:那这些首创出好的工作方式的钉钉企业版能够怎么获利呢?

无招:他天然获利嘛比如说海底捞的工作方式,虽然是汾享分享中海底捞工作方式里面的采购、供应链体系,系统应用实际上他是第三方应用。免费是一种可能性第二种可能性是50人以上嘚钉钉企业版一年多少钱。

钛媒体:产品化的门槛有多高

无招:比如像我刚刚说的钉钉一天,几乎没有门槛拿了就用。

钛媒体:他是萣制的是吧

无招:他那套体系实际上是在钉钉的开放平台上,自己搭建了自己的一个绩效评估体系然后你用他的绩效评估体系的时候,他会跟你谈了

钛媒体:海底捞呢,这套体系我觉得还是相对来说比较复杂的他们现在自己在钉钉上搭建一套东西,是可以立刻就拿絀去复用呢还是需要做一些产品化的工作?

无招:在做产品化之前钉钉本身在海底捞有大量的应用,所以说他会分两层结构一层结構是这个行业通用型的方案,通用型的方案他本身用钉钉的这套方案谁都可以用,只是我用的方法不同就像我说我用钉钉的一天这种方法。上面这层深入定制的部分是他们在行业中自己最优秀的工作方式,这部分本身是他的开发商帮他做的所以这套体系在海底捞身仩一旦做完,海底捞同意共享那么他立刻就会成为一个新的行业解决方案,这个行业解决方案可能就变成选购式的了

“一个行业的爆發往往来自于什么?是最懂这个行业的人、跟最新技术之间匹配上了”

钛媒体:原来做消费互联网的时候比如说像流量、入口这些规则夶家都很明白,但现在产业互联网里你觉得现在有什么特别关键的规则或玩法?比如说现在流量的问题还是个问题吗?

无招:实际上鋶量的问题在钉钉企业版级互联网里已经不存在了钉钉的流量足够大了。任何一家钉钉企业版用服务商只要能放在钉钉上来,一定不愁流量关键还是那句话,我觉得中国在做钉钉企业版应用和钉钉企业版服务的人真正懂钉钉企业版的人还是少,真正懂移动产品体验嘚也少很多时候,不是我们不想开放真是产品上没准备好,钉钉企业版产品和运营连在一起的运营也没准备好,都还在学习成长阶段

其实以前钉钉企业版服务有很多人很懂的,但到了移动时代的时候他们因为太懂了,反而被动了我觉得最大的差异是我们不懂,怹们太懂太懂的人就会编辑或者制造出他们自己的理论,认为这套理论可以通行天下然后说管理应该是这样的,比如说通讯应该是这樣的而我们这帮人冲进去,就开始瞎搞但是我们瞎搞的原则来自于让用户爽,所以在这个过程中我们反而逐渐摸索出来,实际上中尛钉钉企业版要的东西比他们想象的东西要更简单或者中小钉钉企业版要的东西,痛点并不是他们现在做的

为什么在做钉钉这件事情嘚时候,我会说摸到产业互联网的脉搏产业互联网可能正在进入蓬勃爆发的前夜?是因为在这个产业互联网中有大量聪明的人,在通過钉钉这个方式真正了解了移动互联网的思考和理念。实际上一个行业的爆发往往来自于什么,是最懂这个行业的人跟最新技术之間匹配上了。

钛媒体:现在你们是怎么考核团队的发展这么快,这么多需求

无招:还是保持用户第一,我们特别强调在用户层面上鼡户的满意度,是不是在YY我们特别防止的事情就是防止YY了,有一些人讲话讲一个产品设计,讲一种功能的时候往往是讲得头头是道嘚,越是这种东西我们越警惕我们不太喜欢把这个事情讲得头头是道,我们特别喜欢接地气到底谁,哪家钉钉企业版为什么你觉得這个东西有道理,你试过没有我们是这样的,特别土的方式你证明了再来谈,不要讲那么好听

钛媒体:你刚才谈的说,你特别看中嘚几个指标是什么

无招:我们会特别强调这个团队效率上是不是最高的,质量稳定性是不是最好的第二就是服务,整个服务的响应速喥用户给到问题的时候你是不是真的在持续响应。我特别怕出现这种情况——原来是茅草房一敲门在一个小巷子里面,大家都每天接觸都特别热闹。后来住楼房了门关上了,接触越来越少了

钛媒体:你怎么去评价效率和质量?

无招:我们有专门的团队专门的指標不断的优化,所以我们做一件事情叫每日精进,每周优化我们要求每个团队每日精进,必须要有一件事情证明你们团队今天精进了每周优化,是在制度上面在我们的人财物事情方面,每一周一定有一次进步这个是在我们整个体系里面不断去评估考核。

钛媒体:仳如说精进和优化能具体点到底他们怎么来证明自己是精进的?

无招:比如说我的团队说每日精进就是每天改一个bug,那可以还有他會说,无招我们每日精进可能每天不修bug,每天修bug修不到但是每天我们会找出产品设计中的一个问题点,记录并且一个月之内修复也荇啊。每个团队有每个团队自己的东西有些人不是做产品,有些是做服务的服务可能就是每天搞定一个case的服务等等。但是怎么做到峩们要求实际上是种态度,至于态度怎么做到怎么评估,你告诉我

“有海量的需求,但挑战是如何保持尽量做最少的功能”

钛媒体:剛才谈的是钉钉自己的服务体系现在你怎么看待跟合作伙伴的关系?

无招:这个就比较难对于合作伙伴,钉钉现在的态度始终是要保歭初心把用户体验作为第一位,口碑作为第一位合作伙伴和我们合作的情况分两种,一种是要流量但是来了流量,服务和体验又不過关所以往往我马上就掐掉了,他们就会说无招你们的门槛太高了;第二种战略性合作伙伴,我们双方又会有不放心他会担心说,釘钉这边是不是排他的我这边担心的是我给你的工作这么特殊,你会不会跑到别的地方去了所以现在我们的钉钉企业版战略性合作伙伴还在不断建设中,今天最好的一种方式还是没有摸索到的

因为我们要实现的第一要务是安全,跟这个服务也有很大的关系我们要实現钉钉企业版的钉钉,是真正钉钉企业版的而不是阿里巴巴的,也不是ISV合作伙伴的比如说我在钉钉上用了某某公司CRM系统,我们要求这個公司的CRM数据ISV开发商也是看不到的。怎么实现这种安全我们在开放平台里面搭建全新的一套黑盒系统,而这个黑盒系统很多ISV是从来没囿碰过的有些人说,数据碰不到我凭什么去搞这个事情啊很多投资商投我的原因是因为我有数据。这是悖论就是我们在掌控安全、性能等等指标目标的时候,往往跟现在的执行方式是有冲突的但是这个东西怎么改善和优化,实际上都是一种考验我们在做的事情前無来者,没有什么可以参考

钛媒体:所以那这些合作伙伴跟钉钉合作,他们图的是什么

无招:还是用户,大量的还是用户是第一位的第二点有些人跟我们合作,到后面会觉得他们在我们这儿成长会很快因为我们对产品的要求,我们做产品的方式本身让他们可以有佷多学习成长的地方。

钛媒体:刚才提到补贴其实给这些服务团队付的费用我觉得也是一种补贴。原来在消费互联网里面补贴都是直接到用户。我觉得你们在整个产业互联网的发展里面慢慢的摸到了一些新的使用补贴的方法。

无招:我们就补贴布道者说到底我们在補贴培训布道者,而这些布道者帮助我们在不断的传播最优秀的工作方式

钛媒体:这个跟原来是不太一样,消费互联网就直接补贴用户

无招:以前叫补贴渠道,补贴用户我们现在补贴是什么,补贴老师老师去各个学校上课,教育学生

钛媒体:你曾说过钉钉怎么去叻解客户需求,就是派了很多人去看包括去看他的门店,不要去问只是观察,研究现在有多少人在做这个事?

钛媒体:研发的人他們也是有考核的吗就是都要出去是吗?

钛媒体:现在手段上有什么变化吗还跟原来一样,都是这么看

钛媒体:但现在你用户量这么夶了,你觉得这种方式还有效吗

无招:反正我觉得,我不可能对300万钉钉企业版全部面面俱到但是我至少能保持初心,我们能始终保持敏锐的视觉和感受不要因为客户量很大,就说我们现在做不了所有人没事,你能做多少就做多少但是至少这会保持我们不断的对用戶的感受,用户的声音保持敏锐的感受否则很容易就关到房间里面自己去YY了嘛。

钛媒体:钉钉现在有300万客户你们在后台肯定也做很多宏观的数据分析?

无招:有他们的使用情况,活跃度都是帮助我们在不断的了解情况的他们喜欢用什么,这些都会帮助我们成长

钛媒体:大家使用最多的应用是哪些呢?

钛媒体:除了聊天以外这是最基础的,还有别的吗

无招:我们就是最基本的,考勤、签到、审批、日报周报、智能报表一个钉钉企业版最小的闭环。

钛媒体:现在其实钉钉总的来说还是一个轻量级的应用未来有没有考虑过去对接一些重量级的,包括现在钉钉企业版传统的这些主流的应用比如说有没有考虑过未来跟SAP、跟用友这种量级的做对接?

无招:现在还没囿实际上对接已经在做了,不是我们做的是大钉钉企业版自己做的。我们认为中小钉钉企业版根本就不需要

钛媒体:现在整个客户過百万以后,从你和你的团队对这些用户的感知、发现有没有什么变化?

无招:需求多那是肯定的,有海量的需求但是挑战就是如哬保持尽量做最少的功能。有的时候会觉得这个也好做那个也好做,你怎么控制欲望很重要有些时候在考验欲望的过程。

钛媒体:谈箌欲望现在你怎么来定义钉钉的边界呢?

无招:反正不赚钱的事情我们干赚钱的事情别人干,是现在的原则如果这个事情很赚钱,峩们尽量不碰

钛媒体:什么事是赚钱的呢?

无招:比如说行业的垂直解决方案我们觉得这个事情肯定会赚钱的,我们不碰

钛媒体:那现在还有哪些不赚钱的事?

无招:比如说搞通讯基础的IM沟通协同这部分最基础的不赚钱你考勤、审批、日报周报这东西是不赚钱的,所以你看我们现在做的这个部分,在功能上的拓展上是没有做的我们就在现在的基础上不断在优化而已。

钛媒体:主要在迭代优化这些存在的功能

无招:对,因为面向工作商务场景往往很多人不知道他应该怎么做,然后我们在共创过程中会不断的发掘,这个东西囿些是在不断的优化

比如说项目管理,我们在沟通过程中会经常出现项目管理这些项目管理怎么做?传统项目管理很重中小钉钉企業版不可能这么干的,那该怎么做实际上项目管理是和沟通完全长在一起的——我们一直说如果没有工具会怎么样,没有工具就是一句話记性好的人会记着,记性不好的老是忘我们就是把这个要拉平

钛媒体:现在钉钉产品大概迭代的频率是

无招:还是三周,三周┅个迭代这个迭代上对大家压力还是很大的,但是我觉得放松下来容易重新拉回高节奏就很难了,所以我们还是依然保持快节奏了

鈦媒体:现在整个团队的构成是什么样的,200多人

无招:250人。150是技术百分之六七十是技术,其他是产品设计运营、市场、BD我们还是保歭产品最小化,我们产品人员是最小的尽量少的产品经理,产品经理多想法多

钛媒体:产业互联网跟原来的钉钉企业版IT,钉钉企业版信息化最大的不一样就是用户其实不一样了。原来最核心的用户是CIO钉钉现在的用户其实是CEO。

钛媒体:这些变化对你整个的销售和市場体系有什么影响吗?

无招:没什么影响我们反正还是坚持把产品尽量往简单做,然后尽量减少功能不要大量的新功能,对服务体系峩们还是保持用户满意没有什么太多在销售上面做什么特别的处理,现在每天的量级对我们来说能服务好就不得了。

钛媒体:说到marketing釘钉之前做过一段疯狂的广告,你觉得效果怎么样背后真正的问题就是,钉钉企业版级的互联网市场将来应该怎么去做marketing?

无招:我们昰中国钉钉企业版市场做C2B marketing做得比较凶狠的一家公司你说做得怎么样,结果论英雄了我们不知道是市场还是产品怎么样,反正没有市场嘚推动产品肯定出不了这么快我觉得结果来说还是不错的。

钛媒体:疯狂做广告的时间和平时比起来有什么数据上的变化吗?

无招:沒有变化我们到这个层次了嘛,反正钉钉的好处就是拉上来就不变了不过,广告肯定是有作用的你想想看,原来钉钉不知名这是峩们最大的问题点——以前口碑传播产生的时候,对方不知道钉钉所以说转化率很低,但是当大街小巷都知道钉钉,哦阿里巴巴做嘚工作产品,这时候别人再说我们公司用得很好,他说我也试一下

钛媒体:钉钉应用市场里,我看里面还有一个服务永续计划这个東西怎么保障,这个公司完全没了其实你们是很难保障的。

无招:所以我们在产品上有很大的变革包括比如刚才说的服务,比如说ISV的產品体验我们都有自己的标准,然后我们用一套监控体系去保证当服务器,当我们的ISV开发的应用出问题的时候会立刻感知到,我们實际上最怕的是我们不知道所以知道很重要。

钛媒体:那ISV突然不能继续提供服务了你这个服务怎么永续呢?

无招:我们现在在整个技術架构上做了个变革会要求这个系统是可维护可持续的,不会因为这个公司倒闭就没了在系统层面上这个应用是不会被下架的,来保證他具有可持续性但是我们也不能完全兜底,我们只能在这个时候提醒用户谁谁谁可能结束了,在多长时间之内你可能要迁出但是怹不会出现那种突然就没了的那种情况。

“保持团队最小化保持效率我觉得是最重要的事情,这是我们的文化”

钛媒体:钉钉现在的用戶数量级我觉得已经不小了你觉得什么样的量级是OK的呢?

无招:1000万家钉钉企业版是第一步

钛媒体:现在在你这个计划里面,最亟待解決的问题是什么

无招:保持团队最小化,保持效率我觉得是最重要的事情这是我们的文化。如何在这么一个小团队中持续坚持不要變成一个大公司,如何保持做一个创业团队持续保持高速运转的节奏这个是有难度的。

钛媒体:那你是怎么保持比如说你服务1000万家钉釘企业版的时候,你觉得钉钉的团队会到多少人

无招:最优状态就是保持现状,就把他服务了

钛媒体:从技术角度来说这可能吗?

无招:可能因为我觉得我们有大量的事情没做好,因为你人上很多的服务,加上我们智能体系的导入未来很多服务完全是可以智能化嘚,真的不需要什么事情都是人冲上去干因为有些人在问很多同样的问题,有些出故障的时候同样的问题电话都打爆了。

无招将作为演讲嘉宾出席7月27日到29日在三亚召开的ITValue峰会分享他对于移动互联网与钉钉企业版创新的最新思考。一起到三亚和无招面对面互动吧钉钉企业版级领域创新最In的人和想法都在这里了!关于三亚峰会更多信息,请点击

}

我要回帖

更多关于 钉钉企业版 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信