141 数据科学家团队组织架构:水平还是垂直,这是个问题 周一我们聊了数据科学家培养的话题,我们分析了数据科学家培养的重要性,要从技术的提高和整体的团队协作几个角度来进行培养。

今天我们来讨论数据科学家团队高级话题中的最后一个,也是非常现实的一个问题,那就是对于一个组织来说,究竟应该形成怎样的组织架构呢?是选择一个集中式的数据科学家团队或者叫水平式的组织架构?还是成立一个分散式的、每个产品部门都有数据科学家的垂直式的组织架构呢?对于很多公司或组织来说,在构建一个数据科学家团队的时候都会遇到这个棘手的问题。

水平架构的数据科学家团队

什么是水平架构的数据科学家团队呢?简单来说,那就是一个公司或者组织的所有数据科学家都在一个团队中,有一个统一架构管理,比如一个数据科学家总监或者一个首席科学家。这个团队负责和公司所有的其他团队合作,提供数据科学以及人工智能解决方案。

例如大家熟悉的微软研究院、谷歌DeepMind、雅虎研究院、IBM研究院、Facebook人工智能研究院都是水平架构团队的卓越代表。

水平架构的团队有哪些好处呢?

第一,便于管理。这些团队有统一的招聘标准、业绩评价标准、员工晋升标准和内部的运作模式。这些管理体系的建立是需要时间和经验的。统一的管理常常意味着高效,大家对这些管理上的细节有统一的认识,因此整个团队对内管理上能够更加方便快捷。对于希望快速发展壮大的一些组织来说,这一点尤为重要。

关于这一点,很多管理者其实并没有完全理解,难免出现因多个相似团队存在而造成一些不必要的内耗。比如说,如果一个组织内部在没有协调的情况下出现了两个人工智能团队,而这两个团队各自有一套招聘方法、人员评定的方法以及项目管理的模式。如果没有足够重视,那很快就会演变为激烈的摩擦,从而无法让团队真正有效地运行。在很多公司的发展中都有这样的例子,因为有多个类似的人工智能团队而无法集中资源。

第二,品牌效益。刚才提到的类似微软研究院、雅虎研究院以及IBM研究院都是卓越的品牌。一个组织一旦形成了品牌,那就可以相对比较容易地收获一些品牌红利,比如说招聘的便利。很多年轻的研究员或者硕博毕业生的首选都还是进入知名的机构或者团队。甚至有很多时候,年轻的工程师或者科学家都希望追随某一位在这些组织获得成功的学者或者前辈,于是就考虑加入这些团队。还有一些优势比如在社区里的话语权效应,典型的例子就是谷歌的TensorFlow框架,这个框架就是凭借着谷歌以及DeepMind的品牌优势,从而能够在众多深度学习框架中后发制人,迅猛发展。

第三,团队对外协作变得更加清晰简单。这里主要是说和公司其他部门之间的协作会变得更加明了。试想公司现在有一个新的产品部门,希望能够利用人工智能的一些技术来构建自己的产品,那么如果公司内部有三个不同的人工智能团队,有几套差不多的系统框架,对于这个新的产品部门来说,该如何选择合作呢?这势必又会引发我们刚才提到的团队之间恶性竞争的问题。

垂直架构的数据科学家团队

刚才我们主要分析了水平架构团队的一些优势,中间提到了垂直架构团队的一些问题。那是不是垂直架构的团队就没有任何优势了呢?

凡事肯定都有正反两面。

垂直架构的团队往往是从不同产品线的需求中慢慢演变而来的。举个例子,在类似Facebook、谷歌、雅虎等公司的内部,搜索、推荐以及广告部门往往由于各自的需求不同,在历史的进程中,都分别组建了自己的具有人工智能性质的团队。这些团队在发展过中,也都形成了一些自己的软件框架以及成熟的算法模型。由于这些产品线细节的复杂性,对于很大的公司来说,这些差异性所带来的麻烦就需要不同的团队来支持。同时,因为有不同的团队来做人工智能的研发,从整个公司的层面来看,公司会更加“坚韧”,也更容易有不同的创新点。

如果仅有一个集中的水平团队来支持公司所有的产品线,随着公司产品的增多,这个水平团队的任务将会越来越重。并且,这个水平团队将不可避免地开始选择那些这个团队认为更加重要的功能加以支持,这必然就难以满足所有团队的需求,正所谓“众口难调”。这个情况下,也就给了其他团队一定的“借口”开始发展自己的人工智能团队。这其实也是很多公司里,不同人工智能团队发展的一个轨迹。在某种程度上,这种情况也是“解放”了这个水平团队所承担的重负,让每个产品团队最终能够有比较完整的自主权来发展。

垂直发展模式是大多数公司发展到一定程度所经历的现实阶段,也是超大型公司规避技术风险的一种方式,即不同的团队之间互为“备份”,整个公司的发展存在合适的内部竞争。

混合组织架构

其实你可以想到,在水平结构和垂直架构之间,存在着一种混合的模式。这种混合的模式往往是希望能够汲取水平架构和垂直架构两者之间的优点,从而能够更大地发挥效益。

举例来说,谷歌存在DeepMind这样的水平架构人工智能团队,但同时各个产品组也有不少人工智能研发人员。这样,垂直的架构分布在各个产品组,能够保证产品线的正常运作以及不断推陈出新,又能够保证有DeepMind这样的相对比较独立的机构拥有较高辨识度,形成一个比较完整的实体可以进行更多的创新和尝试,而且也能够有一个清晰的品牌吸引人才。类似的情况还有Facebook的人工智能研究院和其他工程产品线内的人工智能团队的关系。简言之,就是希望用一个较小的、更加核心、更加精英化的水平团队以及各个产品线中的垂直团队一起相互作用

当然,从管理的层面而言,这样两者都需要的混合模式对公司的领导智慧和协调能力都是极大的考验。事实上,你可以发现,在上述的区分中,产品团队中的人工智能研发人员和这个更加精英的水平架构的人工智能团队之间可能会产生不信任的摩擦。举例来说,理想状态下,这个核心的团队应该做一些更加超前的创新和思考,而产品的团队做一些更加“接地气”的项目。但是,有的时候产品团队中也会有工程师或者科学家的能力其实不错,也能做超前的研究和创新。慢慢地,就会让人觉得这个核心的研发团队的名声和实际在公司内部的影响力“名不副实”。

在混合模式下,我们现在还不能说业界已经有一个成熟的模型可以供大家参考了。很多在尝试的公司也在水平和垂直的架构中互相摇摆。

小结

今天我们分析了如果要组建一个数据科学家或者人工智能团队,你需要建立的是水平架构的组织还是垂直架构的组织。

我们来进行一个简单的总结:第一,我们讲了什么是水平架构的团队组织,这样的组织有什么优势;第二,我们详细梳理了一下垂直架构组织的由来,并且帮助你理解这种组织架构的现实原因和在大型公司中的好处;第三,我们简单谈了谈对混合架构的摸索。希望这些内容能给你一些启发和借鉴。

最后,给你留一个思考题,对于一个初创公司来说,如果希望建立人工智能团队,应该选取什么样的架构呢?

参考资料

https://learn.lianglianglee.com/%e4%b8%93%e6%a0%8f/AI%e6%8a%80%e6%9c%af%e5%86%85%e5%8f%82/141%20%e6%95%b0%e6%8d%ae%e7%a7%91%e5%ad%a6%e5%ae%b6%e5%9b%a2%e9%98%9f%e7%bb%84%e7%bb%87%e6%9e%b6%e6%9e%84%ef%bc%9a%e6%b0%b4%e5%b9%b3%e8%bf%98%e6%98%af%e5%9e%82%e7%9b%b4%ef%bc%8c%e8%bf%99%e6%98%af%e4%b8%aa%e9%97%ae%e9%a2%98.md