一开始,我们公司招聘了两个数据挖掘岗,其中一个满嘴名词乱飞,spark,storm,什么的,整天对业务指手画脚,大家也对他充满误解,整天让他拉数据,试图证明自己的各种歪曲观点。另一个很闷,真的整天只会搞搞算法,做些无足轻重的研究。这两个人这么耗了9个月,可是说基本产出为0。
后来,老板感受到了大数据的故事性,以及背后切实的价值,下大决心要组建大数据团队,委托我招聘,一期他给了20个数据挖掘岗的指标。而我是后台开发工程师。我硬着头皮开始招聘。
招过毕业生,也有有工作经验的。从去年12月,到今年2月,有四个加一个实习入职了。基本上按照常规模式在那里工作,直到3月,我被认命背负业务指标,指导大数据从事生产,他们向我汇报。
我按照自己想法,给了最基本的拟合类训练任务,要一个最最简单的分类器。并且限期完成,发动大量工程师帮助他们处理数据,理解业务。
到四月开始产出,我把结果直接投入生产。这让他们感到了工作的意义。
在这个过程中,我发现,真正的困难不在学术层面。工程才是最大的问题。于是开始着手解决大数据的工程问题。在我建议下,老板答应花高价聘用了一位大数据工程师,背景主要在大互联网团队从事大数据基础架构开发和运维。
然后,用比较便宜的价格,组建了etl团队。
至此,整个大数据事业基本纳入正轨。
故事讲完了,后面是一点感想。
1 工程问题是很大的问题,要最少3人建制团队解决基础架构和运维事宜。最少10台的中高配置云服务器。
2 科研型数据挖掘岗不必人很多,可以找纯学术的,也可以找纯商业的,比如偏运营,偏画像一类的。个人认为最多4个就够。贵精不贵多。也不必很贵,多数业务不用大牛。各类算法都很成熟了,愿意悉心研究业务,下沉心态,这样的人很难得,要珍惜。
3 etl蛮重要的,反倒不怎么贵,一开始要有2到4个。
整体感觉下来,一开工,就是10个人力的投入,对一般小公司来说,就是很大的开销了,非要有点决心才能狠下心来做。这个规模,已经可以做不少事情了。
现在,我的团队初具规模,已经可以有不少价值了,我要为他们头疼的是,怎么不断找到增长点,因为我知道,很多东西,很快会到瓶颈点,那时候的后路必须准备好。
--Update:
貌似不小心得罪了ETL工程师,很抱歉。每个工种都有高级,中级,初级的区别,目前我们按照比较初级的要求招聘的ETL工程师,感觉也够用了。可能后面会出现瓶颈也说不定,不是说这个工种就全部便宜,实在抱歉。其实,后台也好,前端也好,测试也好,都有贵有便宜,主要看岗位需求。
以上只是一种经历而已,并不一定就是正确的方案,写出来跟大家交流一下。而且事态也在发展,后续也可能会渐渐变化。