前言
我记得之前有人跑过来问我:你知道为啥字节面试总会考算法吗?我没有回答,一方面是算法是大厂必考的东西,既然是必须的东西究竟个为什么有点白费心机,第二方面我没有进去过字节,所以我也拿捏不准为什么。
今晚我在朋友圈看大学同学发了字节的招聘,忽然这个问题就引发我的冲动想去请教一波,哈哈
算法
先说说我的想法:算法作为基础功底,不管是在排序、去重、找出差异集合等等场景,都会有它的身影,只不过被封装起来了,让开发不需要去关心算法是怎么实现的,直接开箱使用。由此可见,算法是直接影响很多领域的技术功底,在各大厂面试出现也不足为奇。
在技术层面运用上,我是有一次接触到,那就是全链路灰度方案,里面有重写负载均衡算法,相信各位了解rpc原理到小伙伴知道,负载均衡算法也是高频的考点,也是rpc实现的一部分。
在业务层面,我现在比较少接触到,不过一些骚操作倒是有场景,比如说数据从A同步到B,现在数据不一致了,导出AB的数据出来,对比下哪些数据多了,哪些数据少了。我当时是直接暴力解法,java8 stream filter将那些不在另一个数组的搂出来。当然这也是有更好算法的。
我同学的说法引起了我的注意
- AB 实验为何值得信赖?
字节AB Test的文章我看过几次,不过总是忘记,它跟灰度流量还不太一样,灰度流量是针对特定用户、用户群体进行处理,字节方案更偏向于业务层面,它需要同样比例的流量引入两个不同的方案,然后观察对应方案的效果。如果上图讲的,如果只是停留在config层的话,我们能做的东西是比较少的。千人千面,toc的小伙伴应该是经常听过的,这个属于项目发展到一定稳定情况下,后阶段发力,这个时候算法就会派上用场。
千人千面
没错,非常耳熟的一个词,那是我上家公司经常听到的东西,当时做的一家美妆公司,公众号粉丝数千万以上。在这个体量下面,用户的运营是尤为的重要的。特别是千人千面,那是在业务发展到一定稳定阶段后,提出再一次可能带来新机会的一个点。
我当时是在内容运营中心搬砖,做过一个功能跟这个有关系的,就是通过用户购物评价给用户打上美妆标签,比如说干皮、油皮。。。然后当用户进来看文章的时候(公司是靠小红书发家的,所以我们内容运营很像小红书),会根据用户的标签给他推不同的文章。还有另外一种情况,就是用户读过什么类型的文章,那么会给他推类似的文章,当然这里就涉及算法了,如果系统一直推差不多类型的文章,会导致用户视觉疲惫~
技术点
- 打标
场景1:我买过一个商品,然后评论了这个很好用,这款化妆品是针对干皮+白皮女生的
打标:系统根据语义分析nlp,去分析这句号是满意,还是说感觉使用不好,然后还会拆词,找到关键的词(涉及到词库,有电商词库、美妆、家用电器)然后根据这些已知的东西去给用户打标签,比如说干皮、白皮
场景2:我在搜索栏经常性搜索控油,比如男人到一定年龄,多少有点油,啊哈哈哈。然后我就点开下面几篇相关文章进行查看。
打标:通过用户高频搜索词,以及阅读文章类型(本身文章也会附带标签,比如说针对想减肥的,想增高的),然后我们给用户打标签
- 机器学习
上面打标的时候,提到nlp语义分析,它是需要机器学习,你需要给他大量的数据让它去学习,比如说我评价一个商品,这个物品糟糕透了,很不好用,用了几次烂脸了。人工给他打标签,用户心情:不好的,关键词:品质差
当机器训练出来的模型,输出的结果也有可能是有偏差的,所以还需要大量数据去训练模型,优化它。
- 智能推荐
当用户进入内容中心的时候,系统会自动根据用户标签去推送标签相关的文章,那么跟标签相近的也可以推送。所以标签之间的相近程度,这个也需要机器学习去鉴别。这样可以更全面、准确搜到用户想要的内容~
在这个过程,算法的重要性就体现出来了,数据模型训练也是一个算法
总结
读完这篇文章,我们了解了算法的作用,它在业务上、技术上所做出贡献,我更希望说它可以成为一个启发点,引导读者去思考有没有哪些点可以促发项目的二次成长的机会,比如说一个用户很喜欢吃一个东西,某外卖平台是不是会给他推相似的食品。当然这个标签应该是动态的,可能某天我心血来潮,我想减肥,不可能给我贴一个健康人士标签吧,所以标签体系的完善又要依靠算法的进步,从而更好的服务用户。