谈谈AI领域的认知误区、机会点与面临的挑战
最近2年,AI 技术的火爆,到处都能看到大家在讨论AI 的发展与机会。这里我们讨论一下AI 认知的误区,机会点和面临的挑战。 by kimmking
AI 认知的误区
这年头掀起了所有人讨论AI热潮的同时,kimmking认为对于AI的认知,也存在如下几个误区:
1、需要大量的硬件,比如A100或H100。实际上这个领域没啥好搞的,算力的基础设施最终会聚集到少数几个寡头手里,其他玩家都是炮灰,不管是什么背景的玩家。这个领域可以看做是IT行业里的硬件。
2、需要了解大量的基础数学,比如各类模式识别的算法、贝叶斯和马尔科夫理论,各种神经网络(ANN/CNN/DNN),BP算法,凸优化,,,这些东西是用来设计模型的理论基础。这个领域,可以看做是操作系统的技术理论,是计算机科学家们玩的。AI的这部分需要的是少数的AI科学家。
3、需要了解大模型的原理,并且在某一个方向领域训练大模型。大模型可以看做是当前AI领域里最流行的操作系统。直接搞这一块,特别是一些领域的大模型,有一定的可能性。但是这个也不是个人玩家能搞得起来的,做操作系统的投入收益比太低了。
AI 领域的机会
kimmking觉得可能搞起来的几个点:
1、应用:在现有的AI基础设施上,结合业务场景做智能应用。比如写公文,根据场景画图,图转视频,财报解读,智能客服,代码提示,生成单元测试,解读医学检查报告,推荐用药等等。
2、定制:在非常垂直的领域调校现有的模型参数,增强这个领域的服务能力。比如做行业知识库,专家系统之类的,甚至可以封装自己调整后的模型进行定制化和私有化部署。
3、集成:整合AI的上下游资源,比如提供各不同平台的API接口,或者集成多个模型,进行加工后提供服务或者模型。
4、工具:提供AI相关的工具,比如开发和测试的工具,最好是在线提供给从业者来使用。
AI 应用的挑战
kimmking认为 AI应用 技术发展目前面临的几个挑战:
1、技术性:这里就说一个,过拟合的问题,因为提供的是所有答案里可能性最大的,这就导致了不懂的就胡说,这里的问题严重性远超大家的预期。之前给大家举过一个非常夸张的”Redis里的启动脚本钩子“的例子:ChatGPT说存在这样两个参数,具体叫xxx和yyy,名字看起来有模有样。然后我问他怎么用,给我展示了它们使用的方式和配置参数,默认值等等。继续问题,在Redis 6.2.6版本里,这两个参数的定义和处理是在哪个文件,然后回答我是 redis.c文件里,具体是哪一行哪个方法,函数里大概是什么代码。。。实际上Redis里根本没有这样的参数和机制,代码里也没有这个方法。AI 自己脑补了一整套的大戏,我没当真,它自己当真了。
2、专业性:任何一个具体的小领域内,不管是技术深度还是广度,其实AI现在都不行。AI通过预训练以后,可以对现有的海量知识做出快速全面的应答,甚至总结分析。但是由于训练信息和网上抓取的信息,都具有滞后性,所以对于新的东西,它是存在盲区的,这是所谓的广度。至于深度,则是由于人可以通过对技术的研究和应用,产生第一手相关的经验。很简单的例子就是,你去负责过一个复杂的业务项目,那么对这个项目背后的很多东西,有深入的理解,这种理解是无法通过学习理论,在网上搜索信息能够得到的。这里并不是说,AI 没有用处。而是想表达一个观点:在真正遇到专业性的问题,当前的AI是无能为力的。AI 能快速的降低我们获取知识的成本,但是无法让我们获得知识背后更有价值的经验。我一直有个判断,AI 发展和大力普及以后,知识本身越来越没有价值,有价值的是经验。
3、安全性:AI 背后是大量的数据做支撑的,并且为了AI更好的提供服务,需要不断的输入更多数据,特别是最新的、最先进而有重大价值的数据。这样这些数据就可能会导致泄露而带来一系列的安全性的问题。