一、选哪一条路:评测大模型、应用大模型、研发大模型
如果把大语言模型当作是“一个人”,那么既可以把这个“人”当作研究对象,研究它几岁了、智商如何了、能做什么、不能做什么、危不危险,也就是“评测大模型”;也可以直接雇佣这个“人”,协助自己解决问题,也就是“应用大模型”。当然,还有一些团队,他们在“研发大模型”,相当于“造人”。
基于对大模型有限的认知,我觉得我是没有能力去研发大模型的,正如上图最左侧所示,我没有数据、没有算力、不懂算法、没有人力,更没有天量的经费,所以不可能参与到研发大模型的环节。
那么剩下的两条路选哪条呢:评测大模型和应用大模型
我倾向于不去做评测大模型的事情,因为我觉得就我对大模型实际使用的经验,我觉得没有必要把精力放在能力有限的大模型身上,而是要充分用好水平最高的大模型。
有些朋友可能会问:不评测怎么知道哪个大模型水平最高呢?
不知道大家有没有去考过学生的英语水平。很多人会去看四级成绩、六级成绩、八级成绩等等,也就是评测的结果。
但往往面试一个学生时,看着眼前的这位学生说上十句以内的英语就知道TA什么水平了。
所以很多大模型的水平高低稍微一用便知。
二、用什么大模型?
我的使用经验告诉我,在我目前的财力可支付范围内,目前(截至2024年8月13日)最好用的大模型有两个:
一个是Claude官网的Claude 3.5 Sonnet:
一个是OpenAI官网的GPT-4o:
我的直观体验也与我在网上看到的一个评测结果一致:
之所以我认为这两个大模型是最好的,道理很简单:
我有这样一个需求…这是我已经写好的代码…,请你帮我优化和完善代码:
谢谢你,请你为我提供完整的代码,这样我可以直接粘贴复制。
用过大模型写代码的人可能会非常熟悉上面的两条指令。
凡是大家公认好用的大模型,基本上可以直接使用上面第二条指令给出的完整的代码。
我最近和很多朋友分享我的大模型使用经验,得到最多的问题是:这样好的大模型有没有(一直)免费的使用途径?
我目前是没有发现这样的途径,我自己还是坚持使用官网提供的付费版的工具。
当然,如果很多朋友只是想用免费的,而且还不想联网使用,那么可以尝试我提供的这条路径:
BiCorpus_RAG:可在断网下基于大模型进行问答和翻译的开源免费平行语料库工具
三、使用大模型干什么?
我现在长大了,我已经不会劝人用大模型、劝人学英语、劝人学编程了。
我现在倾向于自己努力把英语学得越好越好,把编程水平提升得越来越好,把大模型用得越来越好,然后把选我课的学生教好。
十年前,我告诉学生,对于语言专业的学生而言,写作很重要,一定要坚持写作。劝是没有用的,一定要自己做。于是我开通了现在这个简言微信公众号,一直坚持写到现在。
十年后的今天,我告诉学生,对于语言专业的学生而言,英语很重要,编程很重要,大模型很重要,一定要坚持用。劝是没有用的,一定要自己做。
大模型出现后,我深刻认识到大模型只是众多人工智能技术中的一种,如下图所示:
世界这么大,不能只用大语言模型这样一种工具,而是要结合多种计算机技术一起使用。
所以我先是把重心放在了“计算机辅助翻译工具”的研发上。过去两年我做的ParaTrans就是这样一个例子:
ParaTrans:融合ChatGPT的在线辅助翻译工具
在开发这个工具的过程中,我深刻认识到,对于译者而言,大模型只是一个辅助,必须要结合用户自己的私有高质量语言资产:
很可惜的是,在计算机辅助翻译技术推广的这么多年,真正重视语言资产的是研发机器翻译、大模型的人,译者依然只重视自己的大脑。
所以我转向了另外一个路径:面向企业提供结合术语、翻译机器、机器翻译、自动译后编辑和自动质量评估的基于专业计算机辅助翻译工具的全自动翻译流程,尽最大程度减少人工翻译的参与。
实践证明,在这样工作流的推动下,相当一部分非文学翻译业务是可以自动化完成的,而且许多上游企业(包括甲方和拥抱技术的乙方)已经在(悄悄的或半公开的)应用类似的流程。
我有时候想起过去这么多年所做的“译者拥抱技术”呼吁是多么的徒劳。
我发现问题的根源在于我们的外语专业人才培养模式。
我们的外语专业培养方案严重忽视了人才的信息素养提升,把外语人才培养成了惧怕技术、排斥技术的人。
即便是在人工智能技术突飞猛进的今天,许多外语专业只能眼睁睁看着学校把自己裁掉或者合并到其他专业。
这个暑假我见到了好多外语学院的老师和领导,了解到许多触目惊心的现实,远比现在微信公众号上看到的那些新闻要劲爆得多。
所以,我的另一个努力的方向就是把大模型和外语教学结合在一起,重点是将大模型和英语学习结合在一起,努力让学生在使用大模型快速提升英语能力的同时自然而然接受大模型,提升自己的信息素养、人工智能素养。
在这条道路上我做了一些产品化的尝试和试验,获得了一些还不错的试验成果:
通过这些尝试,我对大模型的价值有了更深的认知,一方面大模型能够帮助撰写代码开发不同的外语教育技术产品、翻译技术产品;一方面在这些产品中大模型又可以助力学生提升语言能力和翻译能力。
但这些还不足以凸显大模型真正的价值。
大模型真正的价值是让未来的外语专业学生、翻译专业学生成为具备高超信息素养和人工智能素养的复合型高端外语人才。
对于依然对外语有热情,相信外语能有出路的同学,还应该相信包括大模型在内的人工智能技术的力量,要在人工智能技术的助力下让自己学外语学得更快更好,用外语用得更溜,要让人工智能技术赋予自己战斗力。
用文科生能接受的课程体系来整体提升外语学生的信息素养、人工智能素养和结合AI解决问题的能力是AI时代外语生的出路。
比如,外语专业的学生也可以研发外语教育技术产品,而不是一直去推广研究计算机专业开发的工具。
比如,翻译专业的同学也可以去开发翻译技术工具,在翻译实践中迭代优化自己的技术。
学习提示词工程始终在应用层,而是要利用强大的AI帮助自己开发融合提示词的产品、应用、工具、系统。
我们也许无法相信自己能开发出这样的工具来,但一定要相信年轻的学生们,不要让他们被“外语专业”束缚住自己,就像潘展乐说的那样,“人类是不可能游到那个速度的”是人类设置的框而已,跳出这个框,还会看到更大的潜能。