技术应用 | 外语专业如何借助大模型转型升级?

news2025/1/25 4:37:29

一、选哪一条路:评测大模型、应用大模型、研发大模型

如果把大语言模型当作是“一个人”,那么既可以把这个“人”当作研究对象,研究它几岁了、智商如何了、能做什么、不能做什么、危不危险,也就是“评测大模型”;也可以直接雇佣这个“人”,协助自己解决问题,也就是“应用大模型”。当然,还有一些团队,他们在“研发大模型”,相当于“造人”。

基于对大模型有限的认知,我觉得我是没有能力去研发大模型的,正如上图最左侧所示,我没有数据、没有算力、不懂算法、没有人力,更没有天量的经费,所以不可能参与到研发大模型的环节。

那么剩下的两条路选哪条呢:评测大模型和应用大模型

我倾向于不去做评测大模型的事情,因为我觉得就我对大模型实际使用的经验,我觉得没有必要把精力放在能力有限的大模型身上,而是要充分用好水平最高的大模型。

有些朋友可能会问:不评测怎么知道哪个大模型水平最高呢?

不知道大家有没有去考过学生的英语水平。很多人会去看四级成绩、六级成绩、八级成绩等等,也就是评测的结果。

但往往面试一个学生时,看着眼前的这位学生说上十句以内的英语就知道TA什么水平了。

所以很多大模型的水平高低稍微一用便知。

二、用什么大模型?

我的使用经验告诉我,在我目前的财力可支付范围内,目前(截至2024年8月13日)最好用的大模型有两个:

一个是Claude官网的Claude 3.5 Sonnet:

一个是OpenAI官网的GPT-4o:

我的直观体验也与我在网上看到的一个评测结果一致:

之所以我认为这两个大模型是最好的,道理很简单:

我有这样一个需求…这是我已经写好的代码…,请你帮我优化和完善代码:

谢谢你,请你为我提供完整的代码,这样我可以直接粘贴复制。

用过大模型写代码的人可能会非常熟悉上面的两条指令。

凡是大家公认好用的大模型,基本上可以直接使用上面第二条指令给出的完整的代码。

我最近和很多朋友分享我的大模型使用经验,得到最多的问题是:这样好的大模型有没有(一直)免费的使用途径?

我目前是没有发现这样的途径,我自己还是坚持使用官网提供的付费版的工具。

当然,如果很多朋友只是想用免费的,而且还不想联网使用,那么可以尝试我提供的这条路径:

BiCorpus_RAG:可在断网下基于大模型进行问答和翻译的开源免费平行语料库工具
三、使用大模型干什么?

我现在长大了,我已经不会劝人用大模型劝人学英语劝人学编程了。

我现在倾向于自己努力把英语学得越好越好,把编程水平提升得越来越好,把大模型用得越来越好,然后把选我课的学生教好。

十年前,我告诉学生,对于语言专业的学生而言,写作很重要,一定要坚持写作。劝是没有用的,一定要自己做。于是我开通了现在这个简言微信公众号,一直坚持写到现在。

十年后的今天,我告诉学生,对于语言专业的学生而言,英语很重要,编程很重要,大模型很重要,一定要坚持用。劝是没有用的,一定要自己做。

大模型出现后,我深刻认识到大模型只是众多人工智能技术中的一种,如下图所示:

世界这么大,不能只用大语言模型这样一种工具,而是要结合多种计算机技术一起使用。

所以我先是把重心放在了“计算机辅助翻译工具”的研发上。过去两年我做的ParaTrans就是这样一个例子:

ParaTrans:融合ChatGPT的在线辅助翻译工具

在开发这个工具的过程中,我深刻认识到,对于译者而言,大模型只是一个辅助,必须要结合用户自己的私有高质量语言资产:

很可惜的是,在计算机辅助翻译技术推广的这么多年,真正重视语言资产的是研发机器翻译、大模型的人,译者依然只重视自己的大脑。

所以我转向了另外一个路径:面向企业提供结合术语、翻译机器、机器翻译、自动译后编辑和自动质量评估的基于专业计算机辅助翻译工具的全自动翻译流程,尽最大程度减少人工翻译的参与。

实践证明,在这样工作流的推动下,相当一部分非文学翻译业务是可以自动化完成的,而且许多上游企业(包括甲方和拥抱技术的乙方)已经在(悄悄的或半公开的)应用类似的流程。

我有时候想起过去这么多年所做的“译者拥抱技术”呼吁是多么的徒劳。

我发现问题的根源在于我们的外语专业人才培养模式。

我们的外语专业培养方案严重忽视了人才的信息素养提升,把外语人才培养成了惧怕技术、排斥技术的人。

即便是在人工智能技术突飞猛进的今天,许多外语专业只能眼睁睁看着学校把自己裁掉或者合并到其他专业。

这个暑假我见到了好多外语学院的老师和领导,了解到许多触目惊心的现实,远比现在微信公众号上看到的那些新闻要劲爆得多。

所以,我的另一个努力的方向就是把大模型和外语教学结合在一起,重点是将大模型和英语学习结合在一起,努力让学生在使用大模型快速提升英语能力的同时自然而然接受大模型,提升自己的信息素养、人工智能素养。

在这条道路上我做了一些产品化的尝试和试验,获得了一些还不错的试验成果:

通过这些尝试,我对大模型的价值有了更深的认知,一方面大模型能够帮助撰写代码开发不同的外语教育技术产品、翻译技术产品;一方面在这些产品中大模型又可以助力学生提升语言能力和翻译能力。

但这些还不足以凸显大模型真正的价值。

大模型真正的价值是让未来的外语专业学生、翻译专业学生成为具备高超信息素养和人工智能素养的复合型高端外语人才。

对于依然对外语有热情,相信外语能有出路的同学,还应该相信包括大模型在内的人工智能技术的力量,要在人工智能技术的助力下让自己学外语学得更快更好,用外语用得更溜,要让人工智能技术赋予自己战斗力。

用文科生能接受的课程体系来整体提升外语学生的信息素养、人工智能素养和结合AI解决问题的能力是AI时代外语生的出路。

比如,外语专业的学生也可以研发外语教育技术产品,而不是一直去推广研究计算机专业开发的工具。

比如,翻译专业的同学也可以去开发翻译技术工具,在翻译实践中迭代优化自己的技术。

学习提示词工程始终在应用层,而是要利用强大的AI帮助自己开发融合提示词的产品、应用、工具、系统。

我们也许无法相信自己能开发出这样的工具来,但一定要相信年轻的学生们,不要让他们被“外语专业”束缚住自己,就像潘展乐说的那样,“人类是不可能游到那个速度的”是人类设置的框而已,跳出这个框,还会看到更大的潜能。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2041087.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

django电商易购系统-计算机毕业设计源码61059

目 录 1 绪论 1.1选题背景 1.2研究意义 1.3论文结构与章节安排 2 电商易购系统系统分析 2.1 可行性分析 2.2 系统流程分析 2.2.1 数据流程 3.3.2 业务流程 2.3 系统功能分析 2.3.1 功能性分析 2.3.2 非功能性分析 2.4 系统用例分析 2.5本章小结 3 电商易购系统总…

Java设计模式-原型模式-一次性理解透

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 1. 前言2. 原型模式的主要角色2.1 原型接口或抽象类2.2 具体原型类2.3 客户端2.4 克隆方法 3. 原型模式使用场景3.1 创建对象是昂贵的3.2 对象的变化3.3 动态配置3.…

10-使用sentinel流控

本文介绍sentinel的直接流控的使用。 0、环境 jdk 1.8sentinel 1.8.2springboot 2.4.2 1、sentinel环境搭建 从官方发布的网站上下载: sentinel Jar,下载对应版本。 下载完成后,进入刚才下载的Jar文件所在的目录,执行如下命令&#xff1a…

Qt+OpenCV配置和测试

一、前言 OpenCV作为比较大众化的跨平台计算机视觉开源库,可以运行在多种操作系统上,通过与Qt的结合,能够轻松的是实现一些图像处理和识别的任务,本文在Windows操作系统的基础上具体讲解Qt和OpenCV的配置和环境搭建方法&#xff…

PHP企业员工考勤系统—计算机毕业设计源码17108

摘要 由于数据库和数据仓库技术的快速发展,企业员工考勤系统建设越来越向模块化、智能化、自我服务和管理科学化的方向发展。员工管理系统对处理对象和服务对象,自身的系统结构,处理能力,都将适应技术发展的要求发生重大的变化。 …

叉车安装人脸识别管理系统,能带来哪些好处

当今工业生产中,叉车是一种常见的运输工具,广泛应用于各种场景,如工厂、仓库、码头等。然而,由于驾驶员的错误操作或非授权人员的驾驶,叉车在使用过程中可能会发生意外事故,给企业带来不小的损失。 为了提…

LangChain之数据库操作:通过链Chain和代理Agent查询数据库信息

Chain和Agent查询数据库 在LangChain,其提供了SQL Chain链和SQL Agent代理,他们支持基于自然语言提示构建和运行SQL查询,以此来操作数据库,并且与SQLAlchemy支持的任何SQL版本兼容。(例如,MySQL&#xff0c…

自闭症儿童注意力分散怎么办?|星启帆自闭症寄宿学校

在自闭症儿童的成长过程中,一个常见且令人担忧的现象是“精神飘移行为”,这种行为表现为孩子沉浸在自己的小世界里,对外界刺激反应迟钝,甚至完全忽视。他们可能会做出一些怪异的动作、表现出刻板行为、自言自语,眼神呆…

Kafka服务端日志详解

文章目录 服务端日志Topic消息存储方式主体介绍log文件追加记录消息index和timeindex索引文件 日志文件清理Kafka的文件高效读写机制Kafka的文件结构顺序写磁盘零拷贝 合理配置刷盘频率客户端消费进度管理 服务端日志 Kafka的日志信息是通过conf/server.properties文件中的log…

用苹果机连接mac后怎么在电脑上调试苹果手机上页面的元素

问: 用苹果机连接mac后怎么在电脑上调试苹果手机上页面的元素, 使用MAC电脑、iPhone 真机调试 H5页面 回答: 使用MAC电脑、iPhone 真机调试 H5页面 简介 Safari 浏览器设置iPhone 手机设置开始调试 简介 为方便在 H5开发过程中在真实手机调试 H5页面,可进行一下…

Mybatis-springBoot

MyBatis 是一个流行的 Java 持久层框架,它简化了与关系型数据库的交互。通过将 SQL 语句与 Java 代码进行映射,MyBatis 提供了一种方便、灵活的方式来执行数据库操作。它支持动态SQL、缓存机制和插件扩展,使得开发人员能够更高效地编写和管理…

重学我的数据结构

二叉树 1. 遍历 (Traversal) 前序遍历 (Preorder Traversal): 先访问根节点,再访问左子树,最后访问右子树。 void preorderTraversal(Node root) {if (root null) return; System.out.print(root.value " "); preorderTraversal(root.left)…

韦东山瑞士军刀项目之I2C控制ssd 1306 OLED显示屏幕驱动源码分析(硬核)

太硬核了,但即便如此,我也只分析了如何实现ssd 1306的控制命令与显示命令的代码。尽管如此,我也了解了如何实现I2C的字符输出显示。意外收获是知道了ASCII码到底是个什么玩意儿。

python pygame如何实现碰撞检测

前言: 在python中,我们实现两个物品的碰撞检测往往是判断两个物体的x、y坐标是否有重合,根据坐标来进行判断,但是这种判断方式往往不太准确,对于一些透明部分,会出现误判的情况,今天介绍的是一…

古印度的未解之谜——哈拉帕印章文字

关注我们 - 数字罗塞塔计划 - 在之前的文章中,我们知晓了古埃及莎草纸的制作工艺(参见《莎草纸——数千年前的信息记录载体》),也了解了由粘土变为陶片可保存数千年的苏美尔泥板书(参见《泥板书:两河文明传…

暑期破防实录——捡漏腾讯

序 经历了整整三个月的折磨,暑期实习终于尘埃落定。 其实还没收到 offer 的时候,还会想着到时候录用了该怎么大写特写小作文,但真到了这一天,只剩下一种解脱感,一种摆脱了漫长的焦虑与压抑的淡淡喜悦。 或许就像久病…

Java垃圾收集底层算法实现

垃圾收集底层算法实现 三色标记 在并发标记的过程中,因为标记期间应用线程还在继续跑,对象间的引用可能发生变化,多标和漏标的情况就有可能发生。漏标的问题主要引入了三色标记算法来解决。 三色标记算法是把Gc roots可达性分析遍历对象过…

QT翻金币小游戏

目录 QT翻金币小游戏 效果展示 图片 视频 实现代码 main.cpp mymainwindow.h mymainwindow.cpp startscene.h startscene.cpp selectscene.cpp playscene.h playscene.cpp mypushbutton.h mypushbutton.cpp dataconfig.h dataconfig.cpp QT翻金币小游戏 效果展示…

什么是进程?C语言

进程的概念 进程就是执行中的程序,是系统资源分配的最小单位。 进程的内存分配 进程的作用 宏观上是并行的,微观上是串行的 进程的状态 对于基本的操作系统:有三个状态: 就绪态->执行态-> 阻塞态 在LInux中有四种&am…

docker数据卷、资源控制

一、docker数据卷: 1.容器和宿主机之间数据共享----挂载卷----容器内的目录和宿主机的目录进行挂载。实现数据文件共享容器的生命周期有限,一旦重启所有对容器内部文件数据的修改以及保存的数据都会被初始化,所以为了防止数据丢失重要的组件…