【LLM 论文】CREA-ICL：利用跨语言检索来增强小语种的 ICL 能力

【LLM 论文】CREA-ICL：利用跨语言检索来增强小语种的 ICL 能力

news2026/2/11 15:15:03

论文：From Classification to Generation: Insights into Crosslingual Retrieval Augmented ICL
⭐⭐⭐⭐
NeurIPS 2023, arXiv:2311.06595

文章目录

- 论文速读
- 总结

论文速读

有很多外国语言因为其语言复杂性、标记数据集的缺乏以及数据重复等问题，LLM 在这些低资源语言上的 instruction-following 的能力会变差，进而限制它们的 In-Context Learning（ICL）的表现。

为了解决低资源语言（如孟加拉语）在大型语言模型（LLMs）的上下文学习（ICL）性能受限的问题，本文提出了跨语言检索增强的上下文学习（CREA-ICL），其思路是：对于一个低资源语言的 input test $q$ ，使用 embedding encoder 将其映射到一个 shared embedding space 中，然后利用 cosine similarity 计算它与高资源语言的 corpus 的文档相似度，从中检索出 top-k 个文档，然后利用 prompt 把这些高资源语言作为 ICL 的 exemplars，实现让 LLM 去解决 input test 的问题。

框架图示如下：

CREA-ICL 框架

上图是一个对孟加拉语的问题做情感分类的示例。Telugu input 是一个孟加拉语表述的文本，首先会通过 Cross-Lingual Retriever 从高资源语言的 corpus 中检索出 k 个最相关的英文 samples，根据 sample 是否存在 label：

如果有 label，那就使用这个 label
如果没有 label，那就使用 self-prediction 让 LLM 生成一个 label

然后把 (English sample, label) 作为 ICL 的 exemplars，通过 prompt 让 LLM 去解决 Telugu input 文本的情感分类问题。

总结

论文提出的方法的思路都在这个图中了，看懂这个图就可以看懂这个方法了。

这篇论文讨论了一个常见问题：低资源语言该如何利用好 LLM 的各项能力。因为中文和英文的语料较多，导致了 LLM 能够表现不错，但对于很多小语种来说，资料的缺乏可能会让 LLM 在某些能力上出现缺失，通过跨语言检索也许能解决其中的一些问题。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1639766.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【讲解下如何解决一些常见的 Composer 错误】

【讲解下如何解决一些常见的 Composer 错误】

🌈个人主页: 程序员不想敲代码啊 🏆CSDN优质创作者，CSDN实力新星，CSDN博客专家 👍点赞⭐评论⭐收藏 🤝希望本文对您有所裨益，如有不足之处，欢迎在评论区提出指正，让我们共…

阅读更多...

【二等奖水平论文】2024五一数学建模C题22页保奖论文+22页matlab和13页python完整建模代码、可视图表+分解结果等（后续会更新）

【二等奖水平论文】2024五一数学建模C题22页保奖论文+22页matlab和13页python完整建模代码、可视图表+分解结果等（后续会更新）

一定要点击文末的卡片，那是资料获取的入口！ 点击链接加入群聊【2024五一数学建模】：http://qm.qq.com/cgi-bin/qm/qr?_wv1027&khoTDlhAS5N_Ffp-vucfG5WjeeJFxsWbz&authKey7oCSHS25VqSLauZ2PpiewRQ9D9PklaCxVS5X6i%2BAkDrey992f0t15…

阅读更多...

前端高频算法

前端高频算法

分析算法排序： 时间复杂度: 一个算法执行所耗费的时间。空间复杂度: 运行完一个程序所需内存的大小。执行效率、内存消耗、稳定性三方面入手。 1. 排序 1.1 冒泡排序冒泡的过程只涉及相邻数据的交换操作，所以它的空间复杂度为 O(1)。为了保证…

阅读更多...

Deep learning Part Five RNN--24.4.29

Deep learning Part Five RNN--24.4.29

接着上期，CBOW模型无法解决文章内容过长的单词预测的，那该如何解决呢？ 除此之外，根据图中5-5的左图所示，在CBOW模型的中间层求单词向量的和，这时就会出现另一个问题的，那就是上下文的单词的顺序…

阅读更多...

【JVM】class文件格式，JVM加载class文件流程，JVM运行时内存区域，对象分配内存流程

【JVM】class文件格式，JVM加载class文件流程，JVM运行时内存区域，对象分配内存流程

这篇文章本来只是想讲一下class文件格式，讲着讲着越讲越多。JVM这一块吧，知识比较散比较多，如果深研究下去如死扣《深入理解Java虚拟机》，这本书很深很细，全记住是不可能的，其实也没必要。趁这个机会直接把…

阅读更多...

附录6-4 黑马优购项目-分类和购物车

附录6-4 黑马优购项目-分类和购物车

目录 1 分类 1.1 接口 1.2 窗口限制 1.3 选中状态样式判断 1.4 点击左侧时右侧会到顶点 1.5 源码 2 购物车 2.1 store 2.2 tabBar徽标 2.3 滑动删除 2.4 结算 2.4.1 结算前登录 2.4.2 结算功能 2.5 触发组件事件 2.6 源码 1 分类分类最上部是…

阅读更多...

Flutter笔记：谈Material状态属性-为什么FlatButton等旧版按钮就废弃了

Flutter笔记：谈Material状态属性-为什么FlatButton等旧版按钮就废弃了

Flutter笔记谈Material状态属性-为什么FlatButton等旧版按钮就废弃了 - 文章信息 - Author: 李俊才 (jcLee95) Visit me at CSDN: https://jclee95.blog.csdn.netMy WebSite：http://thispage.tech/Email: 291148484163.com. Shenzhen ChinaAddress of this artic…

阅读更多...

免安装SQL管理工具HeidiSQL建库如何选Collation字符校对

免安装SQL管理工具HeidiSQL建库如何选Collation字符校对

免安装SQL管理工具HeidiSQL 文章目录免安装SQL管理工具HeidiSQL一、安装二、建库因此，通常我们选择： 一、安装到官方网址：https://www.heidisql.com/ 下载后按不同版本安装或解压，运行目录中的heidisql应用程序。该工具可以对…

阅读更多...

「生存即赚」链接现实与游戏，打造3T平台生态

「生存即赚」链接现实与游戏，打造3T平台生态

当前，在线角色扮演游戏（RPG）在区块链游戏市场中正迅速崛起，成为新宠。随着区块链技术的不断进步，众多游戏开发者纷纷将其游戏项目引入区块链领域，以利用这一新兴技术实现商业价值的最大化。在这一趋势中&am…

阅读更多...

加州大学欧文分校英语中级语法专项课程02：Adjectives and Adjective Clauses 学习笔记

加州大学欧文分校英语中级语法专项课程02：Adjectives and Adjective Clauses 学习笔记

Adjectives and Adjective Clauses course certificate 本文是 https://www.coursera.org/learn/adjective-clauses 这门课的学习笔记。文章目录 Adjectives and Adjective ClausesWeek 01: Adjectives and Adjective PhrasesLearning Objectives Adjectives Introduction Le…

阅读更多...

基于Java的智慧社团综合管理系统的设计与实现(论文+源码)_kaic

基于Java的智慧社团综合管理系统的设计与实现(论文+源码)_kaic

摘要随着校园文化的不断丰富，大学里各种社团越来越多，社团活动也越来越频繁，社员也越来越多，而且大学生退社、入社比较频繁，社团管理就显得非常繁琐而又复杂,如果采用人工管理,对管理员来说将是一件很头疼的事情。设…

阅读更多...

5个本地流畅运行大模型的免费工具

5个本地流畅运行大模型的免费工具

大家好，随着大型语言模型（LLM）驱动的聊天机器人逐渐普及，给人们的工作和生活带来了前所未有的便利。然而，这种便捷性背后潜藏着个人隐私信息被泄露的风险，例如AI公司会收集聊天记录和元数据来优化模型&…

阅读更多...

【Vulhub靶场】Nginx 漏洞复现

【Vulhub靶场】Nginx 漏洞复现

Nginx 漏洞复现一、Nginx 文件名逻辑漏洞（CVE-2013-4547）1、影响版本2、漏洞原理3、漏洞复现二、Nginx 解析漏洞1、版本信息：2、漏洞详情3、漏洞复现一、Nginx 文件名逻辑漏洞（CVE-2013-4547） 1、影响版本 Nginx …

阅读更多...

mysql 数据转excel文件

mysql 数据转excel文件

mysql 数据转excel文件缘由为售后拉取数据，用navicat太墨迹了，用python写一个main方法跑一下； 1.抽取共同方法，封装成传入mysql，直接下载成excel； 2.写入所有sql语句，传入参数； 代…

阅读更多...

2024-05-02 商业分析-杭州小万科技-商业模式分析

2024-05-02 商业分析-杭州小万科技-商业模式分析

摘要: 对杭州小万科技的商业模式进行分析，以对其做出客观的评估。杭州小万科技的资料: 杭州小万科技有限公司 - 企知道 (qizhidao.com) 杭州小万科技有限公司网站备案查询 - 天眼查 (tianyancha.com) 杭州小万科技有限公司 - 爱企查 (baidu.com) 2023年年报:

阅读更多...

Android手写自己的路由SDK

Android手写自己的路由SDK

实现自己的路由框架在较大型的Android app中常会用到组件化技术，针对不同的业务/基础功能对模块进行划分，从上到下为壳工程、业务模块、基础模块。其中业务模块依赖基础模块，壳工程依赖业务模块。同级的横向模块（比如多个业务…

阅读更多...

BeanFactory 源码浅析

BeanFactory 源码浅析

BeanFactory 功能介绍 BeanFactory 是核心容器，负责管理 Bean 对象 BeanFactory 接口的功能只有一个 getBean() 方法BeanFactory 的实现类（DefaultListableBeanFactory）包含：控制反转、基本的依赖注入、Bean 生命周期的各种功能…

阅读更多...

【Python】函数设计

【Python】函数设计

1.联系函数的设计 2.找质数 3.找因子 4.判断水仙花数 5.斐波拉契数列递归调用，并用数组存储已计算过的数，减少重复计算 1、计算利息和本息编写两个函数分别按单利和复利计算利息,根据本金、年利率、存款年限得到本息和和利息。调用这两个函数计算1…

阅读更多...

【算法刷题日志】吸氧羊的StarryCoding之旅 - 贡献法计算

【算法刷题日志】吸氧羊的StarryCoding之旅 - 贡献法计算

题目链接：https://www.starrycoding.com/problem/3 题目描述吸氧羊终于注册了一个StarryCoding账号！（她很开心） 但是吸氧羊忘记了它的密码，她想起你是计算机大师，于是就来请教你。她虽然不记得密码了…

阅读更多...

java版数据结构：深入理解栈和队列：数据结构与应用（vector,stack,queue）

java版数据结构：深入理解栈和队列：数据结构与应用（vector,stack,queue）

目录前言动态数组类（vector） 特点： 应用： 栈（Stack） 栈的基础概念： 栈的常用方法： 模拟栈操作： 队列（Queue） 队列的基础概念队列的常…

阅读更多...

推荐文章

最新文章