以下内容链接:Call for Main Conference Papers - EMNLP 2023
目录
审核流程:
与 ARR 的交叉提交政策
注意:
注意:
重要日期
强制性摘要提交
提交方向
论文提交信息
论文提交和模板
确认
长论文
短文
贡献
演示模式
著作权
引用与比较
多次提交政策
可选:粘性评论
局限性的强制性讨论
主题曲目:大型语言模型和 NLP 的未来
道德政策
可选补充材料
附录、软件和数据
匿名期
双盲评审说明
再现性标准
演示要求
2023 年自然语言处理实证方法会议 (EMNLP 2023) 邀请提交关于自然语言处理实证方法的大量、原创和未发表研究的长篇和短篇论文。与近年来一样,会议上的一些演讲将针对被 ACL Transactions (TACL) 和计算语言学 (CL) 期刊接受的论文。
EMNLP 2023 将遵循 EMNLP 2022 和 ACL 2023,并采用关于 ARR 的混合格式。这意味着虽然 EMNLP 将接受 ARR 评审的论文,但它也将直接接受提交给 EMNLP 的论文。
然而,为了使整个社区的审查负担保持可控,我们需要让作者预先决定他们是想通过 ARR 还是 EMNLP 进行审查。
审核流程:
直接提交给 EMNLP 的论文将有“常规”审查程序:论文由 3 名审稿人审查,如果被接受,作者将被邀请在camera ready好的截止日期前写下作者回复并修改他们的论文。提交给 EMNLP 的 ARR 论文将由高级领域主席处理。对于这些论文,作者可以提供作者回复但不能修改他们的论文(除了添加所需的“限制”部分,如果它在 ARR 提交中缺失;见下文)。
与 ARR 的交叉提交政策
任何在 ARR 会议承诺截止日期(2023 年 8 月 22 日)之前获得所有评论和元评论的 ARR 评审论文都可以提交给 EMNLP 2023。
注意:
来自 ARR 的提交不能修改,除非它们可以与作者的回复相关联。
EMNLP 将考虑在 2023 年 8 月 22 日承诺截止日期之前已经过全面审查的任何 ARR 论文。常规 ARR 时间表建议 ARR 提交应在 6 月 15 日之前提交。因此,如果作品在电话会议之前未在任何地方提交,则必须谨慎决定是否应直接向 ARR 或 EMNLP 提交作品。按计划行事。
直接提交论文,即非ARR提交论文的截止日期为2023年6月23日。
2023 年 5 月 24 日之前提交给 ARR 的论文可以撤回并提交给 EMNLP 2023。
注意:
为了将论文直接提交给 EMNLP 2023,它必须在 ARR 系统中处于非活动状态。这意味着投稿必须被作者明确撤回,或者 ARR 评审在 5 月 24 日之前完成并与作者共享,并且该论文没有重新提交给 ARR。
作者可以在 2023 年 5 月 24 日之前退出 ARR,无论他们收到了多少评论。
2023 年 5 月 24 日之后在 ARR 系统中的论文,无论是之后提交还是之前提交且未撤回,都不能提交给 EMNLP 2023。
提交给 EMNLP 2023 的论文在 EMNLP 2023 审查期间不得提交其他地方(包括 ARR)审查。
与“标准”近期会议的主要区别包括:
混合 ARR + EMNLP 模式。
限制的强制性讨论。
主题:大型语言模型和 NLP 的未来
重要日期
强制性摘要提交
论文标题、作者姓名、联系方式和简短摘要必须在摘要提交截止日期(6 月 16 日)之前通过 EMNLP 2023 论文提交网站以电子方式提交。在完整论文提交截止日期之前,可以对标题和摘要进行小幅修改,但您不能更改作者和主题领域。带有“占位符”摘要的提交将不加考虑地删除;
重要提示:如果您错过了摘要提交截止日期,则无法提交全文。
提交方向
EMNLP 2023 的目标是广泛的技术计划。会议的相关主题包括但不限于以下领域(按字母顺序排列):
常识推理
计算社会科学与文化分析
对话与互动系统
话语与语用
自然语言处理的有效方法
自然语言处理中的伦理问题
以人为中心的自然语言处理
信息抽取
信息检索和文本挖掘
自然语言处理模型的可解释性、交互性及分析
语言基础: 视觉、机器人及其他
语言建模与语言模型分析
语言学理论、认知建模与心理语言学
自然语言处理中的机器学习
机器翻译
多语言与语言多样性
自然语言生成
自然语言处理程序申请
音系学、形态学与分词
问题解答
资源和评价
语义: 词汇、句子层面、文档层面、语篇推理等。
情感分析、文体分析与论证挖掘
语音与多模态
总结
语法、语法分析及其应用
主题
论文提交信息
论文提交和模板
提交是电子的。长篇论文和短篇论文都必须遵循 EMNLP 2023 两栏格式,使用提供的官方样式文件。模板可以在样式文件和格式中下载。请不要修改这些样式文件,也不要使用为其他会议设计的模板。不符合要求样式(包括纸张大小、边距宽度和字体大小限制)的提交将被拒绝,恕不审查。
确认
为了保证符合发布标准,我们将使用 ACL Pubcheck 工具 (https://github.com/acl-org/aclpubcheck)。准备好上镜的论文的 PDF 必须在最终提交之前通过此工具运行,我们建议在提交时也使用它。
长论文
长篇论文提交必须描述实质性的、原创的、已完成的和未发表的工作。在适当的情况下,应包括具体的评估和分析。审核表格将在截止日期前提供。长篇论文最多可包含 8 页内容,外加无限页数的参考文献和附录;长篇论文的最终版本将额外提供一页内容(最多 9 页),以便审稿人的评论可以被考虑在内。
短文
提交的短文必须描述原创和未发表的作品。请注意,短论文不是缩短的长论文。相反,短篇论文应该有一个可以在几页内完成的观点。
短文最多可包含 4 页的内容,外加无限的参考文献和附录。接受后,短论文将在会议记录中提供 5 个内容页。鼓励作者在最终版本中使用此附加页面来处理审稿人的评论。
贡献
2023年 EMNLP 欢迎以下各类捐助:
计算辅助语言分析(模型或数据资源)
自然语言处理工程实验
繁殖研究
新的数据资源,特别是低资源语言的数据资源
数据和计算效率的方法
立场文件
调查
公开提供的软件和预先培训的模型
虽然贡献类型和论文长度之间没有直接映射,但某些类型的论文自然会倾向于一定的长度:例如调查更有可能是长篇而不是短篇论文。一篇论文可以做出不止一种不同类型的贡献。
演示模式
由项目委员会决定,长篇和短篇论文将以口头形式或海报形式呈现。关于哪些论文将以口头形式展示以及哪些作为海报展示的决定将基于作品的性质而不是作品的质量。虽然在会议记录中短篇论文与长篇论文有所区别,但在会议记录中口头和海报形式的论文没有区别。
著作权
提交的作者列表应包括所有(且仅)对提交的工作做出重大贡献的个人。提交给 EMNLP 2023 的每位作者都将收到有关提交、修订和最终决定的通知。在摘要提交截止日期之后,不得对提交给 EMNLP 2023 的作者的顺序或组成进行任何更改。
引用与比较
您应该引用与您的提交相关的所有参考出版物,但您可能会因为不知道所有未发表的作品(尤其是最近发布和/或未被广泛引用的作品)而被原谅。虽然在提交时未引用此类未发表的作品不足以成为拒绝论文的理由,但如果审稿人通知您,您应该准备好在camera ready上引用此类相关作品。
如果预印本已被参考出版物取代,则应引用参考出版物而不是预印本版本。在提交截止日期前不到 3 个月出现的论文(无论是否经过审阅)被视为与您提交的论文同期,因此您没有义务进行需要额外实验和/或深入分析的详细比较。但是,您应该在提交中提及此类作品,并在直接相关的情况下列出其发表的结果。
有关详细信息,请参阅 ACL 提交、审阅和引用政策。(New Policies for Submission, Review and Citation | ACL Member Portal)
多次提交政策
EMNLP 2023 将不考虑提交时正在期刊或其他会议上审查的任何论文,并且提交的论文不得在 EMNLP 2023 审查期间提交到其他地方。该政策涵盖所有参考和存档会议和研讨会(例如 NeurIPS、ACL 研讨会)以及 ARR。此外,我们不会考虑任何与将要(或已经)在其他地方发表的论文在内容或结果上有显着重叠的论文。向 EMNLP 2023 提交多于一篇论文的作者必须确保他们提交的论文在内容或结果上没有明显重叠(>25%)。
EMNLP 2023 也将接受 ARR 评审论文的提交,前提是 ARR 评审和元评审在 ARR 会议提交截止日期前可用。但是,EMNLP 2023 将不接受正在 ARR 中积极审查的直接提交,或与此类提交显着重叠(>25%)的提交。
可选:粘性评论
之前在其他 *ACL 场地(但不是通过 ARR)审查过的论文可以选择将论文连同他们之前提交的信息一起提交,轨道主席将能够从中访问旧的评论。他们还可以提交一份简短的解释,说明论文是如何根据旧评论进行更改的。此选项可能对解决了之前发现的问题的作者有益,并且可以强烈争论论文的改进方式。新审稿人看不到之前的审稿,但区域主席和项目主席可能会在审稿质量控制、解决审稿人之间的分歧以及决定边界论文时使用它们。
局限性的强制性讨论
我们认为,除了长处之外,讨论您工作的局限性也很重要。 EMNLP 2023 要求所有论文在标题为“局限性”的专门部分中明确讨论局限性。这部分将出现在论文的末尾,在讨论/结论部分之后和参考文献之前,并且不计入页数限制。没有限制部分的论文将被自动拒绝,无需审查。
ARR 审查的论文在之前提交的文件中没有包含“限制”部分,应在提交 EMNLP 2023 的同时提交包含此类部分的 PDF。
虽然我们对不同类型的局限性持开放态度,但仅提及仅针对英语显示了一组结果可能并不能反映我们的预期。提到该方法主要适用于形态有限的语言,如英语,是一个更好的选择。此外,诸如对长文本的低可扩展性、对大型 GPU 资源的要求或其他激发关键的进一步研究的事情等限制也是受欢迎的。
主题曲目:大型语言模型和 NLP 的未来
我们很高兴地宣布 EMNLP 2023 将有一个新主题,目标是激发围绕大型语言模型和 NLP 的未来的讨论。虽然新一代大型语言模型(如 GPTX、LLAMA、BLOOM 等)声称在生成和理解方面表现出前所未有的水平,但我们在此类 LLM 的许多方面仍处于未开发领域,包括各种 NLP 任务和语言的性能、数据、主权、公平、可解释性、伦理、透明度、NLP 应用等。
主题轨道邀请实证和理论研究,以及关于此类 LLM 在 NLP 任务和应用程序中执行方式的立场和调查论文,以及这对 NLP 作为一个领域的未来意味着什么。可能的讨论主题包括(但不限于)以下内容:
当前这一代的 LLM 在 NLP 任务和应用程序上的表现有多可靠?
这些LLM如何涵盖语言多样性?
此类 LLM 以及恢复策略和方法有哪些不同的系统性故障?
这些模型是否增强了(对语言、认知或深度学习技术的)科学理解?以什么方式?
关于此类模型的设计和使用,有哪些不同的伦理和 FATE 相关考虑因素?
LLM 为 NLP 研究提供了哪些机会?
LLM如何获取世界知识?
我们如何才能将现有的知识库有效地整合到 LLM 中?
我们如何从本质上评估此类模型的性能(不涉及下游应用程序)
这些模型如何影响未来 NLP 研究的方式?
这些模型在 NLP 研究和实际应用中的性能可复制性如何?
提交的主题曲目可以是长的也可以是短的。除了其他类别的奖项外,我们预计将在会议上就此主题举行特别会议,并设立专题论文奖
道德政策
作者必须遵守 ACL 道德规范中规定的道德规范。对我们研究的伦理影响、数据的使用以及我们工作的潜在应用的考虑一直是一个重要的考虑因素,随着人工智能变得越来越主流,这些问题也越来越相关。我们要求所有作者阅读代码,并确保他们的工作符合此代码。如果一篇论文可能提出伦理问题,我们要求您在论文中明确讨论这些问题,这将在审查过程中予以考虑。我们保留以道德为由拒绝论文的权利,如果作者被认为违反了道德准则,或者他们的工作没有充分解决合法的道德问题。
在第 8 页(短论文为第 4 页)之后,作者将被允许有额外的空间用于可选的更广泛的影响声明或其他道德讨论。 EMNLP 审查表将包括一个解决这些问题的部分,审查员或 AC 标记为道德问题的论文将由道德委员会进一步审查。请注意,道德考虑部分不是必需的,但处理敏感数据或不讨论这些问题的敏感任务的论文将不被接受。相反,仅包含道德考虑部分并不能保证接受。除了接受或拒绝,论文可能会收到有条件的接受建议。指定为有条件接受的论文的camera将由伦理委员会重新审查,以确定是否已充分解决问题。请阅读道德常见问题解答,以获取有关需要注意的一些问题和需要考虑的与道德准则相关的关键问题的更多指导。
可选补充材料
附录、软件和数据
每个 EMNLP 2023 提交都可以附有一个附录,该附录将出现在主要论文的 PDF 中,在参考书目之后。一份提交文件还可能附有一个包含软件的 .tgz 或 .zip 存档文件,以及一个包含数据的 .tgz 或 .zip 存档文件。 EMNLP 2023 鼓励提交这些补充材料以提高结果的可重复性,并使作者能够提供论文中不适合的额外信息。例如,匿名相关工作(见上文)、预处理决策、模型参数、特征模板、冗长的证明或推导、伪代码、样本系统输入/输出,以及准确复制论文中描述的工作所需的其他细节可以放到附件中。然而,论文提交需要保持完全独立,因为这些补充材料是完全可选的,审稿人甚至不需要审阅或下载它们。如果伪代码或推导或模型规范是贡献的重要部分,或者如果它们对于审稿人评估工作的技术正确性很重要,则它们应该是主要论文的一部分,而不是出现在正文中附录。补充材料需要完全匿名以保持双盲审查政策。
匿名期
以下规则和指南旨在保护双盲审查的完整性并确保提交的内容得到公平审查。规则参考了匿名期,从提交截止日期前 1 个月(2023 年 5 月 23 日开始)到您的论文被接受或拒绝之日(2023 年 10 月 6 日)。在此期间撤回的论文将不再受这些规则的约束。
在匿名期间,您不得将您论文的非匿名版本在线提供给一般社区(例如,通过预印本服务器)。论文的版本包括科学内容基本相同但可能在次要细节(包括标题和结构)和/或长度上有所不同的论文。
如果您在匿名期开始前在线发布了论文的非匿名版本,您可以向会议提交匿名版本。提交的版本不得引用非匿名版本,并且您必须通知程序主席存在非匿名版本。
您在匿名期间不得更新非匿名版本,我们要求您在匿名期间不要在社交媒体上宣传或采取其他会进一步损害双盲评审的行为。
即使在匿名期间,您也可以提供论文的匿名版本(例如,在 OpenReview 上)。
对于 arXiv 提交,2023 年 5 月 23 日晚上 11:59 UTC-12h(地球上的任何地方)是论文可以上传的最晚时间。
双盲评审说明
由于评审将是双盲的,论文不得包含作者姓名和隶属关系。此外,必须避免显示作者身份的自我引用或链接(例如 github),例如“我们以前展示过(史密斯,1991 年)……”。相反,使用诸如“Smith previously showed (Smith, 1991) …”之类的引文,不符合这些要求的论文将被拒绝,恕不审查。为了获得更多细节,论文不应参考审稿人无法获得的文件。例如,不要省略或编辑重要的引文信息以保持匿名。取而代之的是,使用第三人称或命名引用来引用这项工作,如上所述(“Smith showed”而不是“we showed”)。如果审稿人无法获得重要的引文(例如,等待发表),则这些论文应匿名并包含在附录中。然后可以在不影响匿名的情况下从提交中引用它们。论文可能附有论文中描述的资源(软件和/或数据),但这些资源也应匿名。
再现性标准
审稿人将被要求评估工作的可重复性,作为他们审稿的一部分。以下是审查将考虑的标准。
对于所有报告的实验结果:
对数学设置、算法和/或模型的清晰描述
提交包含源代码的 zip 文件,其中包含所有依赖项的规范,包括外部库,或此类资源的链接(虽然仍是匿名的) 所用计算基础设施的描述
每个模型或算法(例如,训练、推理等)的平均运行时间,或估计的能源成本
每个模型中的参数数量
每个报告的测试结果对应的验证性能
所用评估指标的说明,以及代码链接
对于所有使用超参数搜索的实验:
训练和评估运行的确切数量
每个超参数的界限
最佳性能模型的超参数配置
超参数搜索试验次数
选择超参数值的方法(例如,均匀采样、手动调整等)以及用于在其中进行选择的标准(例如,准确性)
结果的汇总统计(例如,均值、方差、误差线等)
对于所有使用的数据集:
相关详细信息,例如语言、示例数量和标签分布
训练/验证/测试拆分的详细信息
任何被排除的数据的解释,以及所有预处理步骤
包含数据或数据可下载版本链接的 zip 文件
对于收集的新数据,数据收集过程的完整描述,例如对注释者的说明和质量控制方法。
此列表基于 Dodge 等人,2019 年和 Joelle Pineau 的再现性清单。
演示要求
所有被接受的论文都必须在会议上提交——无论是在线的还是面对面的——以便出现在会议记录中。在 EMNLP 2023 上接受发表的论文的作者如果希望撤回论文,必须在camera ready好的截止日期前通知项目主席。
每篇被接受论文的至少一位作者必须在提前注册截止日期前注册 EMNLP 2023。
更多信息可以在委员会博客中找到。如果您有在那里没有得到解答的问题,请发送电子邮件至 emnlp-2023-pc@googlegroups.com 向计划联合主席发送电子邮件。