已成功入职小米大模型岗！！大模型面试其实挺水的，hr听到这些直接过

news2026/2/13 1:58:13

小米大模型面试180题

在这里插入图片描述

1、目前比较受欢迎的开源大模型有哪些？

GPT系列：由OpenAl开发的生成式预训练模型，如 GPT-3。
BERT系列：由Google开发的转换式预训练模型，如BERT、RoBERTa等。
T5系列：由Google开发的基于Transformer的编码器-解码器模型，如T5、mT5等。

2、微调模型需要多大显存?

微调模型需要的显存取决于模型的规模、任务复杂度、数据量等因素。一般来说，微调模型需要的显存通常比预训练模型少，因为微调涉及到更新的参数较少。然而，具体需要的显存仍然需要根据实际情况进行评估和调整。

3、如何提升大模型的检索效果?

优化索引：使用更高效的索引结构，如倒排索引、BM25等。
特征工程：提取和利用有效的特征，如文本向量、词频等。
模型选择：选择合适的检索模型，如基于向量的相似度计算、基于排序的模型等。
训练策略：使用训练策略，如多任务学习、知识蒸馏等，来提高模型的性能。
训练策略：使用训练策略，如多任务学习、知识蒸馏等，来提高模型的性能。

4、如何让大模型处理更长的文本?

使用模型架构，如Transformer, 它可以有效地处理长序列。
使用内存机制，如外部记忆或缓存，来存储和检索长文本中的信息。
使用分块方法，将长文本分割成更小的部分，然后分别处理这些部分。
大模型参数微调、训练、推理

5、想让模型学习某领域或行业知识，是应该预训练还是应该微调?

为了让模型学习某个领域或行业的知识，通常建议先进行预训练，以学习通用的语言知识和模式。预训练可以帮助模型建立强大的语言表示，并提高模型的泛化能力。

然后，可以通过微调来注入特定领域或行业的知识，使模型能够更好地适应特定的任务和应用场景。

6、想让模型学习某领域或行业知识，是应该预训练还是应该微调?

选择合适的预训练目标和任务：确定模型将学习哪些通用的语言知识，以及针对哪些特定任务进行优化。
收集和准备数据：收集大量、多样化的数据，包括通用数据和特定领域的数据，进行清洗和预处理。
选择模型架构：选择一个适合的模型架构，如Transformer, 并确定模型的规模和层数。
定义训练流程：设置训练参数，如学习率、批量大小、训练轮数等，并选择合适的优化器和损失函数。
训练模型：使用准备好的数据和训练流程开始训练模型，监控训练过程中的性能和资源使用。
评估和调优：在训练过程中定期评估模型的性能，并根据需要调整训练参数和模型架构。

针对所有自学遇到困难的同学们，我帮大家系统梳理大模型学习脉络，将这份 LLM大模型资料 分享出来：包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴，可以 扫描下方二维码领取🆓↓↓↓

👉[CSDN大礼包🎁：全网最全《LLM大模型入门+进阶学习资源包》免费分享（安全链接，放心点击）]()👈

面试总结

面试真的不难，很多问题都背到过。先过一遍整理好的大模型面试题，然后刷题，刷题可以进一步加深印象。网上也有很多题库资源，牛客、北森、甚至小红书都有，我就是在这个上面刷的题(题库界面放后面了)。因为只有刷题功能有点单一，毕竟是为了面试做准备，如果有额外附加面试经验分享能够让准备更加的全面所以我才用牛客比较多，当然大家也可以根据自己的需要进行选择，祝大家都能顺利拿到 offer

在这里插入图片描述