文章目录
- ChineseBert 模型介绍
- 开源代码使用方法
- 未完待续
ChineseBert 模型介绍
论文地址:https://arxiv.org/pdf/2106.16038.pdf
代码地址:https://github.com/ShannonAI/ChineseBert
bert是语义模型,因此无法解决形近字、音近字的问题。
ChineseBERT主要引入了文本的拼音编码和字形编码解决上述问题。
开源代码使用方法
- 下载上面地址的代码作为你的project
- 下载ChineseBERT模型到project下的一个文件夹,命名为ChineseBERT-base
- 在上面的文件夹下安装git-lfs并初始化(以Linux系统即我们常用的服务器为例):
# git lfs是大型代码管理工具Large File Storage,在BERT等大型预训练模型中
sudo apt-get install git-lfs
git lfs install
git lfs pull
- 如果提示import代码错误,可能是transformer版本不一致导致的,可以直接去百度相应解决办法,总有前人替你踩过了许多坑。
未完待续
居中并且带尺寸的图片: