TerryChan' Blog

文章

标签

喜欢

标签: 数据集

共找到 2 篇相关文章

第 1 页,共 1 页

文章预览

如何解决自然语言模型训练中数据不足?进行文本数据增强方法分享
2023年08月22日 1388 字

句自然语言任务中数据标注的成本一般都比较高,所以获取高质量数据集便成了最大的难题. 虽然最近几年各种预训练模型大行其道,但是如果能够有足够好的数据集也是能够解决问题的关键。 Mask ---- 如果使用bert作为模型一部分微调数据,mask方案没准是最廉价的创造数据的方法。之前看到有人说用mlm做内容替换生成训练,为什么不直接搞个动态mask呢?…

阅读全文
浏览 评论