TerryChan' Blog

文章

标签

喜欢

标签: bert

共找到 6 篇相关文章

第 1 页,共 1 页

文章预览

如何解决自然语言模型训练中数据不足?进行文本数据增强方法分享
2023年08月22日 1388 字

句自然语言任务中数据标注的成本一般都比较高,所以获取高质量数据集便成了最大的难题. 虽然最近几年各种预训练模型大行其道,但是如果能够有足够好的数据集也是能够解决问题的关键。 Mask ---- 如果使用bert作为模型一部分微调数据,mask方案没准是最廉价的创造数据的方法。之前看到有人说用mlm做内容替换生成训练,为什么不直接搞个动态mask呢?…

阅读全文
浏览 评论

文章预览

Bert用于主题建模 ( Bert vs LDA )
2023年08月22日 604 字

在这篇文章中,将用LDA(Latent Dirichlet Allocation,专门用于此目的)和使用词嵌入来进行主题建模。我将尝试用不同的算法组合(TF-IDF、LDA和Bert)和不同的降维(PCA、TSNE、UMAP)来进行主题建模。 原始地址

阅读全文
浏览 评论