menu

文档中段落级别的文本标注任务

文档对段落级别的文本标注任务如果直接上crf显然是不可想像的。 想法: 句子分类借助bert的cls对句子分类。 cls输出向量拼接经过crf。

可以保持序列的连贯,而且训练的压力相对小很多。

如果没有可用的数据集,完全可以用摘要算法生成些样本作为测试。
在经过人工筛选,没准可以提取不错的摘要。
编辑