深度阅读

"开源中文聊天语料"

作者
作者
2023年08月22日
更新时间
5.98 分钟
阅读时间
0
阅读量
语料名称 语料原始URL(即出处,尊重原始版权)
chatterbot https://github.com/gunthercox/chatterbot-corpus/tree/master/chatterbot_corpus/data/chinese
douban(豆瓣多轮) https://github.com/MarkWuNLP/MultiTurnResponseSelection
ptt(PTT八卦语料) https://github.com/zake7749/Gossiping-Chinese-Corpus
qingyun(青云语料)
subtitle(电视剧对白语料) https://github.com/fateleak/dgk_lost_conv
tieba(贴吧论坛回帖语料) https://pan.baidu.com/s/1mUknfwy1nhSM7XzH8xi7gQ 密码:i4si
weibo(微博语料) 61.93.89.94/Noah_NRM_Data/
xiaohuangji(小黄鸡语料) https://github.com/candlewill/Dialog_Corpus

相关标签

博客作者

热爱技术,乐于分享,持续学习。专注于Web开发、系统架构设计和人工智能领域。