文章预览 "基于BERT微调做实体对应的信息抽取 抽取实体描述和属性" 2023年08月22日 726 字 这是我在知乎上的一点分享,还有点价值,转过来备份下. 基本上就是提取 实体+关系+描述 这一套。 比如前面的描述这个,点开每一条你就会发现基本都是 实体+是+描述。 至于下面的高度体重什么的也是类似,关系词固定下就是了。 要实现类似的也不是很难,现在模型这么多,随便用个Bert都可以做出类似的效果。 就拿抽取描述来说,先对文章抽取实体,然后 用实体+文章,… 默认 ai bret gpt2 nlp 人工智能 自然语言 阅读全文 浏览 评论
文章预览 "如果使用GPT2训练生成菜谱会怎么样" 2023年08月22日 84 字 如果拿菜谱来做训练资料喂给GPT2的话,真的不知道会生成什么样的暗黑料理。不知道做出来有没有人敢吃啊!哈哈 想想都激动呢,哪天有机会爬个菜谱网站试试 默认 gpt2 人工智能 自然语言 阅读全文 浏览 评论
文章预览 "kaggle限制每个账户gpu使用每周30小时" 2023年08月22日 334 字 kaggle限制每个账户gpu使用每周30小时,只能是珍惜点用了.[colab](https://colab.research.google.com/)根本就跑不动gpt2 Kaggle's GPU usage is limited to 30 hours per week for each type of processor . This means… 默认 gpt2 人工智能 自然语言 gpu kaggle 阅读全文 浏览 评论
文章预览 "尝试使用albert评估标题质量" 2023年08月22日 195 字 bert很强大但是训练成本有点过大,所以尝试使用albert\_tiny训练,虽然效果会降低不少但是预测速度足够快.而且机器要求也小了很多. 思路 选择视频标题和播放量作为训练资料,毕竟视频标题党的情况比较多.想要直接预测流量估计不是很容易但是预测个区间总共可以吧. 爬取了20万条数据作为语料,跑了一千多次后仅有55%的正确率. 希望… 默认 人工智能 自然语言 albert 阅读全文 浏览 评论
文章预览 "pytorch版本的reformer库推荐 中文实现也很轻松reformer-pytorch… 2023年08月22日 624 字 Transformer很强大但是消耗资源有点多,还好google又搞出来了reformer在资源消耗上做了很大的优化,这也让我们能够以更小的代价进行尝试,毕竟GPU真的不便宜。 [reformer-pytorch](https://github.com/lucidrains/reformer-pytorch)可以试用下 默认 pytorch nlp 自然语言 nlg reformer 阅读全文 浏览 评论
文章预览 "GPT2不要太强悍 生成中文也不错" 2023年08月22日 787 字 以下内容使用gpt2生成 边境牧羊犬怎么养? 边境牧羊犬,这是一种非常漂亮的狗狗,很多人都会把它当成孩子了,它会经常跟人一样,它会对人发脾气,不管什么样的狗狗,它都会对小朋友发脾气。因为边境牧羊犬不管是从生活习惯还是家庭生活都比较容易接受,但是它的身体素质都比较强,它对于主人来说是比较好训练的,只需要稍微训练一点就行了,那么它就不会对人发脾气了,但是边… 默认 gpt2 人工智能 自然语言 机器写作 阅读全文 浏览 评论
文章预览 "update September 12, 2019 at 12 2023年08月22日 28 字 gpt2如何做摘要生成呢?据说可以的 默认 gpt2 人工智能 自然语言 阅读全文 浏览 评论
文章预览 "又是一个神级的ai写作助手" 2023年08月22日 280 字 国内的ai就是牛. 小弈写作[yuntianyi.com](http://yuntianyi.com) 看看下面它们生成的内容,原来就是照搬爬取的内容啊.  # 程序会自动下载所对应的细领域模型 text = seg.cut('我… nlp 自然语言 pkuseg 分词 阅读全文 浏览 评论