SentencePiece是一个google开源的自然语言处理工具包。数据驱动、跨语言、高性能、轻量级——面向神经网络文本生成系统的无监督文本词条化工具
SentencePiece的用途不限于自然语言处理,,蛋白质的一级结构是氨基酸序列,需要研究氨基酸序列片断,片断的长度又是不固定的,就可以用SentencePiece进行切分。
深度阅读
SentencePiece一个google开源的自然语言处理工具包
作者
作者
2023年08月22日
更新时间
2.16 分钟
阅读时间
0
阅读量