深度阅读

SentencePiece一个google开源的自然语言处理工具包

作者
作者
2023年08月22日
更新时间
2.16 分钟
阅读时间
0
阅读量

SentencePiece是一个google开源的自然语言处理工具包。数据驱动、跨语言、高性能、轻量级——面向神经网络文本生成系统的无监督文本词条化工具
SentencePiece的用途不限于自然语言处理,,蛋白质的一级结构是氨基酸序列,需要研究氨基酸序列片断,片断的长度又是不固定的,就可以用SentencePiece进行切分。

官方网站
https://github.com/google/sentencepiece

博客作者

热爱技术,乐于分享,持续学习。专注于Web开发、系统架构设计和人工智能领域。