点击返回网站首页

 

Sentencepiece分词的Java实现

Sentencepiece是google开源的文本Tokenzier工具,其主要原理是利用统计算法, 在语料库中生成一个类似分词器的工具,外加可以将词token化的功能。

运行例子

运行成功后,命令行应该看到下面的信息:

SDK代码下载地址:

Github链接

Gitee链接

点击返回网站首页