embedding
点击返回网站首页

项目清单:

  • 可以用于文本相似度比较,检索
  • 可以用于知识库特征提取,配合大模型实现RAG(增强搜索生成)的功能。

代码特征向量提取工具箱 - embedding/*

3个SDK:
1.code2vec_sdk
2.codet5p_110m_sdk
3.mpnet_base_v2_sdk
自然语言与代码特征提取工具箱提供3个SDK,以满足不同精度与速度的需要。

文本特征提取向量工具箱【中文】 - embedding/*

文本语义特征提取工具箱提供4个 SDK:
1.m3e_cn_sdk
2.text2vec_base_chinese_sdk
3.text2vec_base_chinese_sentence_sdk
4.text2vec_base_chinese_paraphrase_sdk

文本特征提取向量工具箱【中文】 - embedding/*

文本语义特征向量提取工具箱【多语言】提供 3 个 SDK:
1.sentence_encoder_15_sdk(支持 15 种语言)
2.sentence_encoder_100_sdk(支持100种语言)
3.text2vec_base_multilingual_sdk(支持50+种语言)

SDK代码下载地址:

Gitee链接

点击返回网站首页