点击返回网站首页

 

图像&文本的跨模态相似性比对检索 SDK【中文】

背景介绍

OpenAI 发布了两个新的神经网络:CLIP 和 DALL·E。它们将 NLP(自然语言识别)与 图像识别结合在一起,对日常生活中的图像和语言有了更好的理解。
之前都是用文字搜文字,图片搜图片,现在通过CLIP这个模型,可是实现文字搜图片,图片搜文字。其实现思路就是将图片跟文本映射到同一个向量空间。如此,就可以实现图片跟文本的跨模态相似性比对检索。

SDK功能:

运行例子

运行成功后,命令行应该看到下面的信息:

SDK代码下载地址:

Github链接

Gitee链接

点击返回网站首页