原创发现安利 AI GPT

LLaVA-免费体验最新的GPT-4图文识别

发表于2023-09-21更新于2024-05-09

字数总计:305阅读时长:1分钟阅读量: 芝士星球

发现安利 AI GPT

LLaVA-免费体验最新的GPT-4图文识别

noise2023-09-212024-05-09

介绍

LLaVA代表了一种新颖的端到端训练大型多模态模型，对于通用的视觉和语言理解，实现令人印象深刻的聊天功能，提供了多模式 GPT-4 的形态使用

地址

访问： https://llava-vl.github.io/

GitHub：https://github.com/haotian-liu/LLaVA

特征

多模式指示数据。首次尝试使用纯语言 GPT-4 生成多模态语言图像指令跟踪数据。
LLaVA模型。介绍了LLaVA（L arge Language-a nd-Vision Assistant），这是一个端到端训练的大型多模态模型，连接视觉编码器和LLM以实现通用视觉和语言理解。
性能。早期实验表明，LLaVA 表现出令人印象深刻的多模型聊天能力，有时会在看不见的图像/指令上表现出多模态 GPT-4 的行为，并且在合成多模态指令遵循数据集上与 GPT-4 相比产生了 85.1% 的相对分数。当对科学 QA 进行微调时，LLaVA 和 GPT-4 的协同作用达到了 92.53% 的新先进准确度。
开源。公开提供 GPT-4 生成的可视化指令调整数据、我们的模型和代码库。

noise

原创 LLaVA-免费体验最新的GPT-4图文识别

打赏作者

感谢你赐予我前进的力量

alipay
wechat

赞赏者名单

因为你们的支持让我意识到写文章的价值🙏

本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Noise&Blog！

喜欢这篇文章的人也看了

ChatALL-同时与所有 AI 机器人聊天

Dify开源轻松构建AI应用

GPT-API水龙头

GPT4离线版WebUI中文版整合安装包

LobeChat-可一键免费部署的ChatGPT/LLM Web应用程序

Webpilot-免费体验ChatGPT Plus联网插件WebPilot

评论

匿名评论隐私政策

✅ 你无需删除空行，直接评论以获取最佳展示效果

数据库加载中