Hugging Face推开源多模态AI模型IDEFICS 支持图像、文本输入_百通网

首页

首页 >白山 > 临江市 > 正文

Hugging Face推开源多模态AI模型IDEFICS 支持图像、文本输入

时间：2023-08-24 07:00:55来源：站长之家

【资料图】

编程客栈（）8月23日消息:最近， Hugging Face 推出了一个名为 IDEFICS 的开源多模态 AI 模型，它可以接受图像和文本作为输入，并生成连贯的文本输出。

IDEFICS 是一个强大的视觉语言模型，拥有高达800亿的参数量，功能包括根据图像生成描述、回答相关问题以及根据多个图像生成叙述等。

IDEFICS 基于 DeepMind 开发的 Flamingo 模型，后者是一种目前最先进的视觉语言模型，但尚未对外开源。相比之下，IDEFICS 作为 Flamingo 的开源实现版本，其测试结果显示在各类图像理解任务上其表现与 Flamingo 相当。

为训练 IDEFICS，Hugging Face 利用了多种公开的数据集，还额外构建了一个包含1.4亿张图像的大规模图像-编程客栈文本数据集。

IDEFICS 有两个版本，包括90亿参数的基础版和800亿参数的大模型版，可以处理不同的应用场景。

IDEFICS 的推出为研究人员和开发者提供了js一个强大的开源视觉语言编程模型，相比专利系统如 GPT-3，它提供了更大的灵活性。同js时，IDEFICS 也显示出生成式模型处理多模态输入的潜力。

未来如果能进一步提升多模态理解和生成能力，将可以大幅推动诸如机器人、自动驾驶等多模态 AI 应用的发展。

项目网址:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground

标签：

上一篇文章：洛杉矶时报：乌度卡前未婚妻正在申请获得其孩子的完全监护权

下一篇文章：最后一页

Hugging Face推开源多模态AI模型IDEFICS 支持图像、文本输入

编程客栈（）8月23日消息:最近，HuggingFace推出了一个名为IDEFICS的开

洛杉矶时报：乌度卡前未婚妻正在申请获得其孩子的完全监护权

据《洛杉矶时报》报道，乌度卡前未婚妻尼娅-朗正申请获得其与乌度卡的1

诺兰来华！看「奥本海默」需要准备什么？

对诺兰的电影稍微熟悉的影迷，或许还记得他早在上一部作品《信条》中，

古井贡酒：连续3日融资净买入累计669.16万元（08-22）

古井贡酒融资融券信息显示，2023年8月22日融资净买入万元；融资余额万

三维化学：预中标约13.07亿元硫磺回收领域项目

证券时报e公司讯，三维化学(002469)8月22日晚间公告，中国兵器电子招标

欧洲主要股指集体收涨德国DAX30指数涨0.66%

欧洲主要股指集体收涨，德国DAX30指数涨0 66%，英国富时100指数涨0 19%

吕钦扬和凌一尧真实结局是什么（吕钦扬和凌一尧真实结局）

今天小鱼来为大家解答以上问题，吕钦扬和凌一尧真实结局是什么，吕钦扬

汽车防冻液价格一览表最新（汽车防冻液价格一览表）

今天小鱼来为大家解答以上问题，汽车防冻液价格一览表最新，汽车防冻液

每公里只要三毛钱的比亚迪汉及比亚迪汉DM能耗测试

导读说起中大型车，屏幕前的你想到了什么?通常而言，首先浮现在人们脑

孩子发脾气时，请教会他们“好好生气” | 精选

孩子一不高兴就哼哼唧唧的，说什么也不听；事情不按照他说的做，就开始

《收纳物语》喵喵物语通关攻略

《收纳物语》喵喵物语如何通关，第二十四关是喵喵物语，在这一关中需要

动物毛化妆刷怎么清洗（化妆刷怎么清洗）

1、在温水里放少量的化妆刷清洗剂或者洗发香波，把化妆刷放在水中轻轻

外国青少年拥抱南博会：“方寸之间”见世界机遇

中新社昆明8月18日电题：外国青少年拥抱南博会：“方寸之间”见世界机

阿尔及利亚发生一起针对华侨企业恶性抢劫事件

近日，阿尔及利亚布迈德斯省发生一起针对华侨企业的恶性抢劫事件，多名

幸福的童年从这里开始——访中企出资成立运营的南非德阿早教中心

8月11日，孩子们在南非德阿镇的一家儿童早教中心玩耍。这家早教中心由

吉黑高速B6标架梁全部完成

8月17日，中铁一局承建的吉黑高速项目完成全部预制梁架设，至此，项目

首个全国生态日，200万尾鱼苗畅游长沙母亲河湘江
宠爱副驾，银河L7给你专属精致
新疆青海等地多降水天气
九月，大学见：新生入学指南

热点