Hugging Face推开源多模态AI模型IDEFICS 支持图像、文本输入
时间:2023-08-24 07:00:55来源:站长之家


【资料图】

编程客栈()8月23日 消息:最近, Hugging Face 推出了一个名为 IDEFICS 的开源多模态 AI 模型,它可以接受图像和文本作为输入,并生成连贯的文本输出。

IDEFICS 是一个强大的视觉语言模型,拥有高达800亿的参数量,功能包括根据图像生成描述、回答相关问题以及根据多个图像生成叙述等。

IDEFICS 基于 DeepMind 开发的 Flamingo 模型,后者是一种目前最先进的视觉语言模型,但尚未对外开源。相比之下,IDEFICS 作为 Flamingo 的开源实现版本,其测试结果显示在各类图像理解任务上其表现与 Flamingo 相当。

为训练 IDEFICS,Hugging Face 利用了多种公开的数据集,还额外构建了一个包含1.4亿张图像的大规模图像-编程客栈文本数据集。

IDEFICS 有两个版本,包括90亿参数的基础版和800亿参数的大模型版,可以处理不同的应用场景。

IDEFICS 的推出为研究人员和开发者提供了js一个强大的开源视觉语言编程模型,相比专利系统如 GPT-3,它提供了更大的灵活性。同js时,IDEFICS 也显示出生成式模型处理多模态输入的潜力。

未来如果能进一步提升多模态理解和生成能力,将可以大幅推动诸如机器人、自动驾驶等多模态 AI 应用的发展。

项目网址:https://huggingface.co/spaces/HuggingFaceM4/idefics_playground

标签:

最新
  • Hugging Face推开源多模态AI模型IDEFICS 支持图像、文本输入

    编程客栈()8月23日消息:最近,HuggingFace推出了一个名为IDEFICS的开

  • 洛杉矶时报:乌度卡前未婚妻正在申请获得其孩子的完全监护权

    据《洛杉矶时报》报道,乌度卡前未婚妻尼娅-朗正申请获得其与乌度卡的1

  • 诺兰来华!看「奥本海默」需要准备什么?

    对诺兰的电影稍微熟悉的影迷,或许还记得他早在上一部作品《信条》中,

  • 古井贡酒:连续3日融资净买入累计669.16万元(08-22)

    古井贡酒融资融券信息显示,2023年8月22日融资净买入万元;融资余额万

  • 三维化学:预中标约13.07亿元硫磺回收领域项目

    证券时报e公司讯,三维化学(002469)8月22日晚间公告,中国兵器电子招标

  • 欧洲主要股指集体收涨 德国DAX30指数涨0.66%

    欧洲主要股指集体收涨,德国DAX30指数涨0 66%,英国富时100指数涨0 19%

  • 吕钦扬和凌一尧真实结局是什么(吕钦扬和凌一尧真实结局)

    今天小鱼来为大家解答以上问题,吕钦扬和凌一尧真实结局是什么,吕钦扬

  • 汽车防冻液价格一览表最新(汽车防冻液价格一览表)

    今天小鱼来为大家解答以上问题,汽车防冻液价格一览表最新,汽车防冻液

  • 每公里只要三毛钱的比亚迪汉及比亚迪汉DM能耗测试

    导读说起中大型车,屏幕前的你想到了什么?通常而言,首先浮现在人们脑

  • 孩子发脾气时,请教会他们“好好生气” | 精选

    孩子一不高兴就哼哼唧唧的,说什么也不听;事情不按照他说的做,就开始

  • 《收纳物语》喵喵物语通关攻略

    《收纳物语》喵喵物语如何通关,第二十四关是喵喵物语,在这一关中需要

  • 动物毛化妆刷怎么清洗(化妆刷怎么清洗)

    1、在温水里放少量的化妆刷清洗剂或者洗发香波,把化妆刷放在水中轻轻

  • 外国青少年拥抱南博会:“方寸之间”见世界机遇

    中新社昆明8月18日电题:外国青少年拥抱南博会:“方寸之间”见世界机

  • 阿尔及利亚发生一起针对华侨企业恶性抢劫事件

    近日,阿尔及利亚布迈德斯省发生一起针对华侨企业的恶性抢劫事件,多名

  • 幸福的童年从这里开始——访中企出资成立运营的南非德阿早教中心

    8月11日,孩子们在南非德阿镇的一家儿童早教中心玩耍。这家早教中心由

  • 吉黑高速B6标架梁全部完成

    8月17日,中铁一局承建的吉黑高速项目完成全部预制梁架设,至此,项目

  • 旅游
    • 首个全国生态日,200万尾鱼苗畅游长沙母亲河湘江

    • 宠爱副驾,银河L7给你专属精致

    • 新疆青海等地多降水天气

    • 九月,大学见:新生入学指南