压缩算法为大语言模型“瘦身”
时间:2024-11-23 10:42:18来源:科技日报

据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA,能精简大型语言模型(LLM)的海量数据,为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本,还能推动LLM在手机和笔记本电脑上高效使用。

团队举例称,当人们使用ChatGPT时,请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大,通常还很慢。如果用户想要使用消费级图形处理单元运行LLM,就需要对这些LLM进行压缩。

CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简,可在手机或笔记本电脑等设备上存储和访问,同时提供了与未压缩版本几乎一样准确而微妙的性能。

虽然CALDERA并非首个压缩LLM的算法,但其独特之处在于兼具“低精度”和“低排序”两种特性。其中,“低精度”减少了比特数,加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。

团队表示,使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外,用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调,这使其能根据特定需求调整模型来增强隐私,而无需与第三方共享敏感数据。

不过团队也提醒道,在智能手机或笔记本电脑上运行LLM,可能会占用设备内存。

标签:

最新
  • 压缩算法为大语言模型“瘦身”

    据美国科学促进会旗下网站19日报道,美国普林斯顿大学和斯坦福大学

  • 国货美妆三季度财报扫描:公司业绩分化,市场格局维持稳定

    随着华熙生物在10月30日发布2024年第三季度业绩报告,今年国内头部

  • 民政部等14部门发文推进老年阅读工作

    新华社北京11月5日电(记者高蕾)记者5日从民政部获悉,民政部、全

  • 紧急驰援莆田 打赢抢修复电第一战

    这条导线再收紧一点,这条匝线先解掉……11月1日凌晨,在莆田市荔城

  • 我国拟2035年全面建成新材料大数据中心体系

    新华社北京10月30日电(记者张晓洁、张辛欣)记者10月30日从工业和

  • A股重大调整!今起实施

    10月30日起,沪深主板A股公司的市值退市标准正式从3亿元调整为5亿元

  • 海内外专家聚焦胰岛移植 体外再造胰岛组织给糖尿病患者带来希望

    中国糖尿病患者人数庞大,其中30%以上存在胰岛功能衰竭,需终身注射

  • 近年力度最大的化债措施即将推出,如何看待?|环球视点

    在12日举行的国新办发布会上,财政部部长蓝佛安透露了关于支持地方

  • 台风“山陀儿”已致台湾1人死亡70人受伤

    中新社台北10月2日电 (记者 陈小愿)台中央灾害应变中心2日介绍,

  • 通络干预心血管事件链5项科研成果发布 环球快报

    9月7日,由中国中西医结合学会主办,中国中西医结合学会血管-脉络病

  • 资本圈 | 华夏首创奥莱REIT基金发售拟募资19.744亿元;安盛计划以50亿欧元出售旗下资管部门 天天新资讯

    华夏首创奥莱REIT基金发售预计募集资金总额19 744亿元

  • 中国汽研申请电动汽车热失控及致灾危害评估专利,能够全面且准确地对电动汽车热失控危害性进行评估_天天简讯

    2024年7月19日消息,中国汽车工程研究院股份有限公司申请一项名为“电

  • 长安马自达 EZ-6 轿车迎来下线,提供纯电和增程两种动力版本 世界聚焦

    7月18日消息,长安马自达宣布旗下B级新车——MAZDAEZ-6(以下称EZ-6)

  • 唐河县张店镇筑牢夏季防汛屏障

    面对近期频繁的雨水天气,唐河县张店镇多管齐下,强化责任,采取多项措

  • 重庆银行发行“科创主题”小微金融债,创西部地区最低利率 全球观点

    2024年6月24日,重庆银行成功发行“科创主题”小微金融债,发行规模40

  • 邓州市杏山区:开展“五进”宣传活动 优化食品安全环境-全球看热讯

    眼下,邓州市杏山旅游管理区组织多部门联合开展了进农村、进商超、进校

  • 旅游
    • “澳证易”等自助服务启用 澳门政务服务延伸至横琴 世界新要闻

    • 美股收评:三大指数涨跌不一,越南电动汽车生产商VinFast涨超108%,成为全球市值第五大上市汽车股

    • 三湘印象(000863):8月22日北向资金减持174.74万股

    • 潍坊潍城:保障农民工足额领到辛苦钱