AMD 推出自家首款小语言模型“Llama-135m”
发布时间:2024-09-29 17:32:08来源:网络转载
9 月 29 日消息,AMD在 Huggingface平台公布了自家首款“小语言模型”AMD-Llama-135m,该模型具有推测解码功能,拥有6700亿个token,采用 Apache 2.0开源许可, 附模型地址如下(点此访问)。
据介绍,这款模型主打“推测解码”能力,其基本原理是使用小型草稿模型生成一组候选token,然后由更大的目标模型进行验证。这种方法允许每次前向传递生成多个token,而不会影响性能,从而显著减少 RAM 占用,实现效率提升。
AMD表示,这款模型在四个AMD Instinct MI250节点训练了六天,其“编程专用版本”变体AMD-Llama-135m-code则额外耗费了四天时间进行微调。
(责编: admin)
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
-
华为生日礼券有什么用
华为生辰礼券有什么用是大家比拟关注的,究竟华为作为比拟受大家喜爱的品牌,很多友友都在应用,而近期该品牌新上线的生辰礼品券成了很多友 [详细] -
华为生日礼券哪些城市可以到线下领取礼物
华为生辰礼券是你购置了华为的产品就可以享有的福利,但是吧由于不是每个处所都有兑换礼物的实体店,所以华为生辰礼券哪些城市可以到线下领 [详细] -
华为会员生日礼物必须去直营店才能领到吗
华为会员生辰礼物必需去直营店能力领到吗是当下大家最为关注的话题,究竟就某书友友们晒出的礼物照片,还是值得跑一趟的,但是吧由于线下华 [详细] -
北方冬天白天冷还是晚上冷2024
随着冬季的来临,我国大部分地域的的气温都开端骤降,也正是因为这样北方冬天白天冷还是傍晚冷成了日常生活中大家茶余饭后讨论的焦点,下面 [详细] -
别来沾边是什么综艺
别来沾边是gai在很早以前中国新说唱里的豪言壮语,作为rapper的语言都是给人很冲的感到,其实gai本人挺有趣的,近期在《中国说唱巅峰对决》 [详细]