Meta加入AI军备竞赛:发布开源大语言模型 号称优于ChatGPT

继微软、谷歌之后,脸书(Facebook)母公司Meta(Nasdaq:META)也加入AI军备竞赛。

当地时间2月24日,Meta官网公布了一款新的人工智能大型语言模型LLaMA,从参数规模来看,Meta提供有70亿、130亿、330亿和650亿四种参数规模的LLaMA模型,并用20种语言进行训练。

Meta首席执行官马克·扎克伯格表示,LLaMA模型旨在帮助研究人员推进工作,在生成文本、对话、总结书面材料、证明数学定理或预测蛋白质结构等更复杂的任务方面有很大的前景。


【资料图】

怎么理解人工智能大型语言模型的参数?

据悉,AIGC(利用人工智能技术来生成内容)形成的学习能力在一定程度上取决于参数的规模。Open AI推出的ChatGPT是通过其AI大模型GPT-3的基础上通过指令微调后得到的,参数量达1750亿,谷歌推出的Bard使用的是轻量级LaMDA模型,相比标准版本,轻量化版本模型所需要的运算能力较小,能面向更多使用者开放,使其参与体验,有报道指出LaMDA模型参数量在1370亿。百度文心大模型参数量达到2600亿,阿里则表示,从过往实践来看,其具备支撑超万亿参数大模型研发的技术实力。

Meta此次推出的大模型实力如何呢?

Meta首席AI科学家杨立昆(Yann LeCun)表示,在一些基准测试中,LLaMA 130亿参数规模的模型性能优于OpenAI推出的GPT3,且能跑在单个GPU上;650亿参数的LLaMA模型能够和DeepMind 700亿参数的Chinchilla模型、谷歌5400亿参数的PaLM模型竞争。

法新社称,按照Meta的表述,LLaMA是一套“更小、性能更好”的模型,且不同于谷歌的LaMDA和OpenAI的GPT机密训练资料和演算,LLaMA是基于公开资料进行训练。

Meta在官网表示,在大型语言模型中,像LLaMA这样的小型基础模型是可取的,因为测试新方法、验证他人的工作和探索新用例所需的计算能力和资源要少得多。基础模型基于大量未标记的数据进行训练,这使得它们非常适合于各种任务的微调。与其他大型语言模型一样,LLaMA的工作原理是将一系列单词作为输入,并预测下一个单词以递归生成文本。

Meta称将致力于这种开源模型的研究,新模型会开源给整个AI研究社区使用,并授予大学、非政府组织和行业实验室访问权限。另外,Meta表示其还有更多研究需要做,以解决大型语言模型中的偏见、有害评论等风险。

Meta披露的2022年第四季度财报显示,该公司已连续第三个季度出现营收同比下滑,四季度营收312.54亿美元,同比下降4%。广告为Meta的支柱业务,为第四季度的总营收贡献超97%,报告期内,尽管广告展现量增长了23%,但单位广告价格下滑了22%。

截至美东时间2月24日,Meta股价跌0.96%报170.390美元/股,总市值4418亿美元。

关键词: Meta ChatGPT

为您推荐

戏怨攻略大全 戏怨游戏攻略第一章/第二章/第三章/第四章/第五章图文流程[多图] 今日报

戏怨游戏怎么通关?这款恐怖类型的解密游戏一共有五章,不同的章节关卡

来源:游戏鸟手游网2023-07-03

京东方A:2023年柔性AMOLED出货量目标为超1.2亿片

京东方A近期接受投资者调研时称,2023年,随着公司柔性AMOLED业务的

来源:新京报2023-07-03

税务小哥vlog:探访“专精特新”“小巨人”税费优惠政策培训

朝阳区税务局联合朝阳园管委会、朝阳区社保中心合作开展朝阳区内北京市

来源:北京商报官方账号2023-07-03

【世界播资讯】NBA5消息:太阳600万得戈登!热火追利拉德受阻,勇士再签1名后卫

前言NBA休赛期自由市场开启之后,各家球队动作频频,追逐心仪的球员,

来源:江湖再无24号2023-07-03

「抖音618团券节」热卖品牌榜出炉,这些商家卖爆了!|今日报

肯德基、海南爱大集国际旅行社、伊颜悦色 抖音618团券节期间,来

来源:互联网2023-07-03

莫里森(关于莫里森的简介)-环球热推荐

1、莫里森,1971年7月9日出生,美国田径运动员,是美国110米栏名将,曾

来源:互联网2023-07-03

单机卸率每小时3057吨 青岛港第26次刷新铁矿石接卸世界纪录 快看

每经AI快讯,7月2日,随着最后一个清舱机械吊装出舱,“远谊海”轮在青

来源:每日经济新闻2023-07-03

面部整形美学设计_面部整形大概多少钱

1、面部整形的概念比较模糊,需要具体情况具体分析才能判断价格;如果

来源:互联网2023-07-03