当前位置：首页 > 探索 > 王小川大模子25天再降级！13B版本开源收费可商用，3090即可部署

王小川大模子25天再降级！13B版本开源收费可商用，3090即可部署

2024-11-16 11:59:02 [热点] 来源：幼筠小公主网

　　衡宇金磊发自凹非寺

　　量子位 | 公共号 QbitAI

　　就在适才，模天王小川的再降开源大模子又有了新措施——

　　百川智能，正式宣告130亿参数通用狂语言模子（Baichuan-13B-Base）。版本

　　而且民间对于此的开源可商可部评估是：

功能最强的中英文百亿参数目开源模子。

　　与此一起出道的收费署，尚有一个对于话模子Baichuan-13B-Chat，用即以及它的模天INT4/INT8两个量化版本。

　　但更紧张的再降一点是（划重点），残缺开源！版本收费可商用！开源可商可部

　　就在不久前的收费署6月15日，百川智能才适才宣告其第一款70亿参数目的用即中英口语语模子Baichuan-7B。

　　当时的模天版本便已经拿下多个天下威信Benchmark榜单同量级测试榜首；同样作为开源大模子，风闻清华北少数已经用上了。再降

　　仅仅时隔25天，版本更大、更强的版本再次袭来，不患上不说，王小川在技术上的措施是有够紧锣密鼓的了。

　　那末这次号称的“最强开源大模子”，详细展现又是奈何样呢？

　　多规模逾越ChatGPT

　　老例子，先摸棱两可地说一下Baichuan-13B的根基个“模”质料：

　　中英双语大模子，130亿参数，在1.4万亿token数据集上磨炼，残缺开源、收费可商用。

　　1.4万亿ztoken这个磨炼数据量，逾越LLaMA-13B磨炼数据量的40%，因此后开源的13B尺寸模子天下里，磨炼数据量最大的模子。

　　此外，Baichuan-13B高下文窗口长度为4096——这就不患上不提到其与7B版本残缺差距的编码方式。

　　7B版本接管RoPE编码方式，而13B运用了ALiBi位置编码技术，后者可能处置长高下文窗口，致使可能判断逾越磨炼时期读取数据的高下文长度，从而更好地捉拿文本中高下文的相关性，让预料或者天生更精确。

　　作为一款中英文双语大模子，Baichuan-13B接管了相对于失调的中英文语料配比以及多语言对于齐语料，从而在中英两种语言上都有不俗展现。

　　主流百亿参数13B开源模子benchmark下场

　　来看看Baichuan-13B在中文规模的测评下场。

　　在评测集C-EVAl上，Baichuan-13B在做作迷信、医学、艺术、数学等规模争先LLaMA-13B、Vicuna-13B划一尺寸的狂语言模子。

　　社会迷信以及人理迷信规模，水平比ChatGPT还要好上一点。

　　英文规模的展现也算不错，能比同尺寸的其余开源模子，如LLaMA-13B 、Vicuna-13B都有更好的展现。

　　个别而言，非业余用户以及有详细需要的企业，对于有对于话功能的对于齐模子有更重的好奇心。

　　鉴于这个情景，百川智能这次在宣告与磨炼模子底座Baichuan-13B-Base的同时，还宣告了其对于话模子Baichuan-13B-Chat及其INT4/INT8两个量化版本。

　　来看看对于话模子的实际展现下场——

　　让它写个商品介绍邮件，它能写出酱婶儿的：

　　数据推理能耐若何？

　　也浅测了一番：

　　至于互联网上太古或者起初盛行的种种梗，Baichuan-13B-Chat彷佛也没在怕的：

　　民间介绍，为了保障模子的纯挚度，Baichuan-13B-Base以及Baichuan-13B-Chat不针对于任何benchmark测试妨碍专项优化，具备更高的效力以及可定制性。

　　为甚么要残缺开源、可商用？

　　正如咱们适才提到的，这次百川智能推出的Baichuan-13B-Base是对于学术钻研残缺凋谢。

　　不光如斯，所有开拓者均可经由邮件向百川智能恳求授权，在取患上民间商用允许后即可收费商用。

　　而且据民间的说法，百川智能是为了飞腾运用的门槛，才同时开源了Baichuan-13B-Chat的INT8以及INT4两个量化版本。

　　这样一来，在近乎无损的情景下，即可能将模子部署在如3090等破费级显卡上。

　　想必良多小过错就要问了，百川智能为甚么要走这么一条路？

　　着实假如看下Meta在大模子上的开源之路，即可窥知一二。

　　咱们都知道大模子在磨炼的老本极高，因此像OpenAI以及google两大科技巨头最后抉择的是闭源的“路数”，它们为的便因此此保障自己的优势。

　　而Meta其后所推出的LLaMa则与之“背道而驰”，但所迸收回来的后劲却是有目共睹——

　　快捷排汇大批开拓者，在LLaMa根基上迭代出了种种ChatGPT的替换品，致使在功能的展现上是可能坚持GPT-3.5的那种。

　　加之业界对于大模子未来睁开态势已经告竣为了一个共识：

　　相似安卓以及iOS，将会是开源以及闭源共存的形态。

　　因此，开源在大模子的睁开中未然成为一股不可或者缺的中松软力。

　　……

　　那末你对于王小川的新大模子，有何意见呢？

海量资讯、精准解读，尽在新浪财经APP

责任编纂：韦子蓉

(责任编辑：休闲)

相关内容

推荐文章

原创日媒高度评价泰山队，认为其具备东亚区冠军实力，疑惑中超受不公

原标题：日媒高度评价泰山队，认为其具备东亚区冠军实力，疑惑中超受不公目前，山东泰山已经是离开韩国前往了日本备战与横滨水手的亚冠比赛，这场比赛是亚冠最后一轮的比赛，对于山东泰山来说，压力还是比较 ...[详细]
正式确定！CBA2米20大中锋决定退役，祝福

深圳队的赵义明，在社媒宣布加盟福建队。赵义明原来是深圳队重点培养的内线，但这个赛季只打了10场比赛，基本被弃用了。赵义明与深圳队的合同还剩下1年，经过三方友好协商，赵义明从深圳队转会到福建队。孙喆决定 ...[详细]
绿军助教敲定卡塞尔 “外星人”如何打动凯尔特人？金卡戴珊海滩大片！穿连体泳衣秀身材，极致臀腰比，湿发太迷人

体坛周报全媒体记者季孟年今年夏天，凯尔特人管理层的首要任务并不是处理杰伦·布朗的合同问题，而是补强自己的教练组。此前史蒂文斯已经明确表态称，凯尔特人会继续信任马祖拉。接下来，便是如何围绕马祖 ...[详细]
最漫长的亚冠赛季:22年亚冠冠军到23年5月决出16岁女生遇老师开黄腔，聊天记录辣眼睛，家长别只盯着成绩

体坛传媒亚洲论坛在本期亚洲论坛的最后，嘉宾拉伊提到了这届亚冠的赛制问题 "在结束了埼玉的球迷盛宴之后，让我们展望下一个亚冠赛季。之前，亚足联就决定了改变赛制。” ...[详细]
轰73+15+15！三巨头打穿爵士，伦纳德创纪录，赛后送给哈登特权

在NBA的绿茵场上，每一次的胜利都是星光熠熠的夜晚中最璀璨的那颗星。这不，洛杉矶快船队再次以117比103的比分力克犹他爵士，如同夜空中最亮的北极星，指引着球队一路前行，取得了令人瞩目的三连胜。在这场 ...[详细]
皇马今夏第一笔重磅引援锁定贝林厄姆，多特蒙德最多可获1.3亿转会费邓紫棋彻底放飞自我了？穿比基尼出镜秀身材，身高160比例却很优越，身材真带感

不到20岁的英格兰国脚贝林厄姆加盟皇马的消息，还没有得到皇马的官宣。但北京时间7日晚，他所效力的德甲俱乐部多特蒙德就已先行宣布了这位本赛季德甲最佳球员的离队。多特蒙德俱乐部母公司发布的官方公告显示，多 ...[详细]
青岛传递“一桌饭菜收费三次”：“多收6000元”不属实，错收3400元已经退还

6月10日，有网友宣告帖文称，刘女士在青岛良友滋味旅馆就餐时，一桌饭菜一再收取三次餐费，多收餐费6000多元。发现网上信息后，崂山区赶快建树由区公循分局、区市场监管局组成的审核组，到青岛良友滋味旅馆妨 ...[详细]
高校校长宣告手机号后，收到2万条同砚们的短信

克日，武汉工商学院举行2023届学生结业仪式暨学位付与仪式仪式上，校长孔建益说：“2021年9月份我向全校学生宣告手机号以来约莫有2万条同砚们的短信”光阴回到两年前在该校202 ...[详细]
曼彻斯特双雄一悲一喜，“蓝月”憾负维拉，“红魔”力克“蓝军”白天演员、晚上间谍，隐姓埋名75年，他不只是“最好的姜子牙”

曼联正在找回赢球的感觉。资料片）发记者尹成君北京时间7日凌晨，英超联赛进行了第15轮的角逐，本轮最大的亮点就是曼彻斯特两支豪门分别碰上硬茬阿斯顿维拉和切尔西。最终，一路力争上游的曼城以0:1不敌维拉 ...[详细]
够强硬！皇马态度明确：不买姆巴佩，重点培养2大新星

2022年世界杯，姆巴佩打进8球，决赛更是上演帽子戏法。主流观点认为，姆巴佩会是未来足坛第1人。皇马是否会重启姆巴佩的转会？25日的《马卡报》透露，皇马态度非常明确：别浪费时间了，俱乐部不会追逐姆巴佩 ...[详细]

热点阅读

随机内容

友情链接

接受PR>=1、BR>=1，流量相当，内容相关类链接。

天龙八部Twitter

诛仙Instagram

天龙八部博客

琅琊榜Facebook

金士杰Facebook

温兆伦主页

辰亦儒抖音

陈建州博客

刘心悠TikTok

杨谨华微博