商业日报网

滚动新闻:
·六度赴会 — “聚焦创想,合作赋能”,全新诺华亮相第六届进博会 ·屡获央视认证!中国雅迪二十五载研发创新,以冠军实力领跑全球 ·“邂逅三星堆—— 12K微距看国宝全球巡展”在北京启幕 ·TCL智能终端亮相IFA 2023,展示智慧科技和创新赛道的未来愿景 ·鸿蒙harmonyOS如何重装系统 ·普通人能定义元宇宙吗?蒂姆·库克并不这么认为 ·B站发布《中国奇谭2》《长歌行》等68部片单称未来三年原创投入只增不减 ·iOS微信终于更新!朋友圈可以发长视频了 ·如何做好抖音?怎么运营好抖音的几个重要技巧 ·抖音珠宝怎么报白?抖音珠宝类目报白具体流程?珠宝报白的三种方法 ·《做家务的男人4》开播!三翼鸟智慧场景机智应对家务难 ·助力中小微企业数字化转型“创客北京”大赛360专项赛圆满收官 ·拥抱高端的脚步从未停息,方太夺下中国厨电品牌价值三连冠 ·体育经济走热苏宁易购老板电器开启亚洲美食节 ·AWE亮点来了!TCL双子舱洗衣机Q10,巨好用的分区洗衣机 ·海信视像召开2023秋季新品发布会:首台毫米波全维感知MiniLED海信 ·护肤品存储难?AWE展Leader新品类,解决护肤品存储难题 ·LCD不伤眼OLED费眼睛,一文说清谁才是真正的“眼睛刺客”? ·618闭眼买!海尔“精华洗”又快又干净 ·手机自动亮度调节功能,是省电还是费电? 

百川智能发布Baichuan2开源大模型

来源:中国网    发布时间:2023-09-07 09:24:44   阅读量:13811   

9月6日,百川智能召开主题为“百川汇海,开源共赢”的大模型发布会,正式开源微调后的Baichuan2-7B、Baichuan2-13B、Baichuan2-13B-Chat与其4bit量化版本,并且均为免费可商用。

据介绍,Baichuan2-7B-Base和Baichuan2-13B-Base均基于2.6万亿高质量多语言数据进行训练,在保留了上一代开源模型良好的生成与创作能力,流畅的多轮对话能力以及部署门槛较低等众多特性的基础上,两个模型在数学、代码、安全、逻辑推理、语义理解等能力有显著提升。

其中Baichuan2-13B-Base相比上一代13B模型,数学能力提升49%,代码能力提升46%,安全能力提升37%,逻辑推理能力提升25%,语义理解能力提升15%。

Baichuan2-7B和Baichuan2-13B不仅对学术研究完全开放,开发者通过邮件申请获得官方商用许可后,即可以免费商用。

大模型训练包含海量高质量数据获取、大规模训练集群稳定训练、模型算法调优等多个环节。每个环节都需要大量人才、算力等资源的投入,从零到一完整训练一个模型的高昂成本,阻碍了学术界对大模型训练的深入研究。

百川智能本次开源了模型训练从220B到2640B全过程的Check Ponit,并宣布将发布 Baichuan 2技术报告,详细介绍Baichuan 2的训练细节,帮助大模型学术机构、开发者和企业用户更深入的了解其训练过程,更好地推动大模型学术研究和社区的技术发展。

百川智能由前搜狗CEO王小川创办于今年4月,已相继发布Baichuan-7B、Baichuan-13B两款开源免费可商用的中文大模型,以及一款搜索增强大模型Baichuan-53B。8月31日,百川智能宣布百川大模型通过《生成式人工智能服务管理暂行办法》备案,面向公众开放。

【免责声明】 凡本站未注明来源为(商业日报网)的所有作品,均转载、编译或摘编自其它媒体,转载、编译或摘编的目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。其他媒体、网站或个人转载使用时必须保留本站注明的文章来源,并自负法律责任。

热文推荐

首页 | 焦点| 业界| 财经| 企业| 消费| 行业| 股票| 视窗| 商业| 经贸| 产业| 资讯

Copyright @ 2010- 备案号:鄂ICP备2021013412号-3 网站地图