百川智能发布 Baichuan2-192K 大模型,上下文窗口长超 GPT-4 约 14 倍

#7*24快讯#小助手22023-10-30

据 DoNews 报道,10 月 30 日,百川智能发布 Baichuan2-192K 大模型。其上下文窗口长度高达 192K,号称是目前全球最长的上下文窗...
据 DoNews 报道,10 月 30 日,百川智能发布 Baichuan2-192K 大模型。其上下文窗口长度高达 192K,号称是目前全球最长的上下文窗口。Baichuan2-192K 能够处理约 35 万个汉字,是目前支持长上下文窗口最优秀大模型 Claude2(支持 100K 上下文窗口,实测约 8 万字)的 4.4 倍,更是 GPT-4(支持 32K 上下文窗口,实测约 2.5 万字)的 14 倍。
据悉,Baichuan2-192K 在 Dureader、NarrativeQA、LSHT、TriviaQA 等 10 项中英文长文本问答、摘要的评测集上表现良好,有 7 项取得 SOTA。百川智能表示,Baichuan2-192K 将以 API 调用和私有化部署的方式提供给企业用户,目前百川智能已启动 Baichuan2-192K 的 API 内测,开放给法律、媒体、金融等行业的核心合作伙伴。
原文链接:https://www.donews.com/news/detail/1/3749317.html
本文链接:https://www.8btc.com/article/6836894
转载请注明文章出处

相关话题

#AI #7*24快讯

用手机扫码体验更多功能

扫码参与评论与作者和更多用户交互