您现在的位置:返回首页
马斯克突发Grok15!上下文长度至128k推理能力大幅提升
腾讯科技讯 3月29日消息,“硅谷钢铁侠”埃隆·马斯克(Elon Musk)旗下的人工智能初创公司xAI宣布正式推出Grok-1.5,该模型能够进行长语境理解和高级推理,将于近日向X平台Grok用户和早期测试者开放。
通过在两周前公布Grok-1的模型权重和网络架构,xAI展示了该公司截至去年11月取得的进展。此后,xAI在最新模型Grok-1.5中提高了推理和解决问题的能力。
Grok-1.5最显着的改进之一是它在编码和数学相关任务中的性能。在xAI的测试中,Grok-1.5在数学基准测试中获得了50.6%的分数,在GSM8K基准测试中获得了90%的分数,这两项数学基准测试涵盖了从小学到高中的各种竞赛试题。此外,它在评估代码生成和问题解决能力的HumanEval基准测试中获得了74.1%的分数。
Grok-1.5能够在其上下文窗口中处理多达128K Token的长上下文,这是它的一个新特征。这让Grok能够具有高达之前16倍的上下文处理长度,从而能够利用更长文档中的信息。
此外,该模型可以处理更长、更复杂的提示,在上下文窗口扩大的情况下仍保持其遵循指令的能力。在大海捞针(NIAH)评估中,Grok-1.5展示了强大的检索功能,可以在长度达128K的上下文中检索嵌入的文本,获得完美的检索结果。
在大规模GPU集群上运行的尖端大型语言模型研究需要强大而灵活的基础架构。Grok-1.5建立在基于JAX、Rust和Kubernetes的定制分布式训练框架之上。这个训练堆栈让xAI的团队能够以最少的努力构建原型并大规模训练新架构。xAI的定制训练编排器可确保自动检测出有问题的节点,并把它从培训任务中剔除。
Grok-1.5将很快向早期测试人员开放,xAI也期待收到反馈帮助其改进Grok。随着xAI逐渐向更广泛的受众提供Grok-1.5,该公司还将在未来几天为Grok-1.5推出若干项新功能。(编译/无忌)
更多相关资讯
推荐内容
MORE- (04-29) 橙子乐学又竖行业标杆连发32寸互动
- (10-05) 曝天玑2000旗舰芯功耗
- (09-16) 久吾高科:“久吾转债”赎回登记日
- (07-16) 我国进入“七下八上”防汛最关键时
- (07-18) 国内大V发文辱骂郎平:任人唯亲重
- (12-15) 曝光!2023年张掖市终生禁驾名单
- (11-19) 作品档案之番号【VOSS-025】饭冈加
- (11-03) 现货黄金原油白银T+D在线解套周三
- (11-30) 李亚男的街拍照火了穿衣搭配引起热
- (01-04) 有关卧底警花斗邪魔真的假的?
- (05-23) NBA季后赛鏖战 《NBA梦之队》新版
- (09-17) 国际实业:公司在吉尔吉斯斯坦设立
- (08-18) 经典之上再创经典小糊涂仙·系列的
- (04-23) 风来了冬奥之城张家口冰雪装备制造
- (05-28) 六年多的“烦薪事”解决了
- (10-01) 作品档案之番号MIBD-871浜崎りお
- (05-16) “地气之子”昊天将加盟JTeam战队
- (12-20) 8英寸和8寸一样大吗
- (09-23) 温情奶爸硬核心——孙红雷代言的这
- (08-18) 上海市副市长市公安局局长被查 涉
- (01-17) 有关明发滨江新城西祠可以这样解读
- (10-30) 端午节的祝福短信真的还是假的?
- (11-16) CW406J铜管材-合金铜材-铜线材
- (09-14) 16000年前的人头骨化石 具体是什么
- (02-23) “豫”见非遗丨周家口木板年画拓印
- (03-09) 关于没有什么阻挡着未来怎么上了热
- (11-06) 作品档案之番号E★人妻DX 番号:29
- (01-12) 有关孙熙鸣瞒耐枫的底层逻辑是什么
- (07-12) 山东省已下达资金72亿支持提升高校
- (01-30) PSV服活动更新:绿骑士和选拔骑士
- (02-12) 年终盘点超人气的韩国女星外表优雅
- (11-21) 蚂里奥发布业界首款支持边缘计算的
- (08-10) 有关须(xū)锭(dìnɡ)彤(tónɡ)
- (07-05) 关于中德安联人寿保险怎么上了热搜
- (09-05) 特朗普称中国死亡人数比美多得多
- (03-28) 多地多部门多举措保电力供应
- (08-03) 20岁女兵征服40吨远火车:保护祖国
- (03-28) 起飞保罗-乔治接队友传球飞起暴扣
- (07-17) 2-3第90分钟遭绝杀中甲领头羊爆冷
- (05-07) 因科比逝世现场的照片流出加州可能