在包括MMLUPro、AIME24、MATH500、SciCode、GPQA、HLE、LiveCodeBench等在内的12个最具有代表性的评测基准中,取得了全球模型第三、国产模型第一
他还谈及了去年的理想MEGA风波,他称遭遇了汽车史上最大的抹黑事件,而现在理想MEGA已经是50万以上MPV的销量冠军,以及50万元以上所有纯电车的销量冠军。以下是电话会议实录:高盛分析师EricSheridan:我的第一个问题想问马克。我们还在不断提升系统能力,通过用户兴趣探索、学习用户偏好等,探究用户更多样化、更细分的兴趣领域。团队中的每个人都负责系统的一部分,每个人也可以独立运行测试,我们不需要每个研究人员都了解整个系统的逻辑。我相信,人工智能技术还是会朝着更快的方向发展,这也会影响我们的诸多决策,
KimiK2是月之暗面于今年7月11日正式发布并同步开源的最新一款具备更强代码能力、更擅长通用智能体任务的专家混合架构基础模型,在SWEBenchVerified(编程)、Tau2(智能体)、AceBench(工具调用)等基准性能测试中,均取得开源模型中的SOTA成绩(指在特定任务或基准测试中取得当前最佳表现),展现出在代码、智能体、数学推理任务
Copyright © 2021 胡思乱量网 All Rights Reserved