OpenAI突然发布仅3B参数的o3-mini模型,斯坦福HELM基准测试显示:
推理速度:响应延迟17ms(较Llama3-8B快5倍)
成本控制:API定价$0.0001/千token(达行业最低)
性能表现:MMLU综合得分79.3(超越GPT-3.5的70.0)

该模型采用新型:动态稀疏MoE架构,在72块A100上完成训练,通过神经元级剪枝技术将参数量压缩83%,却保留97%的知识容量。

举报/反馈

唐鹤突

2047获赞 350粉丝
投资知识分享,财经知识
关注
0
0
收藏
分享