OpenAI突然发布仅3B参数的o3-mini模型,斯坦福HELM基准测试显示: 推理速度:响应延迟17ms(较Llama3-8B快5倍) 成本控制:API定价$0.0001/千token(达行业最低) 性能表现:MMLU综合得分79.3(超越GPT-3.5的70.0) 该模型采用新型:动态稀疏MoE架构,在72块A100上完成训练,通过神经元级剪枝技术将参数量压缩83%,却保留97%的知识容量。
唐鹤突