個人隨筆 華為曝光兩大黑科技!打破推理延遲魔咒,大模型從此「秒回」 華為推出兩大 AI 黑科技 ——FusionSpec 與 OptiQuant 。FusionSpec 打破大模型推理延遲魔咒,將耗時降至毫秒級;OptiQuant 支持靈活量化,推理性價比更高,二者為超大規(guī)模 MoE 模型推理開辟新路徑,推動中國 AI 發(fā)展。 新智元 AI 創(chuàng)新華為技術(shù)突破