2025.3.20 人工智能前沿快訊

以下是今天的 AI 領域重要新聞匯總，涵蓋開源模型發布、新技術突破以及產業動態。

🚀 Reka 開源 Reka Flash 3，能力超 Gemma 327B

Reka 是由十多位前谷歌 DeepMind 科學家創辦的公司。他們近日推出了首個開源模型 Reka Flash 3，這是一款 210 億參數的通用推理模型。在同樣的參數規模下，Reka Flash 3 展現出超越 Command A 和 Gemma 3（27B）等模型的能力。該模型支持低延遲推理，性能優秀，適合多種終端設備部署。
- 關鍵特色：

強大的推理能力：適用於解答複雜問題及多步推理。
訓練技術：從零開始訓練並深度優化，性能表現優秀。
適用場景：支持移動設備部署，未來有望直接應用於手機等便攜設備。

- 線上體驗：Reka Flash 3 線上測試
- 模型詳情：Huggingface 頁面

🎨 嘴炮 PS：聲控圖片編輯黑科技

利用 Sonnet 3.7 的能力，一個網頁應用得以實現語音輸入操作，借助 Gemini API 進行圖片編輯，帶來高效、便捷的圖片處理體驗。Sonnet 3.7 僅需簡單提示詞便生成了數百行代碼完成整個專案，展示出其卓越性能。
- 關鍵特色：語音操控，可實現圖片的靈活編輯部分與效果修改。
- 提示模板：Gemini API 語音操作提示詞
- Github 原始碼：voice-gemini-editor

💡 英偉達開源 Nemotron-Super 系列推理模型

英偉達釋出了三個大小的 Nemotron-Super 推理模型：8B、49B 和 249B，分別是從 LLaMA 3 的 8B、70B 和 405B 版本中進行蒸餾與強化訓練而來。該系列模型特點在於支持提示詞啟用或關閉推理模式。
- 關鍵特色：

49B 模型性能峰值超越 QwQ 32B，但略低於 DeepSeek R1。
支持靈活功能切換，適用於多元應用場景。

- 模型詳情：Huggingface 頁面

🎥 階躍星辰開源 Step-Video-TI2V 視頻模型

階躍星辰釋出了其最新的視頻生成模型 Step-Video-TI2V，基於 DiT 架構，擁有 30 億參數。該模型支持從圖像或文字生成視頻內容，但至少需具備 64GB 顯存才能運行。
- 模型詳情：Huggingface 頁面

📢 OpenAI 開放 o1-pro API，價格昂貴引熱議

OpenAI 宣布推出 o1-pro API，但該服務的費用非常昂貴：每百萬輸入收費 150 美元，每百萬輸出收費 600 美元。

AI 技術發展日新月異，期待未來能看到更多創新及實用的應用，進一步改變我們的生活與工作方式。