2025.3.20 人工智能前沿快訊

#人工智能 #技術突破 #產業動態

以下是今天的 AI 領域重要新聞匯總,涵蓋開源模型發布、新技術突破以及產業動態。

🚀 Reka 開源 Reka Flash 3,能力超 Gemma 327B

Reka 是由十多位前谷歌 DeepMind 科學家創辦的公司。他們近日推出了首個開源模型 Reka Flash 3,這是一款 210 億參數的通用推理模型。在同樣的參數規模下,Reka Flash 3 展現出超越 Command A 和 Gemma 3(27B)等模型的能力。該模型支持低延遲推理,性能優秀,適合多種終端設備部署。
- 關鍵特色

  • 強大的推理能力:適用於解答複雜問題及多步推理。
  • 訓練技術:從零開始訓練並深度優化,性能表現優秀。
  • 適用場景:支持移動設備部署,未來有望直接應用於手機等便攜設備。

- 線上體驗:Reka Flash 3 線上測試
- 模型詳情:Huggingface 頁面

🎨 嘴炮 PS:聲控圖片編輯黑科技

利用 Sonnet 3.7 的能力,一個網頁應用得以實現語音輸入操作,借助 Gemini API 進行圖片編輯,帶來高效、便捷的圖片處理體驗。Sonnet 3.7 僅需簡單提示詞便生成了數百行代碼完成整個專案,展示出其卓越性能。
- 關鍵特色:語音操控,可實現圖片的靈活編輯部分與效果修改。
- 提示模板:Gemini API 語音操作提示詞
- Github 原始碼:voice-gemini-editor

💡 英偉達開源 Nemotron-Super 系列推理模型

英偉達釋出了三個大小的 Nemotron-Super 推理模型:8B、49B 和 249B,分別是從 LLaMA 3 的 8B、70B 和 405B 版本中進行蒸餾與強化訓練而來。該系列模型特點在於支持提示詞啟用或關閉推理模式。
- 關鍵特色

  • 49B 模型性能峰值超越 QwQ 32B,但略低於 DeepSeek R1。
  • 支持靈活功能切換,適用於多元應用場景。

- 模型詳情:Huggingface 頁面

🎥 階躍星辰開源 Step-Video-TI2V 視頻模型

階躍星辰釋出了其最新的視頻生成模型 Step-Video-TI2V,基於 DiT 架構,擁有 30 億參數。該模型支持從圖像或文字生成視頻內容,但至少需具備 64GB 顯存才能運行。
- 模型詳情:Huggingface 頁面

📢 OpenAI 開放 o1-pro API,價格昂貴引熱議

OpenAI 宣布推出 o1-pro API,但該服務的費用非常昂貴:每百萬輸入收費 150 美元,每百萬輸出收費 600 美元。

AI 技術發展日新月異,期待未來能看到更多創新及實用的應用,進一步改變我們的生活與工作方式。