2024 年 12 月 21 日,AI 技術迎來多項更新,多款模型與創新技術亮相。以下為今日完整的 AI 資訊彙整。
OpenAI 宣布推出全新一代的推理模型 o3,相較於上一代 o1 模型,在推理和數學能力方面取得顯著提升。根據最近的數學測試集數據顯示,o3 能成功解決 25% 的題目,而 o1 只能解決 2%。在 ARC-AGI 測試中的得分也提高至 87.5%,大幅超越 o1。然而,由於當前推理成本過高,o3 尚未確定正式的發布時間,預計 mini 版本將於明年 1 月發布。
Enhance-A-Video 是一項針對視頻質量提升的新技術,無需額外訓練即可在現有視頻模型(如混元和 CogVideoX)上實現顯著改進。該技術借鑒了大型語言模型(LLM)中的溫度參數應用,具體方法包括利用 DiT 中的溫度參數調節幀間關聯強度,並基於時序注意力圖的非對角線元素計算出幀間強度指標。
Ruyi-Mini-7B 是一款專注於從圖片生成視頻的新型開源模型。該模型允許商業使用並已開放下載,但目前僅支持圖片到視頻轉換。
Sketch2Sound 是由 Adobe 推出的創新音頻生成工具,其靈感來源於 ControlNet,然而該項目尚未開源。用戶只需輸入音頻與提示詞,即可對音頻的聲音效果進行精準修改,同時保持原始音頻的節奏不變。演示視頻顯示,該技術在處理高效性及多樣性方面表現出色。
支付寶針對商家與設計師推出了 AI 創意生成平台“蚂上有創意”。該平台支持快速生成海報、視頻等創意素材,並提供創意洞察服務。自去年推出以來,已累計生成 8700 萬張 AI 素材。
ChatGPT 桌面版新增對應用內容的讀取支持,方便用戶與多個應用同步協作,例如 Apple Notes 和 VS Code,顯著提升工作效率。
以上為 12 月 21 日的 AI 資訊重點集錦。本日的更新顯示出全球人工智慧領域的快速發展,各類模型與技術工具展現了未來應用的無限可能。敬請期待更多技術突破!