以下是今天的重要人工智慧相關新聞整理,涵蓋技術進展、產品發布及業界動態,讓您一次掌握最新訊息。
阿里巴巴近期開源了通義萬象 2.1 (Wan 2.1) 視頻生成模型,提供了 14B 和 1.3B 兩種參數大小。該模型支持「文生視頻」(text-to-video) 和「圖生視頻」(image-to-video),效果表現相當不錯,與「可靈 1.5」模型接近。該模型雖然效果強大,但仍有部分問題,例如手部細節處理不夠自然。此外,每次生成視頻的成本為 0.4 美元。
在 ComfyUI 平台上,開發者可以利用此模型進行高效圖文轉視頻操作。此外,ElevenLabs 的免費大禮包還提供 50 美元的 Fal 點數,支持 Wan 2.1 和 Google Veo 2 模型體驗。
DeepSeek 在開源計畫第三天發布了 DeepGEMM 技術,專為提升 FP8 格式運算效率設計。該技術能將矩陣乘法性能提高最多 2.7 倍,大幅提升 AI 模型訓練效率。
ElevenLabs 發布了新的 ElevenReader Publishing 平台,用戶可免費將任意書籍轉化為有聲書,並進行銷售獲利。該功能為數字內容創作者和出版商提供了高度便利,也為有聲書市場注入了新活力。
OpenAI 宣布升級 Plus 和 Pro 用戶的 Deep Research 試用機會,其中 Plus 用戶每月 10 次,Pro 用戶則提升至每月 120 次。OpenAI 同時發布了 Deep Research 系統卡片,幫助用戶理解該功能如何運作。
DeepSeek 宣布每日 00:30 至 08:30 的低價政策。在此期間,DeepSeek-V3 價格調降至原價的 50%,而 DeepSeek-R1 更低至 25%,為開發者提供了更高性價比的服務窗口。
DeepSeek 在其開源計畫的第四天推出 DualPipe 雙向管道並行算法和 EPLB 動態負載均衡技術,專注於提升大規模模型訓練的效率。這些技術將大幅提升 AI 計算資源利用率,並解決大模型訓練中的資源分配問題。
阿里巴巴宣佈正式啟動 2026 屆春季校招,此次招聘將開放 3000 個崗位,其中近一半涉及人工智慧技術。部分部門如高德與阿里雲的 AI 相關佔比高達 65% 與 80%。
ElevenLabs 發布了 Scribe V1 模型,支持 99 種語言並創下 96.7% 英語精度的記錄。該模型能在複雜環境下區分多達 32 位說話者,目前定價為每小時 0.40 美元,未來六週內享有 50% 折扣。
字節跳動推出「照片動起來」功能,讓老照片以動態影像形式重現生命力,操作簡便,僅需上傳照片並描述希望的動作。
OpenAI 即將推出 GPT-4.5,該模型目前出現在 ChatGPT 的 Android 測試版中,並率先向 Pro 用戶開放。
人工智慧領域每日持續進步,本報導整理了近期的技術動向與最新應用,希望能幫助您了解業界最新發展。