3月5日 AI 資訊

發布日期：2025/03/05

以下為 2025 年 3 月 5 日的 AI 新聞與趨勢更新。

🤖 AI 視頻教學智能體：自動生成動畫教學視頻

輸入學習內容，即可由 AI 自動生成帶有動畫和語音講解的視頻。大致工作流程包括 3 個步驟： - 智能體生成教學大綱。 - 智能體編寫動漫相關程式碼並進行動畫渲染。 - 使用 Kokoro 的 TTS 語音技術生成教學視頻。

Cohere 開源的 Aya Vision 提供了 8B 與 32B 兩種模型，因為不限制 NSFW 內容，可用於處理未經考慮的圖片。儘管 OCR 功能略有不足，但其解析精度與適用場景更廣。

研究團隊使用擴散模型來解決數獨問題。儘管 LLM 解數獨已有成熟解決方案，但視覺模型的這一新穎應用展示了新可能，達到 50% 的成功率。

HuggingFace 推出了逐步構建推理模型的詳細教程，對於 AI 設計者與研發者具有極大的幫助性。

抖音正在測試接入豆包 AI，通過短視頻界面及訊息入口，提升 AI 應用場景及用戶體驗。同時，字節跳動內部進行多條 AI 產品線布局，顯示其全面進軍 AI 的戰略野心。

DeepSeek 為即夢提供高精度提示詞生成技術，幫助用戶快速獲得靈感，並生成高質量圖像，讓 AI 繪圖更流暢。

xAI 的 Grok 助手推出 11 種語音模式，包括字幕功能，幫助用戶拓展互動與學習場景。支持多樣化表達方式，主要應用於英文學習，但未來有望支持更多語言。

vivo 透過組織重整展現 AI 目標信心。設計新任務：開拓基於二次訊息線性產品經濟。DeepSeek功能也高度結合行業運維。

上述趨勢顯示 AI 技術快速滲透至視覺、語音、推理等領域。無論是應用創新還是基礎功能構建，各大公司正逐步展現其 AI 策略及方向。

參考連結

引用來源