3月5日 AI 資訊

以下為 2025 年 3 月 5 日的 AI 新聞與趨勢更新。

🤖 AI 視頻教學智能體:自動生成動畫教學視頻

輸入學習內容,即可由 AI 自動生成帶有動畫和語音講解的視頻。大致工作流程包括 3 個步驟: - 智能體生成教學大綱。 - 智能體編寫動漫相關程式碼並進行動畫渲染。 - 使用 Kokoro 的 TTS 語音技術生成教學視頻。

📸 Aya Vision:開源視覺模型,可解析 NSFW 圖片

Cohere 開源的 Aya Vision 提供了 8B 與 32B 兩種模型,因為不限制 NSFW 內容,可用於處理未經考慮的圖片。儘管 OCR 功能略有不足,但其解析精度與適用場景更廣。

🎨 用繪畫模型解決數獨問題,50% 成功率的創新應用

研究團隊使用擴散模型來解決數獨問題。儘管 LLM 解數獨已有成熟解決方案,但視覺模型的這一新穎應用展示了新可能,達到 50% 的成功率。

📘 教程:從零構建類似 DeepSeek-R1 的推理模型

HuggingFace 推出了逐步構建推理模型的詳細教程,對於 AI 設計者與研發者具有極大的幫助性。

📱 抖音打通豆包 AI,字節跳動加速 AI 生態建設

抖音正在測試接入豆包 AI,通過短視頻界面及訊息入口,提升 AI 應用場景及用戶體驗。同時,字節跳動內部進行多條 AI 產品線布局,顯示其全面進軍 AI 的戰略野心。

🖌️ 即夢接入 DeepSeek,提升 AI 繪圖靈感生成效率

DeepSeek 為即夢提供高精度提示詞生成技術,幫助用戶快速獲得靈感,並生成高質量圖像,讓 AI 繪圖更流暢。

🎤 xAI Grok 語音模式全面開放:功能多元實用

xAI 的 Grok 助手推出 11 種語音模式,包括字幕功能,幫助用戶拓展互動與學習場景。支持多樣化表達方式,主要應用於英文學習,但未來有望支持更多語言。

🌐 vivo 成立 AI 部門專注端側大模型訓練

vivo 透過組織重整展現 AI 目標信心。設計新任務:開拓基於二次訊息線性產品經濟。DeepSeek功能也高度結合行業運維。

上述趨勢顯示 AI 技術快速滲透至視覺、語音、推理等領域。無論是應用創新還是基礎功能構建,各大公司正逐步展現其 AI 策略及方向。