以下是 2024 年 12 月 30 日人工智能行業的重要更新與趨勢動態整理。
PixVerse 推出了全新版本 V3.5,其最大亮點在於極高的生成速度和優異的品質表現。用戶能夠在短短 20 秒內生成 8 秒長的影片剪輯(640×352 分辨率)。除此之外,該版本還支持多種動漫風格和高清影片輸出,這使得它在 AI 驅動的影片生成行業中成為領跑者。
知名技術達人稚暉君宣布開源了一份機器人操作數據集,涵蓋逾 100 萬條高質量訓練數據。這一數據集為開發者提供了寶貴的資源,推動機器人技術的研究與開發。
全新醫療領域大模型“華佗GPT-o1”發布。該模型基於 LLaMA 3 和 Qwen 2.5 底座,具備在醫療問題上的驗證和指導能力,為醫療 AI 的發展指明了創新方向。
一種更高效的多頭注意力機制被提出,即 Multi-matrix Factorization Attention。儘管理能稍有損失,但相比傳統注意力方法,內存占用減少了 93.7%,大幅提升了計算資源的優化效率。
一段對比影片展示了 AI 影片生成技術在兩年中的巨大發展。左邊的影片利用 AnimateDiff 技術生成,右邊則由 Runway 的影片生成功能製作。兩者反映了人工智能技術的快速迭代進程。
支付寶推出全新 AI 視覺搜索工具“探一下”。通過多模態大模型技術,該工具可以便捷識別花草寵物、翻譯外文文本和提供旅遊講解等服務,極大提升用戶交互體驗。
AigcPanel 是支持中英文介面的 AI 數字人一鍵生成系統,具備影片合成、聲音克隆等能力,完全開源,能夠幫助用戶快速部署和創作。
騰訊聯合實驗室推出的 StereoCrafter 系統,可以通過深度影片重構和立體修復,將 2D 影片轉換為沉浸式 3D 影片。在沉浸式內容需求日益增長的今天,該技術具有非常廣闊的應用前景。
迅雷與杭州未來科技城簽署合作協議,將在余杭區建立全球人工智能總部,進一步推進 AI 在數字經濟中的創新應用。
谷歌 CEO 桑達爾·皮查伊表示,AI 模型 Gemini 將在 2025 年成為谷歌的戰略重點,將通過擴展消費端應用來進一步鞏固行業地位。
研究團隊提出 ASAL (Artificial Life Automated Search) 方法,通過使用視覺-語言模型探索人工生命形式,有效減輕了傳統依靠手動設計與試錯的負擔,實現效率提升。
AI 行業在 2024 年迎來多項突破,從生成技術到醫療 AI,再到人工生命探索,這些方向不僅展現了多樣化創新,也為未來數年的發展奠定了堅實基礎。