以下為今日 AI 領域的最新動態,涵蓋生成式 AI、新產品功能、以及產業趨勢,幫助您快速掌握技術前沿。
Genesis 是一個設計用於生成符合物理規則世界的生成式物理引擎,它具備生成人物動作、機器人策略、場景、3D 物體,以及 3D 人物面部動作和表情的能力。其目標是為 AI 和機器人提供自動化數據,從而加速人工智能及其應用的發展。當前,Genesis 的物理引擎和模擬平台已經開源,但生成模型部分尚未公開。
- 應用特色:縮短物理模擬開發周期,可應用於遊戲開發、虛擬現實和機器人學習。
- 性能優勢:相比傳統 GPU 加速引擎,模擬速度快 10-80 倍,甚至達到實時的 43 萬倍。
- 未來潛能:顯著提高物理 AI 和機器人戰略的開發效率。
可靈最新的 1.6 版本在物理規律真實感、人物表演和語義理解上均實現顯著提升,成為目前最佳 AI 圖生視頻模型之一。該版本展現了極高的技術表現,無論在日常場景中的物理演繹,還是人物情感及指令解析上,都顯得更加真實和智能。
OpenAI 為 ChatGPT 推出了語音對話功能,美國用戶可撥打專線電話 1-800-242-8478 或通過 WhatsApp 發消息進行交流。此功能特別針對老年機、座機等傳統設備,降低技術產品的使用門檻,顯著擴大人工智能的應用場景。
- 免費體驗:提供每月 15 分鐘的免費通話時長。
- 便捷整合:與 WhatsApp 結合,用戶可透過常用平台輕鬆互動。
GitHub 推出 Copilot 免費使用版本,用戶每月可免費獲得 2000 次代碼補全與 50 次聊天請求,支持新型 GPT-4o 和 Claude 3.5 Sonnet 模型。此舉進一步降低了開發者使用生成式 AI 輔助工具的門檻,加速了智能編程的普及。
tldraw 推出智能畫布工具 tldraw computer,類似 ComfyUI,支持多種能力,包括文本生成、大型語言模型(LLM)應用、圖片和語音生成等多種功能,適合設計和生成場景的多元需求,用戶可免費使用。
Odyssey 發布的世界生成模型 Explorer,可以根據文字與圖片描述生成 3D 視頻和場景。該工具適合電影、遊戲等創意產業,能快速模擬基於真實圖像訓練的 360 度場景。
ElevenLabs 推出僅需 75 毫秒生成音頻的 Flash 模型,相比之前的 Turbo 模型響應提速,但音效質量有所下降,適合需要極速輸出的使用場景。
蘋果正與中國科技巨頭騰訊和字節跳動進行談判,計劃在中國市場整合本地 AI 模型,提升 iPhone 的本地化技術適配和用戶體驗。蘋果將利用其 Apple Intelligence 系統實現上述戰略,但與百度的合作因技術問題早前未能達成。
Midjourney 的 Relax 馬拉松活動,允許用戶僅支付 10 美元便可享受 Relax 模式下的無限圖像生成服務,生成速度顯著加快,同時增加了對國內使用者更友好的支付方式(如支持支付寶)。
阿里云的 AI 服務團隊“通義”重組為阿里智能信息事業群的一部分,此調整加強了 AI To C 應用布局,並強調用戶市場的導向。
Domo AI 更新至 v2v5.0 測試版,其新功能可將動漫視頻轉換為真人視頻,並支持通過提示詞進行視頻中的細節對象替換,進一步提升 AI 為視覺創意賦能的能力。
Magnific AI 推出 Super Real 模型,聚焦於建築、室內設計等專業場景,並加入光照環境調整功能,提升作品的輸出品質。
專注於 AI 搜索的 Perplexity 完成 5 億美元新輪融資,估值突破至 90 億美元,資金將用於擴充團隊並加速產品迭代。
每日 AI 新聞簡報由 AI 日報 整理,感謝您的閱讀!