今日科技動態(2024年11月25日)

#科技

在今日的科技動態中,我們將探討數位媒體、AI技術及量子計算的新進展。以下是各項技術的新突破及其影響。

🖼️ OmniControl:物品驅動的圖片生成

OmniControl是一種圖片生成技術,允許用戶提供素材圖,並將這些素材融入生成的圖片中。技術目前的融合效果尚可,整體圖片質量還有待提升。用戶可通過以下連結線上體驗或查看GitHub專案連結:

  • 在線體驗:[huggingface.co](https://huggingface.co/spaces/Yuanshi/OminiControl)
  • GitHub:[OminiControl](https://github.com/Yuanshi9815/OminiControl)

🔲 Edify 3D:文字生成3D模型

基於Transformer和擴散模型,Edify 3D提供快速的3D模型生成服務。其模型生成速度快,並且支持4K分辨率貼圖及場景編輯,為用戶提供高品質的3D資產。了解更多:[NVIDIA Deep Imagination Research Homepage](https://research.nvidia.com/labs/dir/edify-3d/)

🔑 AlphaQubit:基於Transformer的量子糾錯系統

谷歌的量子計算項目AlphaQubit實現了基於Transformer的循環神經網絡,其性能已超越其他最先進的解碼器,為量子計算領域的發展提供新思維。參考論文:[www.nature.com](https://www.nature.com/articles/s41586-024-08148-8)

📈 可靈AI平台1.5模型升級:上線人臉模型功能 增加「標準模式」

可靈 AI 平台近期升級至1.5版本,新增功能包括加強的高品質視頻生成與快速生成720p視頻的標準模式。更新後的人臉模型功能針對高級會員開放,支持快速生成視頻內容,提升創作效率。

  • 🎨 增強模式:精細化控制運動軌跡與靜止區域。
  • ⚡ 標準模式:快速生成720p視頻,創作時間縮短。
  • 👤 人臉模型:解決人臉ID問題,支持隨時調用。

🎬 Runway新增視頻擴展畫面功能“Expand Video”

Runway 推出“Expand Video”功能,用戶可以通過文本提示添加視覺內容並調整視頻。其動態效果支持創造快速變焦和拉遠鏡頭,提升視頻體驗,標誌著視頻生成技術的又一進步。

  • 🎥 文字提示擴展內容:創造更生動的視頻效果。
  • ⚙️ 動態效果:快速變焦和拉遠鏡頭。
  • 🚀 加快生成速度:滿足快速創作需求。

📱 華為Mate70系列將支持AI隔空傳送 余承东親自演示

Mate70系列即將發表,將搭載AI隔空傳送和魔法手勢操作功能,用戶可透過簡單手勢操作提升效率,並首次搭載原生鴻蒙系統。

  • 🤖 AI隔空傳送:手勢操作便利性。
  • ✋ 魔法手勢:增加操作靈活性。
  • 🌐 原生鴻蒙系統:推動操作系統進步。

🚀 Lightricks開源實時視頻生成模型LTX-Video 生成一個視頻只要4秒!

Lightricks推出的LTX Video是開源的視頻生成模型,能以20億參數構建高效的視頻生成過程,與ComfyUI連接無縫,促進創意產業的發展。

  • 快速生成:4秒生成5秒影片。
  • 高效運行:bfloat16精度優化內存。
  • 與ComfyUI無縫集成:技術門檻低。

🖼️ EchoMimicV2:輸入圖片、音頻和手勢視頻即可生成“同款”數字人

EchoMimicV2可透過輸入一張圖片、一段音頻和手勢視頻來生成高品質半身動畫,其創新性是引入了音頻-姿態動態和諧化策略提升細節。

  • ✨ 簡化控制條件。
  • 🎨 提升動畫的細節與表現力。
  • 📊 新基準評估優於目前技術。

🎶 音頻驅動生成面部視頻技術JoyVASA

JoyVASA 是音頻驅動的動畫技術,提升了嘴形同步和視頻質量。其獨創的兩階段設計支持更長動畫視頻的生成,並支持多語言數據。

  • 🎨 解耦面部表情與3D模型。
  • 🔊 支持人物&動物動畫。
  • 🌐 多語言支持。

📸 PicMenu:用AI將菜單可視化 隨手一拍就能生成高品質菜單

PicMenu是一款透過AI技術將傳統菜單數位化的工具。只需拍照即可生成完整高質量的菜單展示,有效促進餐飲業的數位轉型。

  • 拍照自動提取菜品信息。
  • 多重AI技術確保高效準確。
  • 開放源代碼支持定制部署。

🖨️ 英偉達發佈Edify3D生成模型2分鐘即可生成高質量3D資產

NVIDIA的Edify3D技術結合了多視角擴散模型和Transformer技術,可以在兩分鐘內生成4K分辨率的3D模型,適宜多樣行業應用。

  • 高質量3D模型迅速生成。
  • 精確網格結構與高分辨率紋理。
  • 文本提示複雜3D場景支持。

📲 更聰明了!小米智能家庭屏系列產品推送大模型超級小愛

小米宣布將智能家庭屏系列進行大模型升級,新增問答和對話功能,提升設備交互能力,涵蓋六款設備並支持更廣泛的應用。

  • 🔧 涵蓋多款設備。
  • 📱 小米音箱App配套升級。
  • 🌐 支持文本創作與實時搜索。

📷 REDMI K80Pro搭載Xiaomi AISP2.0影像算法:融合四大模型

小米揭示REDMI K80系列攝影能力的提升,Xiaomi AISP2.0融合多種大模型技術,提供卓越的影像處理能力。

  • 配備高動態主攝與長焦鏡頭。
  • 算法支持高畫質拍攝。
  • 各版本間成本考量。

⚖️ 胖東來發聲明:警告多帳號擅自利用AI生成於東來聲音

胖東來商貿集團對多賬號未經授權使用AI生成於東來聲音的行徑表示警告,將透過法律手段維護合法權益。

  • 未授權生成與剪輯。
  • 侵犯版權與製造假信息。
  • 要求停止侵權行為。

🌐 2028年全球生成式AI芯片市場預計將達862.4億美元

報告預測全球生成式AI芯片市場將快速增長,至2028年達到862.4億美元規模,反映對計算能力和雲計算需求的提升。

  • 預計增長率27.9%。
  • 計算能力需求增加。
  • 新一代芯片推動創新。

以上是今日重要的科技進展,顯示出科技領域在AI、量子計算及數位媒體的突破將深刻影響我們的未來。

參考連結