今日科技動態（2024年11月25日）

發布日期：2024年11月25日

#科技

在今日的科技動態中，我們將探討數位媒體、AI技術及量子計算的新進展。以下是各項技術的新突破及其影響。

🖼️ OmniControl：物品驅動的圖片生成

OmniControl是一種圖片生成技術，允許用戶提供素材圖，並將這些素材融入生成的圖片中。技術目前的融合效果尚可，整體圖片質量還有待提升。用戶可通過以下連結線上體驗或查看GitHub專案連結：

在線體驗：[huggingface.co](https://huggingface.co/spaces/Yuanshi/OminiControl)
GitHub：[OminiControl](https://github.com/Yuanshi9815/OminiControl)

🔲 Edify 3D：文字生成3D模型

基於Transformer和擴散模型，Edify 3D提供快速的3D模型生成服務。其模型生成速度快，並且支持4K分辨率貼圖及場景編輯，為用戶提供高品質的3D資產。了解更多：[NVIDIA Deep Imagination Research Homepage](https://research.nvidia.com/labs/dir/edify-3d/)

🔑 AlphaQubit：基於Transformer的量子糾錯系統

谷歌的量子計算項目AlphaQubit實現了基於Transformer的循環神經網絡，其性能已超越其他最先進的解碼器，為量子計算領域的發展提供新思維。參考論文：[www.nature.com](https://www.nature.com/articles/s41586-024-08148-8)

📈 可靈AI平台1.5模型升級：上線人臉模型功能增加「標準模式」

可靈 AI 平台近期升級至1.5版本，新增功能包括加強的高品質視頻生成與快速生成720p視頻的標準模式。更新後的人臉模型功能針對高級會員開放，支持快速生成視頻內容，提升創作效率。

🎨 增強模式：精細化控制運動軌跡與靜止區域。
⚡ 標準模式：快速生成720p視頻，創作時間縮短。
👤 人臉模型：解決人臉ID問題，支持隨時調用。

🎬 Runway新增視頻擴展畫面功能“Expand Video”

Runway 推出“Expand Video”功能，用戶可以通過文本提示添加視覺內容並調整視頻。其動態效果支持創造快速變焦和拉遠鏡頭，提升視頻體驗，標誌著視頻生成技術的又一進步。

🎥 文字提示擴展內容：創造更生動的視頻效果。
⚙️ 動態效果：快速變焦和拉遠鏡頭。
🚀 加快生成速度：滿足快速創作需求。

📱 華為Mate70系列將支持AI隔空傳送余承东親自演示

Mate70系列即將發表，將搭載AI隔空傳送和魔法手勢操作功能，用戶可透過簡單手勢操作提升效率，並首次搭載原生鴻蒙系統。

🤖 AI隔空傳送：手勢操作便利性。
✋ 魔法手勢：增加操作靈活性。
🌐 原生鴻蒙系統：推動操作系統進步。

🚀 Lightricks開源實時視頻生成模型LTX-Video 生成一個視頻只要4秒!

Lightricks推出的LTX Video是開源的視頻生成模型，能以20億參數構建高效的視頻生成過程，與ComfyUI連接無縫，促進創意產業的發展。

快速生成：4秒生成5秒影片。
高效運行：bfloat16精度優化內存。
與ComfyUI無縫集成：技術門檻低。

🖼️ EchoMimicV2:輸入圖片、音頻和手勢視頻即可生成“同款”數字人

EchoMimicV2可透過輸入一張圖片、一段音頻和手勢視頻來生成高品質半身動畫，其創新性是引入了音頻-姿態動態和諧化策略提升細節。

✨ 簡化控制條件。
🎨 提升動畫的細節與表現力。
📊 新基準評估優於目前技術。

🎶 音頻驅動生成面部視頻技術JoyVASA

JoyVASA 是音頻驅動的動畫技術，提升了嘴形同步和視頻質量。其獨創的兩階段設計支持更長動畫視頻的生成，並支持多語言數據。

🎨 解耦面部表情與3D模型。
🔊 支持人物&動物動畫。
🌐 多語言支持。

📸 PicMenu:用AI將菜單可視化隨手一拍就能生成高品質菜單

PicMenu是一款透過AI技術將傳統菜單數位化的工具。只需拍照即可生成完整高質量的菜單展示，有效促進餐飲業的數位轉型。

拍照自動提取菜品信息。
多重AI技術確保高效準確。
開放源代碼支持定制部署。

🖨️ 英偉達發佈Edify3D生成模型2分鐘即可生成高質量3D資產

NVIDIA的Edify3D技術結合了多視角擴散模型和Transformer技術，可以在兩分鐘內生成4K分辨率的3D模型，適宜多樣行業應用。

高質量3D模型迅速生成。
精確網格結構與高分辨率紋理。
文本提示複雜3D場景支持。

📲 更聰明了!小米智能家庭屏系列產品推送大模型超級小愛

小米宣布將智能家庭屏系列進行大模型升級，新增問答和對話功能，提升設備交互能力，涵蓋六款設備並支持更廣泛的應用。

🔧 涵蓋多款設備。
📱 小米音箱App配套升級。
🌐 支持文本創作與實時搜索。

📷 REDMI K80Pro搭載Xiaomi AISP2.0影像算法:融合四大模型

小米揭示REDMI K80系列攝影能力的提升，Xiaomi AISP2.0融合多種大模型技術，提供卓越的影像處理能力。

配備高動態主攝與長焦鏡頭。
算法支持高畫質拍攝。
各版本間成本考量。

⚖️ 胖東來發聲明:警告多帳號擅自利用AI生成於東來聲音

胖東來商貿集團對多賬號未經授權使用AI生成於東來聲音的行徑表示警告，將透過法律手段維護合法權益。

未授權生成與剪輯。
侵犯版權與製造假信息。
要求停止侵權行為。

🌐 2028年全球生成式AI芯片市場預計將達862.4億美元

報告預測全球生成式AI芯片市場將快速增長，至2028年達到862.4億美元規模，反映對計算能力和雲計算需求的提升。

預計增長率27.9%。
計算能力需求增加。
新一代芯片推動創新。

以上是今日重要的科技進展，顯示出科技領域在AI、量子計算及數位媒體的突破將深刻影響我們的未來。

參考連結

引用來源