在今日的科技動態中,我們將探討數位媒體、AI技術及量子計算的新進展。以下是各項技術的新突破及其影響。
OmniControl是一種圖片生成技術,允許用戶提供素材圖,並將這些素材融入生成的圖片中。技術目前的融合效果尚可,整體圖片質量還有待提升。用戶可通過以下連結線上體驗或查看GitHub專案連結:
基於Transformer和擴散模型,Edify 3D提供快速的3D模型生成服務。其模型生成速度快,並且支持4K分辨率貼圖及場景編輯,為用戶提供高品質的3D資產。了解更多:[NVIDIA Deep Imagination Research Homepage](https://research.nvidia.com/labs/dir/edify-3d/)
谷歌的量子計算項目AlphaQubit實現了基於Transformer的循環神經網絡,其性能已超越其他最先進的解碼器,為量子計算領域的發展提供新思維。參考論文:[www.nature.com](https://www.nature.com/articles/s41586-024-08148-8)
可靈 AI 平台近期升級至1.5版本,新增功能包括加強的高品質視頻生成與快速生成720p視頻的標準模式。更新後的人臉模型功能針對高級會員開放,支持快速生成視頻內容,提升創作效率。
Runway 推出“Expand Video”功能,用戶可以通過文本提示添加視覺內容並調整視頻。其動態效果支持創造快速變焦和拉遠鏡頭,提升視頻體驗,標誌著視頻生成技術的又一進步。
Mate70系列即將發表,將搭載AI隔空傳送和魔法手勢操作功能,用戶可透過簡單手勢操作提升效率,並首次搭載原生鴻蒙系統。
Lightricks推出的LTX Video是開源的視頻生成模型,能以20億參數構建高效的視頻生成過程,與ComfyUI連接無縫,促進創意產業的發展。
EchoMimicV2可透過輸入一張圖片、一段音頻和手勢視頻來生成高品質半身動畫,其創新性是引入了音頻-姿態動態和諧化策略提升細節。
JoyVASA 是音頻驅動的動畫技術,提升了嘴形同步和視頻質量。其獨創的兩階段設計支持更長動畫視頻的生成,並支持多語言數據。
PicMenu是一款透過AI技術將傳統菜單數位化的工具。只需拍照即可生成完整高質量的菜單展示,有效促進餐飲業的數位轉型。
NVIDIA的Edify3D技術結合了多視角擴散模型和Transformer技術,可以在兩分鐘內生成4K分辨率的3D模型,適宜多樣行業應用。
小米宣布將智能家庭屏系列進行大模型升級,新增問答和對話功能,提升設備交互能力,涵蓋六款設備並支持更廣泛的應用。
小米揭示REDMI K80系列攝影能力的提升,Xiaomi AISP2.0融合多種大模型技術,提供卓越的影像處理能力。
胖東來商貿集團對多賬號未經授權使用AI生成於東來聲音的行徑表示警告,將透過法律手段維護合法權益。
報告預測全球生成式AI芯片市場將快速增長,至2028年達到862.4億美元規模,反映對計算能力和雲計算需求的提升。
以上是今日重要的科技進展,顯示出科技領域在AI、量子計算及數位媒體的突破將深刻影響我們的未來。