【AI日报】2024年12月16日

探索最新的人工智慧技術進展和應用,包括Meta的最新模型、微信的打擊宣傳,以及其他重大更新。

👗Leffa:Meta開源的AI試衣模型

Leffa是Meta發布的一款開源AI試衣模型,具備出色的效果,足以媲美可靈的AI換衣功能。該模型支持AI換衣和人物動作調整,為用戶提供在線體驗。以下是相關資源:

👁️Apollo:Meta開源的視覺理解模型

Apollo是Meta推出的視覺理解模型,能夠處理長達1小時的視頻,提供3B、5B、7B三個不同規模的版本,該模型在同類產品中表現突出。

🎞️Diffusion-Vas:追蹤並補全視頻中的目標

Diffusion-Vas通過追蹤視頻中指定目標,並利用擴散模型補全被遮擋的部分,如同應用于視頻的SAM 2技術。

📜微信:將打擊利用AI仿冒知名人士進行營銷宣傳行為

微信珊瑚安全發布公告,將嚴厲打擊利用AI仿冒知名人士進行營銷的行為。已處理532條違規內容並關閉209個賬號,展示出強大的治理能力。

🎨月之暗面Kimi視覺思考版上線

月之暗面的AI助手Kimi推出視覺思考版功能,基於k1模型打造,能智能識別圖片內容並提供反饋。用戶可以詢問關於圖片拍攝地點等問題,Kimi根據分析結果作出回答。

🔊階躍星辰Step-1o Audio千億參數端到端語音大模型上線

階躍星辰推出國內首個千億參數的Step-1o語音大模型,具備強大語音理解與生成能力。該模型理解複雜語義和情感信息,提供高品質建議,並將接入躍問App,拓展應用場景。

🎥Pika2.0發布:改進文本對齊功能

最新AI視頻生成工具Pika2.0,改進文本對齊和運動渲染功能,簡化用戶創建視頻內容的過程。此工具設計旨在滿足創作者及小型品牌的需求。

🗣️阿里通義實驗室CosyVoice升級2.0版

阿里巴巴CosyVoice語音模型升級至2.0,提升語音生成準確性和自然體驗。新系統降低合成延遲,加強方言和情感控制支持。

🤖張文宏被 AI “冒名” 帶貨

張文宏直播帶貨實為AI深度偽造,引發誤解。該事件說明公眾對AI技術的認知滯後,尤其老年人容易被誤導。提高技術防範及信息監測機制至關重要。

📊無問芯穹發布 Megrez-3B-Omni

無問芯穹推出全球首個端側全模態理解開源模型Megrez-3B-Omni,並獲得近5億元融資,規劃實現規模化盈利。

📚百度文庫APP推出「AI考研寶典」

百度文庫APP為考研學子提供AI考研寶典,包含AI拍圖寫作和智能問答功能,提高學習效率,幫助考生應對考研挑戰。

🌐馬斯克X平台Grok AI升級

xAI對Grok AI進行升級至Grok-2,性能提升三倍,增加準確性和語言支持。新版本可引用外部新聞來源信息,增強回答的可靠性。

🏫武漢大學成立人工智能學院

武漢大學成立人工智能學院,致力於多領域交叉創新。小米集團期待深化合作,共同推進AI技術發展。

🎧Nexa AI發布 OmniAudio-2.6B

Nexa AI推出的OmniAudio-2.6B音頻模型專為邊緣設備設計,處理速度快,資源效率高,適用於多種音頻任務。

🛠️OpenAI發布ChatGPT故障報告

OpenAI的ChatGPT遭遇故障,因遙測變更導致過載,工程師無法及時修復。但最終通過縮小集群規模增加資源恢復服務。

🛠️谷歌 Chrome 新增 AI 調試功能

谷歌Chrome瀏覽器F12開發者工具新增AI功能,提升網頁調試效率。開發者可向AI提問代碼相關問題,獲得實時解決方案。

全球AI技術持續創新與演進,這些過程不僅顯示了技術的潛力,同時也提醒我們要謹慎對待其可能引發的社會問題。