11月12日AI資訊

以下是有關AI最新進展和技術發布的資訊。此列表涵蓋了從模型發布、語音生成技術到公司的戰略布局等多個方面。

✨2024.11.12-Qwen2.5-Coder系列發布

阿里巴巴宣布開源Qwen2.5-Coder系列模型，包括四種不同規模的模型：0.5B、3B、14B、和32B。其中，32B模型的性能可與GPT-4o媲美，並且可以在Cursor中使用。與此同時，阿里還發布了Artifacts空間，這類似於Claude所提供的功能，能夠生成網頁預覽。

模型訪問：Hugging Face

Artifacts空間：Hugging Face

Shakker平台推出了免費可用次數的Flux版本IPAdapter。此模型旨在通過增強圖像處理來改善AI生成內容的效果。

在線使用地址：Shakker Generator

模型詳情：Hugging Face

PlayDialog為一種語音生成模型，能夠生成對話式的播客音頻，類似於谷歌的NotebookLM。此模型支持對語音的調控，如語調、情感和語速。PlayNote也同步推出，允許上傳文件生成播客、簡介、和故事。目前不支持中文。

在線使用：PlayAI

阿里巴巴推出了首個B2B領域的AI搜索引擎Accio，提升了國際站的轉化率20%到30%。Accio已經覆蓋億級商品，支持5種語言，並擁有PC和WAP端的產品。

詳情鏈接：Accio

“自由畫布”是由百度在文心多模態大模型支持下推出的創作平台。用戶可以創作、編輯、存儲和管理多格式、全模態內容，為內容的生產和消費提供一站式服務。

Anthropic的CEO宣布公司的新一代人工智能模型Claude3.5Opus即將發布。該模型將進一步超越現有AI技術，重塑能力曲線，並引發AI競爭的激烈態勢。

生數科技發布了視頻生成模型Vidu1.5，解決了多主體一致性的問題。這一突破性成果將助力通用人工智能（AGI）的發展，大幅提升視覺模型的生成效率和一致性。

體驗地址：Vidu Studio

小米公司將在2025年第二季度推出新款AI眼鏡，與歌爾公司合作製造，預計出貨量超30萬台。AI眼鏡市場競爭加劇，百度也推出了小度AI眼鏡。

Greg Brockman重返OpenAI，為公司的技術創新帶來新的動力。在高管頻繁離職的背景下，Greg的回歸是重振公司的關鍵時刻。他的參與預計會帶來更多的技術突破。

百度的文心智能體平台推出了五大商業組件功能，支持智能體的商業化進程，並顯著增加了開發者的收入轉化和總分發量。

Fashion-VDM技術通過視頻擴散模型實現動態試穿衣服，為網購者提供逼真的試衣體驗，並突破傳統虛擬試衣軟件的限制，帶來革命性改變。

詳情鏈接：Fashion-VDM

PlayDialog作為新一代的語音模型，能夠生成對話和旁白。通過數億次真實對話的訓練，該模型能自如地調控語音生成，讓互動更為自然和人性化。

詳情鏈接：PlayNote

微軟推出了基於大型語言模型（LLM）的AI工具TinyTroupe，用於人格模擬。此工具支持商業決策與市場研究等多種應用，並積極徵求社區反饋以優化產品。

詳情鏈接：GitHub

蘋果預計在明年3月推出一款壁掛式AI平板設備，將成為家庭智能控制中心，支持Siri和視頻通話功能。該設備的發布代表蘋果在智能家居領域的積極進取，迎接來自主流公司的市場挑戰。

YouTube推出了“Dream Track”AI音樂重混功能，允許創作者利用AI重塑授權歌曲的風格，並為短視頻提供新的音樂表現。

詳情鏈接：YouTube AI

以上是當前AI技術的若干重要發展，隨著技術的不斷進步，各大公司紛紛推出多樣化的產品和服務，使得AI在不同領域的應用愈加廣泛。