11月12日AI資訊

以下是有關AI最新進展和技術發布的資訊。此列表涵蓋了從模型發布、語音生成技術到公司的戰略布局等多個方面。

✨2024.11.12-Qwen2.5-Coder系列發布

阿里巴巴宣布開源Qwen2.5-Coder系列模型,包括四種不同規模的模型:0.5B、3B、14B、和32B。其中,32B模型的性能可與GPT-4o媲美,並且可以在Cursor中使用。與此同時,阿里還發布了Artifacts空間,這類似於Claude所提供的功能,能夠生成網頁預覽。

模型訪問:Hugging Face

Artifacts空間:Hugging Face

📷Flux版本IPAdapter發布

Shakker平台推出了免費可用次數的Flux版本IPAdapter。此模型旨在通過增強圖像處理來改善AI生成內容的效果。

在線使用地址:Shakker Generator

模型詳情:Hugging Face

🎙️PlayDialog:語音生成模型

PlayDialog為一種語音生成模型,能夠生成對話式的播客音頻,類似於谷歌的NotebookLM。此模型支持對語音的調控,如語調、情感和語速。PlayNote也同步推出,允許上傳文件生成播客、簡介、和故事。目前不支持中文。

在線使用:PlayAI

🔎阿里海外推出全球首個B2B領域AI搜索引擎Accio

阿里巴巴推出了首個B2B領域的AI搜索引擎Accio,提升了國際站的轉化率20%到30%。Accio已經覆蓋億級商品,支持5種語言,並擁有PC和WAP端的產品。

詳情鏈接:Accio

🎨百度AI創作產品“自由畫布”已正式面向公眾開啟測試預約

“自由畫布”是由百度在文心多模態大模型支持下推出的創作平台。用戶可以創作、編輯、存儲和管理多格式、全模態內容,為內容的生產和消費提供一站式服務。

詳情鏈接:百度自由畫布

🚀Anthropic即將推出 Claude3.5Opus,AI 競爭再升級

Anthropic的CEO宣布公司的新一代人工智能模型Claude3.5Opus即將發布。該模型將進一步超越現有AI技術,重塑能力曲線,並引發AI競爭的激烈態勢。

🎬生數科技視頻生成模型Vidu1.5版發布

生數科技發布了視頻生成模型Vidu1.5,解決了多主體一致性的問題。這一突破性成果將助力通用人工智能(AGI)的發展,大幅提升視覺模型的生成效率和一致性。

體驗地址:Vidu Studio

👓小米計畫推出新一代AI眼鏡

小米公司將在2025年第二季度推出新款AI眼鏡,與歌爾公司合作製造,預計出貨量超30萬台。AI眼鏡市場競爭加劇,百度也推出了小度AI眼鏡。

🔄技術大佬歸來! Greg重返OpenAI

Greg Brockman重返OpenAI,為公司的技術創新帶來新的動力。在高管頻繁離職的背景下,Greg的回歸是重振公司的關鍵時刻。他的參與預計會帶來更多的技術突破。

👨‍💻百度文心智能體平台已吸引80萬名開發者入駐

百度的文心智能體平台推出了五大商業組件功能,支持智能體的商業化進程,並顯著增加了開發者的收入轉化和總分發量。

👗剁手黨狂喜! AI試衣技術Fashion-VDM顛覆傳統

Fashion-VDM技術通過視頻擴散模型實現動態試穿衣服,為網購者提供逼真的試衣體驗,並突破傳統虛擬試衣軟件的限制,帶來革命性改變。

詳情鏈接:Fashion-VDM

📡對標谷歌NotebookLM! PlayDialog生成對話播客、旁白

PlayDialog作為新一代的語音模型,能夠生成對話和旁白。通過數億次真實對話的訓練,該模型能自如地調控語音生成,讓互動更為自然和人性化。

詳情鏈接:PlayNote

🤖微軟推出人格模擬AI工具TinyTroupe

微軟推出了基於大型語言模型(LLM)的AI工具TinyTroupe,用於人格模擬。此工具支持商業決策與市場研究等多種應用,並積極徵求社區反饋以優化產品。

詳情鏈接:GitHub

🖥️蘋果即將推出壁掛式 AI 平板設備

蘋果預計在明年3月推出一款壁掛式AI平板設備,將成為家庭智能控制中心,支持Siri和視頻通話功能。該設備的發布代表蘋果在智能家居領域的積極進取,迎接來自主流公司的市場挑戰。

🎶YouTube試水AI音樂重混功能

YouTube推出了“Dream Track”AI音樂重混功能,允許創作者利用AI重塑授權歌曲的風格,並為短視頻提供新的音樂表現。

詳情鏈接:YouTube AI

以上是當前AI技術的若干重要發展,隨著技術的不斷進步,各大公司紛紛推出多樣化的產品和服務,使得AI在不同領域的應用愈加廣泛。