今天沒什麼新聞 - 2024.11.18

發布日期：2024-11-19T00:00:00.000-05:00

以下是一些近期的科技新聞和創新進展，覆蓋各大領域的最新突破與技術應用。

✨LLaVA-o1：能推理的視覺多模態模型

LLaVA-o1是一款新推出的視覺多模態模型，能自主多階段推理，且不依賴思維鏈提示。該模型擁有11B的參數，推理能力超越了Gemini-1.5-pro、GPT-4o-mini和Llama-3.2-90B-Vision-Instruct等模型。這一創新標誌著多模態AI領域的重大進展，為未來的研究帶來了重要啟示。

🛠️In-Context LoRA：一系列好玩的工作流

In-Context LoRA是一款適用於Flux模型的新工具。它可以實現AI換衣、logo遷移、商品效果圖、四格漫畫等各種效果，豐富了AI應用場景。Github中提供了各種效果的ComfyUI工作流，供開發者參考和使用。

🚀Qwen2.5-Turbo支持100萬上下文

阿里雲發布的Qwen2.5-Turbo，在上下文處理能力和推理速度上都取得了革命性的突破。其上下文長度達到100萬Token，是目前僅次於Gemini（200萬）的長上下文模型。此外，其推理速度提升了4.3倍，展現了在多個領域的應用潛力。

💻GUI智能體的黎明：Claude 3.5 Computer Use的案例研究

這篇研究論文對Claude 3.5的實際應用能力進行了探索和評估，通過精心設計的多領域、多軟件任務，展示了其在GUI智能體應用中的潛力。相關案例已在Github上公開，供開發者們參考。

🌟Mistral推最強開源多模態模型 Pixtral Large，升級Le Chat可直接調用Flux Pro

Mistral AI 推出的 Pixtral Large 模型和升級後的 Le Chat 助手功能，為用戶增加了網絡搜索能力，並通過新畫布界面提升了文檔編寫與代碼編輯的效率。Pixtral Large在多個視覺任務中的表現超越了許多競爭對手，充分展示了其強大的潛力。

🗨️ElevenLabs全新功能上線，支持打造個性化對話式AI智能體了

ElevenLabs 的新功能允許用戶根據需求定制個性化的對話式AI智能體，包括加入知識庫和集成自定義大型語言模型。這一靈活的平台提升了用戶體驗，也為ElevenLabs在競爭中提供了獨特優勢。

🔄AnyChat:一鍵切換多種 AI 模型，ChatGPT、Claude、Gemini隨便挑

AnyChat 是一款創新平台，允許開發者輕松在多種大型語言模型之間切換，降低API費用並提高工作效率。這一平台的推出迎合了AI行業快速發展的潮流，具有廣闊的市場前景。

🤖Fireworks AI推出復合式AI模型f1:超越GPT-4的新一代推理系統

Fireworks AI 推出的 f1 模型，通過復合推理架構整合多個開源模型，顯著提升了複雜編程和數學推理能力，標誌著AI推理系統的又一項進步。f1 推理系統為開發者提供了強大的工具，新體驗正在開放早鳥申請。

🛍️AI 搜索引擎 Perplexity 新增一鍵購物功能

Perplexity推出的購物功能，通過AI產品推薦和一鍵結帳服務，優化了用戶的在線購物體驗。其"Snap to Shop"功能則進一步增強購物便捷性，革新了商品搜索方式。

💊英偉達開源AI製藥框架引爆生物醫藥領域，200+機構競相採用

英偉達的BioNeMo框架推動了AI輔助藥物研發的發展，將藥物研發效率顯著提升。BioNeMo平台的推出，進一步簡化了AI藥物研發流程，吸引了200多家機構的採用，展現出巨大的應用潛力。

🐾物理學家發明貓咪運動方程:用數學解密喵星人行為模式

研究者Anxo Biasi通過物理學分析，提出了描述貓咪典型行為模式的運動方程，揭示了人類對貓行為的影響，並為物理學教學提供了新素材，其研究不僅有趣且具有教育意義。

📷Cooraft:AI相機黑科技，手機秒變專業工作室

Cooraft推出的AI相機應用，通過突破性的AI圖像轉換技術，讓用戶能夠輕松創作專業級的攝影作品。它打破了傳統攝影的界限，降低了創作門檻，使得高質量的作品創作得以普及。

參考連結

引用來源