2024.12.25-QVQ-72B-Preview:Qwen視覺推理模型

#AI #視覺推理 #Qwen模型

QVQ-72B是基於Qwen2-VL-72B訓練的全新視覺推理模型,具備處理圖像與視頻自編碼任務的能力。以下文章介紹了QVQ-72B的特點及其潛在應用場景,並涵蓋AI行業的其他最新動態。

✨QVQ-72B:Qwen視覺推理模型

QVQ-72B是基於Qwen2-VL-72B訓練的全新視覺推理模型,具備處理圖像與視頻自編碼任務的能力。在性能評估中,其部分得分甚至可能超過OpenAI o1。不過需注意,目前的評分可信度較低,僅供參考。模型採用高保真視頻編碼技術,大幅提升了重建質量,尤其在細節保留和時序穩定性方面有顯著提高。未來應用場景包括視頻生成、圖像處理等多個領域。

特色亮點:

  • 高保真視頻編碼:提升重建質量和細節保持能力。
  • 多模態處理:可同時支持圖像與視頻任務。
  • 跨領域適用:可用於多種生成模型。

🚗理想汽車的全新AI大模型APP“理想同學”

理想汽車即將推出“理想同學”AI大模型APP,該應用將於12月27日正式上線,旨在將理想汽車的智能體驗延展至手機,成為全能生活助手。此APP具備強大的物體識別和自然語言處理能力,能為用戶提供高效便利的日常解決方案。

🌟Deepseek V3正式開源

Deepseek團隊發布了V3版本,展現出強大的多語言編程能力,性能超越Claude 3.5 Sonnet V2。在aider多語言編程測評中,成功率從17%大幅提升至48%,成為業界導航式應用的標杆之一。

從QVQ-72B到Deepseek V3,AI領域正以跨越式的速度前進,覆蓋範圍從視覺推理到多語言編程模式與實用AI應用,開啟無限未來場景的可能性。