2024 年 12 月 3 日 AI 新闻更新

發布日期：2024-12-03

#AI #科技新聞 #創新科技

本期 AI 新闻聚焦于多家公司发布的最新 AI 模型及技術創新，這些進展推動了 AI 在圖像生成、視頻創建和語音技術等多個領域的應用。

🌐 腾讯開源混元視頻模型

腾讯于今日宣布推出其混元視頻生成模型，配備了 130 億參數，為當前最大規模的開源视频生成引擎之一。即便在 A100 GPU 上生成 5 秒的視頻，也需要超過 20 分鐘的時間，但是生成效果出色。用戶可以通過元寶 APP 申請試用該模型，適用於廣告和創意視頻等多個商業應用場景。此模型的開源推動了 AI 视频生成技术的民主化，降低技术门槛，鼓励创意与开发者的创新。

🔎 Luma 發布文生圖模型：Luma Photon

Luma Labs 發布了全新圖像生成模型 Luma Photon 和其衍生版本 Photon Flash，此次革命性技術在速度和成本上具有顯著優勢。Luma Photon 能夠以顯著低於市場平均的成本生成高質量圖像，可廣泛應用於广告、影视及艺术创作等领域。该模型在多项测试中表现出色，并支持多轮自然语言指令，允许用户不断优化生成效果，在质量和创意上表现突出，适合复杂的创意任务。

🖌 即夢 2.1 支持寫中文

字节跳动旗下的即夢 AI 推出了圖片 2.1 模型，解决了 AI 图像生成中文字体的问题。这项创新令用户能够仅输入文字描述，便快速生成个性化海报，极大提升了设计效率。该模型在广泛的应用场景中，包含海报制作、书籍封面设计和社交媒体配图等，都展现出强大的适应能力。

🖼 World Labs 發布圖片生成 3D 世界模型

李飞飞带领的 World Labs 推出了可以从图片生成 3D 世界的模型，这标志着 AIGC 进入全新时代。用户可以通过提供一张图片或一句话，创造灵活的互动 3D 场景，此场景不仅能精细地复刻细节，还可模拟多种相机效果，为用户提供导演般的控制感。

🎥 階躍星辰视频生成大模型 Step-Video 開啟內測

階躍星辰的 Step-Video 模型現已開啟內測階段，允許文本生成分辨率高達 1080P 的視頻，最长可达 10 秒钟。該模型在自動優化提示詞、美學風格、運動控制上表現出色，尤其對中國風題材的理解和生成尤為精確。

🎬 可靈 AI 導演共創計劃作品即將上線

快手科技宣布將於 12 月 6 日推出中國首個 AIGC 導演共創計劃“可靈 AI 導演共創計劃”，與 9 位知名導演聯合，涵蓋多元題材。所有短片將由可靈 AI 視頻生成技術完成，標誌著 AI 技術在影视创作中的广泛应用。

📚 秘塔 AI 搜索功能升級

上海秘塔网络科技有限公司大幅度升級了其 AI 学术搜索功能，数据量增加了 7 倍，并新增“解釋”功能，帮助用户更好地理解文献中的复杂内容，这将显著提升用户的研究效率。

🕹 李飛飛創業首秀：交互式 3D 世界生成

李飛飛的最新創業項目 World Labs，利用 3D 生成技术仅通过一张图片或一句话，便可创造出互动的 3D 场景，开启 AIGC 交互设计的新篇章。

🔊 Hume AI 推出个性化语音生成功能

Hume AI 推出了“语音控制”功能，用户可通过滑块调整声音特征，创造个性化的 AI 声音，且无需编程技能。这一功能支持多维度的声音调整，以满足多样化的应用需求。

🔍 Cohere 推出 Rerank3.5 搜索模型

Cohere 推出的 Rerank3.5 数据检索模型支持超过 100 种语言的精准查询，尤其实在金融服务领域表现优越，有效地帮助企业节省了搜索时间与成本。

📰 OpenAI CFO 回應广告傳闻

OpenAI CFO Sarah Friar 表示公司目前没有计划引入广告模式，但未来可能会探索其他收入来源。现有商业模式為 OpenAI 的快速增长带来发展机遇。

🚫 神秘詞“David Mayer”引起 ChatGPT 故障

近日，ChatGPT 提到“David Mayer”时系统会立刻崩溃引发热議。有猜测称，可能涉及法律问题，如 GDPR 的被遗忘权，以及导致其他潜在故障的名称。

🗣 WPS Office 推出 AI 语音速记功能

WPS Office 引入了一项 AI 语音速记功能，支持实时录音到文字转换，内含多语种翻译和准确的声纹识别，与 WPS 云文档完美结合。这项功能的发布提升了用户的协作和文档处理效率。

本期 AI 新闻展现了AI技术在不同领域的突破与创新，反映出企业在人工智能应用上的进步与多样化的策略，突出其在图像、视频、语音等领域的影响力。

參考連結

引用來源