2025.5.9-HunyuanCustom：增强版本的混元视频

本文介紹了多項最新的AI技術和應用，包括一致性視頻生成工具、增強視角圖像生成API以及AI輔助工具等等，這些技術為用戶提供了更多創造性的空間和更高效率的數據處理能力。

🎥 音频同步与视频编辑!腾讯混元开源一致性视频生成工具HunyuanCustom

腾讯推出的HunyuanCustom是一款革命性的一致性視頻生成工具，能够通过单张图像生成生动的视频内容，并实现音频与口型的精准同步。该技术在深度伪造视频领域的进步，简化了视频制作流程，提升了用户的创作体验。HunyuanCustom不仅支持多种场景模拟，还具备视频到视频（V2V）编辑功能，支持智能替换视频内容，增强创意空间。然而，唯一的缺点是模型生成的视频质量不高。

🖼️ ZenCtrl：生成不同视角、不同场景的物品图

ZenCtrl提供了一种通过单一物品参考图片，将其放置到其他场景中并生成不同角度饮用的图片生成工具。用户能体验到多场景、不同视角的物品呈现，极大地丰富了创意表现。

🔧 OpenAI上线强化微调API

OpenAI 最近宣布推出强化微调API，允许用户微调o4-mini模型，以提升其在复杂领域中的能力。该API为使用思维链推理和特定任务评分的用户提供更好的性能支持。此外，OpenAI 自家的 ChatGPT 现亦可与 GitHub 集成，帮助开发人员进行深度研究。

🔍 ZeroSearch：提升LLM搜索能力的框架

阿里巴巴发布的ZeroSearch框架，通过模拟方法实现无需真实搜索引擎的数据检索能力。该技术利用半监督精调（SFT）把大语言模型（LLM）转换为高效的检索模块，并显著降低了AI训练的经济负担。

🚀 无需邀请码!扣子空间宣布开放测试

扣子空间（Coze Space）正式开放测试，用户无需邀请码即可登录使用。新功能包括用户研究、华泰A股观察及舆情分析等专家Agent，满足不同行业需求。平台的AI协作能力吸引了众多用户，开发团队表示将会持续优化服务。

💰 成本降低88%:阿里巴巴ZeroSearch技术颠覆AI训练模式

阿里巴巴推出的ZeroSearch技术通过模拟方法改变了AI系统的信息搜索训练方式，消除了对昂贵搜索引擎API的依赖。此技术大幅降低了AI训练成本，使高级AI研发的门槛显著降低。

🌐 OpenAI 推出 GitHub 连接器，ChatGPT 深度研究工具迎来新功能

OpenAI 最近宣布对其AI深度研究工具进行升级，新增GitHub连接器，实现了对代码库和工程文档的分析支持。此功能可显著提高编码效率，并且OpenAI亦增强了安全措施，限制特定功能的访问。

🤖 联想发布天禧个人超级智能体，将布局在各类终端设备

在创新科技大会上，联想推出天禧个人超级智能体，具备感知与交互、认知与决策、自主与演进三大核心功能。这项技术创新标志着混合式AI的突破，能够为用户提供个性化建议并执行日常任务。

📊 OpenAI 在亚洲推出数据驻留计划，助力本地企业合规

OpenAI 推出亚洲数据驻留计划，允许用户选择在中国、日本、印度、新加坡和韩国存储数据。这有助于企业遵循数据主权要求，是OpenAI全球扩展战略的重要一步。

🎮 Multiverse发布全球首款AI生成多人在线游戏，以超低成本改写游戏开发规则

EnigmaLabs AI团队推出的Multiverse，作为全球首款AI生成的多人在线游戏，以动态世界和低研发成本震撼业界，开创了新型游戏开发模式，推动了社区的技术创新。

📚 秘塔AI搜索上线“讲题”功能降低家长辅导门槛

秘塔AI公司推出了新功能“塔子老师讲题”，通过AI技术实现题目识别与解题步骤的可视化讲解，帮助家长在辅导孩子作业方面更有效地减轻负担。

📄 Genspark 推出“AI Sheets”电子表格AI工具，革新数据处理体验

Genspark推出的“AI Sheets”工具，通过AI简化数据处理过程，支持数据分析、信息检索及复杂公式替代，让用户能快速高效地实现专业级的数据分析。

⚙️ Google Gemini API迎来隐式缓存功能自动节省开发成本高达75%

Google在Gemini API中推出隐式缓存功能，通过识别和重用相似请求的内容，帮助开发者大幅降低开发成本，并简化了操作流程。

📹 PixVerse v4登陆Replicate，AI视频生成速度与质量再突破

PixVerse v4在Replicate平台推出，大幅提升了视频生成速度与质量，支持多种分辨率和创新功能，如音效同步和风格迁移，为用户提供了更丰富的创作工具。

🛡️ 快手祭出“内容净化器”KuaiMod!多模态AI专治各种劣质内容

快手发布的KuaiMod通过大模型对短视频内容进行质量判别，优化短视频平台的内容质量。KuaiMod利用强化学习策略，使模型能够实时更新和优化，确保用户获得更高质量的内容体验。

🧠 英伟达开源新一代OCR代码推理 AI 模型，超越 OpenAIo3-Mini表现

英伟达最新发布的OCR模型套装通过Nemotron架构及高质量的数据设计，在LiveCodeBench测试中击败了OpenAI的模型，标志着在代码推理领域的重要进步。

这篇文章概述了当前人工智能技术领域的多项重要进展，包括视频生成、数据处理、游戏开发等各方面的创新，这些技术的发展提供了高效的解决方案，推动了行业的革新。