了解AI领域最新动态、教程和深度分析
Kling AI发布2.6版本,新增原生音频生成功能,支持中英双语对白、歌唱与音效同步输出,实现文本到视频的完整创作流程,标志着AI视频进入有声时代。
可灵AI公司宣布其O1视频大模型已全量上线,采用统一多模态架构,支持文字、图像等多种输入方式,实现一句话生成视频。
北京发布《人工智能产业白皮书(2025)》,预计核心产值超4500亿元。白皮书详细介绍了2025年中国人工智能大会在京召开情况,以及北京市科委发布的相关规划,聚焦AI技术趋势与创新应用,为开发者提供洞见。
智谱AI发布清影2.0,支持文本生成1080P高清视频,并集成CogSound模型自动添加音效,实现视听一体创作。该产品被视为国产版“Sora”,为开发者提供创新AI应用工具。
阿里巴巴开源Z-Image图像模型,支持中英双语文字渲染,仅6B参数实现高效图像生成与编辑,视觉质量优秀。该模型由通义实验室开发,聚焦AI技术趋势,助力开发者洞悉创新应用。
【AI日报】摘要:FLUX.2系列开源发布,含dev版32B参数权重与代码,支持10图参考和4MP编辑功能。开发者可通过此工具探索图像生成与编辑技术。详情点击:https://app.aibase.com/zh
腾讯混元开源10亿参数OCR模型HunyuanOCR,基于多模态架构,在多项任务中实现领先性能,支持多场景文字识别应用。
OpenAI宣布停止GPT-4o模型的API访问,开发者需尽快迁移。该模型仍可供个人用户使用,但不再是默认模型。建议开发者关注替代方案。
腾讯元宝推出新功能,用户仅需一句话或一张图片即可生成视频。该功能基于腾讯混元团队最新开源的HunyuanVideo1.5模型,简化了视频创作流程,助力开发者洞悉AI技术趋势。
火山引擎在Gartner《AI应用开发平台魔力象限》中,凭借豆包大模型和火山方舟平台,位列中国区“落地能力”榜首,全球排名第五,展示其AI技术实力。