🔥阿里巴巴 · 2025年12月发布

用 Wan 2.6 生成精彩视频

阿里巴巴旗舰视频生成模型 — 智能多镜头叙事、角色参考生成、15秒1080P输出、原生音视频同步。

立即使用 Wan 2.6 创作 — 免费积分，无需信用卡

8 Credits

Reference Video mode: 1-3 videos, 2-30s each

你的视频将在这里显示

在左侧输入描述或上传图片，点击生成按钮开始创作

Wan 2.6 作品展示

Wan 2.6

Wan 2.6 全面评测

深度解析 Wan 2.6 的核心能力与实际表现

Wan 2.6 核心能力

三大突破性功能，让 AI 视频创作进入专业级别

角色参考生成（R2V）

上传包含角色外貌和声音的参考视频（2~30秒），Wan 2.6 精准提取角色的视觉特征和声线，在全新场景中保持高度一致。支持单人出演或双人同框，带同步音频、背景音乐和音效，无需重新拍摄。

✅ 保持角色外貌和声线一致
✅ 支持人物、动物、物品等任意对象
✅ 单人演出或双人同框均可
✅ 原生音视频同步输出

智能多镜头叙事

用自然语言描述你的故事，Wan 2.6 自动规划镜头结构 — 全景建立、特写反应、跟拍动作 — 在单次生成中输出多机位、有过场的完整叙事视频。角色、环境、光线在整个视频中全程保持一致。

✅ 自然语言描述，自动分镜
✅ 支持全景、特写、跟拍等多种机位
✅ 人物/环境/光线全程一致
✅ 单次生成，无需手动拼接

示例 Prompt

"一只海狸在公寓厨房里走动。它紧张地看向镜头说'我的坚果在哪里？'然后它在桌上发现了一盒坚果，高兴地叫道'找到了！'"

Wan 2.6 自动规划为：

→ 全景建立镜头：厨房

→ 中景：海狸紧张地张望

→ 特写反应镜头

→ 中景：发现坚果

→ 喜悦反应镜头

三种生成模式

Wan 2.6 提供三种专属生成模式，覆盖从文字创作到角色驱动的全流程需求。

⌘

T2V

文字生成视频

用自然语言描述任意场景，从电影感大景到产品演示。Wan 2.6 原生理解镜头运动、人物动作和多镜头指令。

🖼

I2V

图片生成视频

将任意静态图片生成动态视频，同时保留人物面部特征、服装细节和画面构图。适合肖像、产品图和插画的动态化。

👤

R2V

参考视频生成

上传参考视频来保持角色外貌和声线。在全新场景中生成同一人物、动物或物体主演的视频，音视频全程一致。

如何使用 Wan 2.6

选择输入方式

输入文字描述、上传图片，或提供参考视频。Wan 2.6 支持三种输入模式，按需选择。

选择 Wan 2.6

选择 Wan 2.6 模型，调整分辨率（720p 或 1080p）、画幅比例和时长（5~15秒），适配你的发布平台。

生成并下载

1080P 视频含原生音频即刻生成完成，下载全质量无水印文件，随时可以发布。

Wan 2.6 vs Sora 2

对比项目	Wan 2.6	Sora 2
发布时间	Dec 2025	Sep 2025
最长时长	15s	15–25s (Pro)
角色参考生成	✅ 视频上传（R2V）	✅ Cameo
多镜头叙事	✅ 原生支持	⚡ 有限
原生音视频同步	✅ 音素级唇形同步	✅ 支持
分辨率	1080p / 24fps	1080p
开源	✅ Apache 2.0 开源	❌ 闭源
每次积分消耗	25 积分	3 积分

两个模型在 AiVidMaker 上均可使用，无需切换工具。

谁适合使用 Wan 2.6？

从短剧创作者到企业营销团队，Wan 2.6 覆盖专业级视频创作的全场景需求

🎬

短剧与故事创作者

Wan 2.6 的多镜头叙事和 R2V 模式让你一个人完成整集短剧制作，无需团队和重拍。上传一次角色参考视频，即可在整集中保持角色一致，对白同步、声线自然。

📦

电商与产品营销团队

将产品图片转化为15秒带原生音频旁白的视频广告。Wan 2.6 的图片生成视频模式完整保留产品细节——纹理、标签、颜色——同时添加自然动态。一张产品图，几分钟内生成多个广告版本。

📱

社交媒体内容创作者

无需拍摄即可生成适合抖音、Instagram Reels 和 YouTube Shorts 的原生格式视频。Wan 2.6 生成最长15秒的9:16竖版视频，内置音频，直接发布。多镜头功能生成的内容比普通 AI 工具的单镜头循环更有吸引力。

🏢

品牌与创意代理商

通过 R2V 在整个营销活动中保持品牌角色一致性。上传一次品牌吉祥物或代言人，批量生成不同场景、对白和背景的视频。Wan 2.6 基于 Apache 2.0 开源协议，也适合企业本地化部署，无需按视频付费。

🎓

教育工作者与课程创作者

将文字课程内容转化为生动的视频教学模块。用自然语言描述教学场景，Wan 2.6 自动规划视觉结构：概览镜头、细节放大、演示、总结。无需视频编辑技能，即可制作专业教学内容。

🎮

独立影人与拍摄预览

在实拍前用 Wan 2.6 进行拍摄预演。从剧本生成多镜头分镜视频，测试机位、节奏和角色走位，在正式制作前完成所有验证。1080P 24fps 输出适合用于提案材料和融资演示。

常见问题

什么是 Wan 2.6？+

Wan 2.6 是阿里巴巴推出的最新 AI 视频生成模型，支持文字、图片和参考视频输入，可生成最长15秒的1080P高清视频，在智能多镜头叙事、角色参考生成和原生音视频同步方面表现尤为出色。

Wan 2.6 免费吗？+

在 AiVidMaker 上，新用户注册即送免费积分，可以免费体验 Wan 2.6，无需信用卡。付费套餐起价 $9.90/月。

Wan 2.6 最长可以生成多长的视频？+

Wan 2.6 单次生成最长15秒视频，支持1080P分辨率、24fps，是目前主流 AI 视频模型中时长最长的之一。

什么是 Reference to Video（R2V）功能？+

R2V 是 Wan 2.6 的角色参考生成功能。上传一段包含角色外貌和声音的参考视频，AI 会精准提取角色特征，在全新场景中保持角色形象和声音一致性，支持单人或多人同框。

什么是智能多镜头叙事？+

智能多镜头叙事是 Wan 2.6 的核心功能，只需用自然语言描述故事，模型会自动规划镜头切换（全景、特写、跟拍），在单次生成中输出多机位、有过场的完整叙事视频，无需手动分镜。

Wan 2.6 支持原生音频吗？+

支持。Wan 2.6 采用原生音视频协同生成架构，支持音素级唇形同步、多人对话、背景音乐和音效同步生成，无需外部配音工具，音画天然对齐。

Wan 2.6 和 Sora 2 哪个更好？+

各有侧重。Wan 2.6 在角色参考生成（R2V）、原生音视频同步和多镜头叙事方面更出色，且开源可本地部署。Sora 2 在物理真实感和单镜头画面质量上更突出。两者在 AiVidMaker 上均可使用。

Wan 2.6 的积分消耗是多少？+

在 AiVidMaker 上，Wan 2.6 每次生成消耗25积分。新用户注册赠送免费积分，付费套餐起价 $9.90/月。

立即开始使用 Wan 2.6

注册即送免费积分，无需信用卡。

免费试用 Wan 2.6