prompt + 可选 metadataimagemetadata.first_frame_image + metadata.last_frame_imagemetadata.reference_images,必要时可继续叠加 reference_videos / reference_audiosmodel 与 prompt 必填image、首尾帧、reference_* 三类场景互斥first_frame_image 与 last_frame_image 必须成对出现metadata 可以省略;顶层 duration 会被归一化到 metadata.durationproxy_meta,不直接返回上游任务结果asset://<asset_id>。