
在实际创作中,AI常常把“夜城追逐”这类宽泛指令误读为灯光昏暗、人物模糊的通用画面,导致一次出图率徘徊在三成左右。细究原因,往往是提示词缺乏层次、信息密度不足,或者关键属性被冗余修饰掩埋。
把这三层信息依次排列,AI的注意力会被自然分配到构图、角色、氛围三大要素上,生成的图像往往一次性满足预期,出图率从30%提升至80%以上。
关键词的挑选要兼顾“浓度”和“可辨识度”。动词后直接接形容词或颜色,省去“非常”“极其”等软词;名词前加入限定词而非长句解释。例如把“一个穿着破旧皮夹克的少年在雨中奔跑,表情显得非常焦虑”压缩为“雨中破旧皮夹克少年疾跑,焦虑表情”。这种“动+形+名”的模式让模型在一次采样中捕获全部核心信息。
原始提示:“两个人在黑暗中打斗,光线很暗,动作不清晰”。AI输出的画面几乎全黑,人物轮廓消失。经过结构化改写后:
“灯塔废墟,暮光下,两名持炽热长剑的战士激烈交锋,剑锋迸射金红光芒,尘埃飞舞,紧张的呼吸可见”。同一模型在一次渲染里即呈现出光影层次分明、剑光闪耀的画面,出图率从30%跃升至90%。
“把提示词拆成‘场景·动作·氛围’,我只用了半小时就完成了原本需要三次迭代的分镜。”——一线漫画师
于是,画面不再是遥不可及的幻影。
参与讨论
暂无评论,快来发表你的观点吧!