Midjourney 于今天在 X 上发文,宣布旗下 AI 图片生成模型开启 V7 版本 alpha 测试,主要更新了「草图模式」。

以下是MidJourney V7草稿模式的核心功能与创新点总结:
一、草稿模式的核心升级
- 速度与成本突破
• 渲染速度提升10倍,成本仅为标准模式的50%(V6标准任务0.5倍),支持快速批量生成与迭代。
• 用户可通过--draft
参数触发该模式,或在网页端自动开启“对话式交互界面”,实时调整指令(如“将猫替换成猫头鹰”)。 - 语音交互创新
• 点击麦克风图标后,支持中文语音指令实时生成图像,例如描述“一只在宇宙花盆喝水的猫,糖果雨落下”即可生成对应草图。
• 语音模式尤其适合快速捕捉灵感,实测语音响应延迟低于1秒。 - 迭代逻辑优化
• 草稿生成后点击“增强”(Enhance)或“变体”(Vary),系统将用完整质量模型重新渲染,保持美学风格一致性。
• 官方定位为“史上最佳创意迭代工具”,适合广告设计、文旅宣传等需快速验证场景的行业。
二、技术细节与实测表现
- 图像质量对比
• 草稿图分辨率低于标准模式(如720P vs 4K),但纹理和结构连贯性已接近V6水平。
• 实测显示:草稿模式在材质细节(如羽毛、衣物纹理)和光影层次上表现优异,但氛围感稍弱于V6的戏剧化风格。 - 兼容性限制
• 当前放大(Upscale)、编辑(Edit)功能仍需调用V6模型,预计未来2个月内升级至V7架构。
• 中文文本生成仍存在乱码问题,需依赖第三方工具辅助。
通过草稿模式,MidJourney正在推动AI图像生成从“单次创作”向“动态协作”转型,为创意工作者提供了更接近人类思维流程的工具链。
