这篇文章是在4,5月份写成的,主要依据 Midjourney 官方文档翻译、整合、简化而来,主要包括了注册上手 Midjourney,各种指令和参数的列表及简要解释等。希望通过这样一份精简过的中文文档,能够帮助自己和读者更容易地学习 Midjourney,也可以在使用过程中随时参考。
基础配置
注册
提示:midjourney需配合discord使用,目前需要特殊上网途径。
- 进入Discord注册页面创建discord账号并登录。如有账号,可直接登录。
2. 进入Midjourney官方网站,点击右下角“Join the Beta”按钮,进入Midjourney的Discord服务器(server)。 开始使用 通过向Discord中的Midjourney机器人对话来进行图片生成。你可以直接在Midjourney官方服务器(server)中进行生成,也可以将midjourney机器人邀请到其他服务器进行生成。
- 方式1:在Midjourney官方服务器中,选择带有“newbies”字样的频道进行对话生成。
- 方式2:将Midjourney机器人邀请到其他服务器使用。
对于个人用户,以下为建议的操作:
- a. 点击midjourney界面最左侧的“+”,创建服务器。
- b. 依次选择“亲自创建”、“仅供我和我的朋友使用”,设定头像和名称后完成创建。
- c. 点击左侧第二列,频道列表顶端的群组(sever)名称,在下拉菜单中点击“App目录”。
- d. 在app目录中搜索“midjourney”,点击搜索结果中的“Midjourney Bot”。
- e. 在“Midjourney Bot”页面点击“添加至服务器”
- f. 在弹窗中确认目标服务器,确认机器人权限后,完成添加 g点击右上角“esc”,回到服务器界面。选中左侧任意文字频道,在聊天窗口中输入“/”启动命令,与机器人对话。
订阅
虽然Midjourney支持免费试用,但由于服务器热度高、压力大,免费账户可能无法获得试用机会。考虑到这一点,以下提供Midjourney 订阅服务的简介。
免费试用 | 基础 | 标准 | 专业 | |
按月付费 | – | $10 | $30 | $60 |
按年付费 | – | $96 (每月$8) | $288 (每月$24) | $576 (每月$48) |
高速 GPU 时间 | 共0.4小时 | 每月3.3小时 | 每月15小时 | 每月30小时 |
每月闲时 GPU 时间 | – | – | 无限制 | 无限制 |
额外 GPU 购买时间 | – | 每小时$4 | 每小时$4 | 每小时$4 |
通过直接对话单独工作 (Work Solo In Your Direct Message) | – | ✓ | ✓ | ✓ |
隐私模式 | – | – | – | ✓ |
排队任务数 | 3个当前任务,10个等待任务 | 3个当前任务,10个等待任务 | 3个当前任务,10个等待任务 | 12个当前的快速任务,3个当前闲时任务,10个等待任务 |
为照片打分获得免费GPU时间 | – | ✓ | ✓ | ✓ |
作品版权 | CC BY-NC 4.0 | 通用商用协议* | 通用商用协议* | 通用商用协议* |
●*如果你在某个时刻开启订阅,那么你可以按照你的意愿免费试用生成的图片。但如果你是一个收入总额超过$1,000,000美元的公司,那么你必须购买专业版。完整的协议细节请查看服务协议。
操作入门
提示语 (Prompts)
在Discord输入框中输入“/imagine”,而后即可编辑提示语并发送。
提示语是一段短小的文字。将其发送给Midjourney机器人,由机器人理解并生成图片。Midjourney机器人会将提示语和词组拆解成更小的片段,称为“token”。机器人将token与训练数据做比较,而后就可以生成图片。一个精心设计的提示语可以生成独特而精彩的图片。
基本提示语 (Basic Prompts)
最基础的提示语可以是一个单词、短语或emoji。
高级提示语 (Advanced Prompts)
更加复杂的提示语可以包含图片链接、多个文字短语、还有一个或多个参数。
● 图片提示语:可以将图片链接添加到提示语中,来影响生成结果的样式和内容。图片链接应当排在所有提示语的最前面,链接与链接之间用空格区分。你可以先将图片发送到discord的任意聊天中,然后 ● 文字提示语:用文字描述你想要生成的照片。在文章后面,有关于提示语的信息和说明。精心编写的提示语有助于生成好看的作品。
● 参数:参数可以控制生成图片的其他指标,例如长宽比、使用的模型版本、分辨率拓展等等。参数应位于提示语的末尾部分。 提示语撰写技巧
● 提示语长度:提示语可以非常简单。即使只有一个单词(或者emoji)都可以正常生成图片。如果提示语很短,那生成效果会非常依赖Mijourney的默认风格。所以,包含更多描述性信息的提示语能够生成更独特的图片。然而,提示语也不是越长越好,你应该专注于想要表达的主要概念。
● 语法:Midjourney机器人无法按照人类的方式理解语法、语句结构,单词等。单词的选择很重要。许多时候,更具体的近义词能产生更好的效果。比如比起big,你可以使用gigantic、enormous、immense等单词。尽可能地减少单词。可以使用逗号、括号、连字符来组织你的想法,不过要记住Midjourney机器人并不能稳定地理解它们的含义。机器人也不会识别字母的大小写。
● 关注你想要的:最好描述你想要的东西,而不是你不想要的。如果你要求一个“没有蛋糕”的聚会,那么你的图片里很可能会出现蛋糕。如果你想要确保某些物品不会出现在生成的图片中,尝试“—no”参数。
● 考虑关键的细节:任何没有说明的细节,最终都有可能会带来惊喜。根据你的创作意图,你可以写得更精确,也可以更模糊,不过要意识到任何没写的东西都会留下随机生成的空间。模糊的提示语可以带来多样性,不过同时,你也许无法获得想要的细节。
你可以从如下角度逐步细化你的提示语:
- 对象:person, animal, character, location, object, 等。
- 媒介:photo, painting, illustration, sculpture, doodle, tapestry, 等。
- 环境:indoors, outdoors, on the moon, in Narnia, underwater, the Emerald City, 等。
- 光线:soft, ambient, overcast, neon, studio lights, 等。
- 颜色:vibrant, muted, bright, monochromatic, colorful, black and white, pastel, 等。
- 氛围:Sedate, calm, raucous, energetic, 等。
- 构图:Portrait, headshot, closeup, birds-eye view, 等。
● 使用集合名词 (Collective Nouns):复数单词很不明确,在提示语中可以尝试更具体的数字。比如“Three cats”就比“cats”更加明确。也可以使用集合名词,比如使用”flock of birds”而不是“birds”。
图片网格 (Image Grids)
根据你的提示语,使用/imagine命令会生成四张低分辨率的待选图片。你可以使用图片下方的按钮来制作某张待选图片的变种或高分辨率版本。或者,你也可以重新运行这个任务。
●扩展分辨率:U1, U2, U3, U4 这些按钮可以扩展对应图片的分辨率,添加细节,生成一个更加清晰的图片。
●重做:重做按钮会重新运行这一任务。在如图所示的情况下,它会重新根据最初的提示语生成一组新的图片。
●变种按钮:V1, V2, V3, V4 这些按钮可以基于选中的图片,生成多个变种。生成的新图片会与选中的图片在风格和构图上大体类似,增加一些细节变化。
高分辨率图片 (Upscaled Images)
可以进行 🪄Make Variations, Web↗, ❤️Favorite 三种操作。
●制作变体 (Make Variations):创造高分辨率图片的变体,生成四张新的待选图片。
●网络 (Web):在你的画廊中打开图片。
●喜爱 (Favorite):标记你最喜欢的图片,方便在Midjourney网站中找到它们。
指令清单 (Command List)
下方加粗的指令为较为常用和重要的指令。
指令 | 指令作用 |
/ask | 提问并获取答案。 |
/blend | 快速将两张图片混合到一起。使用/blend命令,你可以上传2-5张图片,融合它们的概念和风格,生成新的图片。此命令与/imageine命令中的image prompts效果相同,不过界面对于移动端使用更加友好。 |
/dalily theme | 将通知切换到 #daily-theme频道。 |
/docs | 在Midjourney官方服务器中快速生成本文档的目录链接。 |
/describe | 基于用户上传的图片,生成案例提示语 (prompts)。 |
/faq | 在Midjourney官方服务器中生成链接,快速查看常见的提示语书写问题。 |
/fast | 切换到快速模式。Midjourney使用GPU进行渲染。当你购买订阅计划时,你购买的就是GPU使用时间。标准和专业版订阅用户每月拥有无限的闲时GPU时间,而快速GPU时间均有限制,详见订阅。 |
/help | 显示与Midjourney机器人有关的基础信息和使用技巧。 |
/imagine | 使用prompt生成图片。此为Midjourney最主要、常用的命令。在命令中,可以添加图片、文字提示语、参数等等。后文关于提示语的内容也主要适用/imagine命令。 |
/info | 查看账户信息、等待任务、正在进行的任务等。 |
/stealth | 专业版用户可使用此命令进入隐私模式。隐私模式下,你的图片在Midjourney网页不可见。 |
/public | 专业版用户可使用此命令进入公开模式 (与隐私模式相对)。 |
/subscribe | 生成链接通向你的账户页面。 |
/setting | 查看并修改Midjourney机器人设置。包括使用的模型版本、隐私模式、快速/闲时模式、定制化设置等。 |
/prefre option | 创造或管理一套定制化的设置,方便快速切换。 |
/prefer option list | 查看当前的定制化设置。 |
/prefer suffix | 常用后缀。使用此命令,可以将一组设定好提示语添加到当前提示语的后面。此命令仅适用于参数提示语。 |
/show | 使用图片的任务ID来重新生成图片。通过此命令查看任务ID,可以将此任务移动到另一个服务器的另一个频道,或者恢复任务、对旧任务进行新的调整等等。 |
/relax | 切换到闲时模式。Midjourney使用GPU进行渲染。当你购买订阅计划时,你购买的就是GPU使用时间。标准和专业版订阅用户每月拥有无限的闲时GPU时间,而快速GPU时间均有限制,详见订阅。 |
/remix | 打开或关闭再混合模式。再混合模式意味着你在生成一个图片等变体时,可以对提示语进行修改。 |
参数清单 (Parameter List)
下方加粗的指令为较为常用和重要的参数。
指令 | 指令作用 |
Aspect Ratios | 写作“–aspect 1:1”或者“–ar 1:1”来设置图片的长宽比例。默认长宽比为1:1。 |
Chaos | 写作“–chaos 0”,这个参数可以控制同一组图片的差别有多大。更大的值能够产生更加特别和意想不到的效果。这个参数的取值范围为0-100。 |
No | 写作“–no”,这是一个否定提示语。比如“–no plants”命令会尽可能移除图片中的植物。 |
Quality | 写作“–quality 1”或者“–q 1”。它决定了你想要话费的渲染质量和时间。它的默认值是1,更大的值代表更长的渲染时间和更好的质量,反之亦然。Quality参数可控选择的值包括 .25, .5, 1, 2。其中,Qality2仅对Version 1, Version 2, Version 3 模型生效,对于其他模型不可用。 |
Repeat | 写作“–repeat 1”或者“–r 1”。这个参数可以基于一组提示语生成多个任务。它可以帮助你快速地多次运行同一个任务。该参数仅对标准和专业版用户生效,且标准版重复任务上限为10个,专业版才为20个。 |
Seed | 写作”–seed 1748805552”。在Midjourney中,每一个任务会有一个专属的Seed值。在提示语末尾增加某个任务的Seed值,可以生成与该任务相似的备选图。这一参数常用于对生成图片进行微调。要获取一个任务的seed值,可将鼠标移动到机器人发送的备选图消息上,点击右上角悬浮工具栏中的“添加反应”,添加“envelope”,Midjourney就会将对应的Seed值单独发送给你。 |
Stop | 写作“–stop 10”。使用这个参数可以在中途停止任务。参数值可取10-100,默认为100。参数值即为任务中止的百分比。 |
Style | 写作“–style 4a”。此参数可以影响生成图片的整体风格,其取值依据模型版本的不同而不同。例如,对于Version4版本,取值可以为4a, 4b, 4c,对于Niji Model Version 5,取值可以为 cute, expressive, senic。更多情况,请点击左侧链接查看官方文档。 |
Stylize | 写作“–stylize 100”或者“–s 100”。Midjourney在训练时,倾向于生成在色彩、构图、形式感等方面更具艺术性的图片。将此参数的数值减小,则生成的结果中艺术风格会减弱,内容更贴近提示语;如果数值增大,则艺术风格增强,与提示语的联系则可能会弱化。对于Version 4,Version 5 版本模型而言,本参数的默认值为100,取值范围均为0-1000。其他模型的情况,请点击左侧链接查看。 |
Tile | 写作“–tile”。此参数可以生成连续、重复的图案,用户可以使用它制作花纹、纹理等。需要注意的是,添加此参数后生成的图形本身并非重复图案,只是一个图形单元。用户可以通过复制、拼贴这一单元,制造想要的效果。此参数无取值,切仅适用于Version 1,2,3,5。 |
Uplight | 写作“–uplight”。这个参数会改变扩展分辨率的运行方式。如果在提示语中带有uplight参数,在后续点击“U”按钮时,拓展分辨率增加的细节和平滑度会更少,产生的结果更接近最初的备选图。 |
Upbeta | 写作“–upbeta” |
Niji | 写作“–niji”。可以切换到Niji模型,此模型专注于动画风格的图片生成。 |
High Definition | 写作“–hd”。可以切换到一个较早版本的模型,生成更大,一致性不太强的图片。这个模型可能更适合于抽象或风景图片。 |
Test | 写作“–test”。可以切换到特殊的测试模型。 |
Testp | 写作“–testp”。可以切换到专注于摄影风格的测试模型。 |
Version | 写作“–version 4”或“–v 4”。可以用来切换不同的模型版本。取值可选1, 2, 3, 4, 5, 5.1。 |
Creative | 写作“–creative”。此参数作用于Test和Testp模型,可以生成根据多样性、更具创意的图片。 |
Image Weight | 写作“–iw 0.25”。此参数设定了图片提示语相对于文字提示语的权重比例。此参数仅对Version 3,Version 5版本模型生效。对于Version 5 模型,默认值为1,取值范围为.5-2。 |
Video | 写作“–video”。此参数可以将Midjourney生成图片的过程导出为视频。可将鼠标移动到机器人发送的备选图消息上,点击右上角悬浮工具栏中的“添加反应”,添加“envelope”,Midjourney就会将对应任务的视频单独发送给你。本参数对于扩展分辨率的操作无法生效。 |
模型版本与参 数可用性 (Model Version & Parameter Compatability)
作用于初次生成 | 作用于变体和再混合模式 (variations + remix) | Version 5 | Version 4 | Version 3 | Test / Testp | Niji | Niji 5 | |
Max Aspect Ratio | ✓ | ✓ | 任意值 | 1:2或2:1 | 5:2或2:5 | 3:2或2:3 | 1:2或2:1 | 任意值 |
Chaos | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
Image Weight | ✓ | .5-2,默认值1 | 任意值,默认值.25 | .5-2,默认值1 | ||||
No | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Quality | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ||
Repeat | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
Seed | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | |
Sameseed | ✓ | ✓ | ||||||
Stop | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ | ✓ |
Style | 4a和4b | expressive和cute | ||||||
Stylize | ✓ | 0-1000,默认值100 | 0-1000,默认值100 | 625-60000,默认值2500 | 1250-5000,默认值2500 | 0-1000,默认值100 | ||
Tile | ✓ | ✓ | ✓ | ✓ | ✓ | |||
Video | ✓ | ✓ | ||||||
Number of Grid Images | – | – | 4 | 4 | 4 | 2(如果长宽比不是1:1,则只有1张图) | 4 |