Mis on Midjourney?
Midjourney AI on tehisintellekti (AI) pildigeneraator, mis muudab tekstipõhise käskluse (promt) kvaliteetseks pildiks. Midjourney on üks paljudest hiljuti väljatulnud masinõppe-põhistest pildigeneraatoritest, kuid on saavutanud suure populaarsuse, olles üks parimaid pildigeneraatoreid. Väga head on ka DALL-E, Stable Diffusion ja Leonardo AI.
Midjourney võimaldab luua kvaliteetseid pilte lihtsatest tekstipõhistest kirjeldustest. Midjourney kasutamiseks ei ole vaja spetsiaalset riist- või tarkvara, kuna see toimib täielikult Discordi vestlusrakenduse kaudu. Midjourney -ga piltide genereerimise eest tuleb maksta väike summa (hetkel alates 11 €/kuus).
Vaatamata tagasihoidlikule algusele on Midjourney tulemused nüüdseks juba päris muljetavaldavad. Midjourney põhineb kahe suhteliselt uue masinõppe tehnoloogia kasutamisel: suured keelemudelid ja difusioonimudelid. Suur keelemudel aitab esmalt mõista sõnade tähendust. Seejärel konverteeritakse see vektoriks, mis on põhimõtteliselt nagu numbriline versioon sisestatud infost. Lõpuks aitab see vektor juhtida protsessi, mida nimetatakse difusiooniks.
Difusiooni mudel muudab juhusliku müra kunstiks. See on saanud populaarseks viimase kümnendi jooksul, mis selgitab AI pildigeneraatorite järsku tõusu. Difusioonimudelis lisab arvuti järk-järgult juhuslikku müra oma koolitusandmete pildikogumile. Ajapikku õpib see taastama algset pilti, vähendades müra. Piisava koolitusega võib selline mudel õppida genereerima täiesti uusi pilte.
Midjourney kasutamine nõuab hetkel Discordi kontot, kuid see peaks peagi muutuma. Midjourney on suletud lähtekoodiga ja töötab autoriõigusega kaitstud koodil, mistõttu pole seda võimalik täielikult analüüsida.
Midjourney miinusteks võib hetkel pidada seda, et hetkel pole võimalik luua pilte ilma taustata ning päris täpselt kõiki elemente mida soovid pole võimalik veel käsklustega edasi anda. Tausta eemaldamiseks lihtsate piltide puhul sobib näiteks https://www.remove.bg/
Mis puudutab hinda, siis iga pildi genereerimine nõuab arvutusvõimsust (GPU-sid), seetõttu maksab Midjourney vähemalt 11 eurot kuus, mis tagab umbes 200 pildi genereerimise (sõltuvalt kvaliteedist jms). Kui valid suurema kuumaksega lahenduse, siis saad rohkem pilte ja kiirema piltide genereerimise.
Kuidas Midjourney kasutusele võtta:
1) Loo Discordi konto: https://discord.com/
2) Teosta makse
3) Ava Discordi vestlusaknas Midjourney
Täpsem info: https://docs.midjourney.com/docs/quick-start
Midjourney-ga piltide tegemine:
1) Pildi loomiseks, sisesta ühes “newbies…”toas käsklus: /imagine ja tühik ning saad lisada info, mida ja kuidas soovid pildile. Teine võimalus, mida ise kasutan, on klõpsata Midjourney ikoonile ja sisestada käsklus seal, siis ei kuva seal teiste kasutajate loodud pilte ehk loodavad pildid on lihtsamalt leitavad
2) /help ja tühik aitab ehk annab infot
3) /settings ja tühik, et seadeid muuta
4) Loodud piltidest ühe pildi valimine, vali näiteks teine versioon (U2) loodud piltidest, kui see pilt enim meeldib ja kuvab seda suurelt ning saad salvestada
Midjourney soovitused ja käsklused:
1) –ar (kaks kõrvutiolevat sidekriipsu ja tähekombinatsioon ar), et kuvasuhet muuta, näiteks: –ar 9:16
2) –c 50 (mida suurem number seda erinevad on need 4 pilti, mille Midjourney loob)
3) /blend ,et 2 erinevat pilti kokkusobitada (lae üles 2 pilti)
4) –tile ehk ilma niiöelda õmblusteta (taustapiltide jaoks)
5) stylize 0, (mida väiksem number seda vähem stiliriseeritud/muudetud)
6) Nijj ,teeb anime/multika stiilis pildid, näiteks: donald trump as simpson, nijj
7) :: (teeb pildil olevatest elementidest eraldi pildid)
8) –no (kui ei soovi midagi kindlat pildile, näiteks ei soovi punast värvi elemente: –no red)
9) aerial view või worm´s eye view (vaade õhust või rohujuure tasandilt)
10) morning light, Twilight või näiteks golden hour (valgustuse info)
11) pastel colors või bold and energetic, duotone (värvipalett)
12) happy mood (soovitud meeleolu valiku näide)
13) rule of thirds (kompositsioon ehk selle käskluse puhul pole põhielement mitte keskel, vaid ühes ääres)
14) kasuta kollektiivsed nimisõnu, et saada parem tulemus, näiteks: wolfes running asemel: pack of wolves
15) kui soovid kindlat arvu, siis lisa konkreetselt ehk näiteks cats asemel 4 cats
16) lisa kaamera kirjeldus, näiteks: Nikon D850 (või filmikaamera näiteks: Kodak ULTRA F9), 85mm lens, f/1.8, siis saad foto, mis oleks nagu tehtud kindla kaamera margi ja mudeliga ehk väga realistliku foto
17) lisa täpsem kirjeldus kontrastsusest ja värvidest, näiteks: intense contrast, vivid colors, shallow depth (madal sügavus), sleek (läikiv)
18) ära kasuta ülemäärast kirjeldust, nagu näiteks: I want, seda pole tarvis ja mida vähem sõnu, seda tugevam on iga sõna ehk tulemus saab täpsem
19) ära kasuta hüüumärke, see ei muuda sisestatud infot tähtsamaks
20) ära kasuta suuri tähti, see ei muuda kirjeldust tähtsamaks
21) kirjelda mida soovid, mitte mida ei soovi ehk: 6 cats, mitte 6 cats and no dogs
22) kombineeri promte, et saada veel paremaid ja huvitavamaid tulemusi
23) vaata näiteid (showcase) https://legacy.midjourney.com/showcase/top/
24) kasuta tuntud kunstnikke, näiteks: an AI inspired by Leonardo Da Vinci, bold atmosphere
Näidispildi käsklus: /imagine incredibly realistic image portraying woman, Nikon D850, 85mm lens, f/1.8, intense contrast, vivid colors, shallow depth, 8k, –s 750