AI za izradu spota

AI za izradu spota

Izrada glazbenog spota uz AI

Odlučili smo isprobati izradu glazbenog video spota uz pomoć umjetne inteligencije i prilično smo zadovoljni rezultatom.

Radi odmora od IT apokalipse, inflacije, nadolazećeg Trećeg svjetskog rata, nove sezone Rings of Power i drugih pošasti svakodnevice, prije par godina sam počeo svirati s prijateljima u rock grupi Otkucaji. Kroz godinu dana smo već svirali autorske pjesme na koncertima, a sada u drugoj godini smo ih odlučili i izbacivati kao singlove na YouTubeu. Nažalost, od singlova se očekuje i određena razina kvalitete - ne samo u glazbenom smislu, što kao bend svi razumijemo i na čemu radimo, nego i u samoj prezentaciji. A jedna od težih stvari za izvesti jest izrada spota. Profesionalna oprema je skupa, a snimati spot bez profesionalne opreme izgleda vrlo „jadno“.

Srećom, živimo u doba AI revolucije, pa smo prošli mjesec odlučili isprobati kako bi bilo kada bismo napravili spot koristeći umjetnu inteligenciju.

Prvo je potrebno izabrati alat za izradu vizuala. Alati za stvaranje generiranih slika i videa su mnogobrojni, ali da nabrojimo samo vodeće, to bi bili WAN (https://create.wan.video), Sora (https://sora.chatgpt.com), Veo (https://deepmind.google/models/veo), Runway (https://app.runwayml.com), Luma (https://dream-machine.lumalabs.ai), Pika (https://pika.art), Kling (https://app.klingai.com) i Hailuo (https://hailuoai.video). Ako osjetite „paralizu izbora“, srećom postoje i agregatni alati kao što su Krea (https://www.krea.ai), koji funkcioniraju kao posrednik za druge modele i možete ih koristiti da isprobate koji vam model najviše paše.

No, po vlastitom iskustvu, puno je korisnije imati alat koji pamti povijest razgovora i može surađivati na izradi slike i mijenjati ju kroz dijaloge, umjesto specijaliziranih alata za izradu slike koji najčešće nemaju mogućnost dugotrajnih razgovora i sitnih prepravki. Iz tog razloga, ChatGPT nam se pokazao kao najbolji. On ima mogućnost korištenja učitanih slika (i vlastitih slika) kao predložak za nove, a kroz dugi dijalog može sam sebe „trenirati“ da shvati naše želje i tako bolje prati buduće upute.

 

 Ivona1.jpg

 

ivona1ai.jpg

Lijevo: Ivona Ferlin, pjevačica benda, desno: ChatGPT transformacija u „Heavy Metal“ stilu

 

Upravo ta mogućnost direktne komunikacije i „diskusije“ oko ilustracija unutar ChatGPT-a pokazala nam se daleko superiornijom nego sva konkurencija.

Nakon pokušaja raznih stilova, uključujući i hiper-realizam (kroz davanje stvarnih fotografija članova benda kao predložaka), shvatli smo da, iako su fotografije prilično realistične, još uvijek postoje velika ograničenja u samoj animaciji. Od svih modela, KlingAI se pokazao najbolji, ali i njega je prilično teško „ukrotiti“ da prati režijske upute, pogotovo u pogledu kretanja likova na sceni. U narativu je ponekad važno da se lik kreće van kamere, primjerice, prema desno ili prema lijevo, a AI likovi često se znaju zabijati u zidove, stolove, i slično. Recimo, najteži dio je bio pogoditi da se dva lika uhvate za ruke. Nakon previše pokušaja smo odustali i poslali ilustraciju gdje se već drže za ruke te zatražli od KlingAI-ja da animira kako odvajaju ruke (i obrnuli snimku). Ovo je pogotovo problematično kada imamo hiper-realistične likove kojima se udovi kreću taman dovoljno „uncanny“ da se potpuno izgubi imerzija. Ipak, uvelike pomaže kada postoje stvarni modeli u obliku fotografija.

U nastavku se može naći nekoliko pokušaja i pogreški. Ideja je bila izbjeći stvari koje su već „izlizane“, poput Ghibli stila, i fokusirati se na neki drugi stil koji AI može lako rekreirati, ali koji je također prepoznatljiv, a još neiskorišten - pa se isprobavao stil Tima Burtona, crtića Heavy Metal, i slično. Nažalost, animacija svih tih stilova (a i generiranje konzistentnih slika) je nailazila na slične probleme gdje se detalji gube, mijenjaju, i slično. Potrebno je naći neobičan i upečatljiv stil, a opet da je dovoljno apstraktan da se kasnije ne naiđe na (prevelike) probleme u konzistentnosti u pogledu detalja.

 

 

satja1.jpg

 

SATJAlUD.jpg

Lijevo: Adrian Satja Kurdija, gitarist benda, desno: ChatGPT transformacija u „Tim Burton“ stilu

 

Kada smo ideju predstavili ChatGPT-u, ovo je bio njegov prijedlog:

Većina AI generacija koristi „foto-realistični“ ili „fantasy art“ stil koji je trenutno prepoznatljiv. Probaj:

- Analogni stilovi: rani 80s VHS grain, 16mm film still, rotoscope, pastel chalk on dark paper, graphite sketch.
- Umjetnički stilovi: Francis Bacon, David Hockney, Magritte, Egon Schiele, Yoshitaka Amano.
- Surealno + svakodnevno: Kombiniraj nadrealne elemente (kružni motiv, lebdeći objekti, obrisi lica bez detalja) sa svakodnevnim okruženjima (vlakovi, stan, ulica).
- Odaberi 1–2 vizualna stila i zadrži ih kroz sve kadrove (npr. „akvarel koji se topi na filmskoj traci“).
- Koristi teksture: AI slike bez tekstura djeluju jeftino. Dodaj „prašinu“, „grain“, „film burn“, „double exposure“ efekte.

Uzevši to u obzir, ovo je bio prompt kojim smo uspjeli dobiti stil koji nam se svidio:

“Možda da izbjegnemo stvari koje su prepoznatljive - objekti, lica... Možda da napravimo apstraktnu scenu gdje vidimo dvoje ljudi obučeno u nekakvu minimalističku uniformu (tako da ih uvijek možemo lako ponovno nacrtati) i to da su iz daljine da ih se ni ne vidi najbolje. Recimo, nekakav planet, i oni su obučeni u bijele astronautske uniforme s kacigama na glavama, i gledaju se iz velike udaljenosti.”

 

CORPORATEMEMPHIS.jpg

 

Vizualna direkcija koju je gore izgenerirao je zapravo zloglasni „corporate memphis“, što je u jednu ruku dobro jer sigurno ima bezbroj predložaka na kojima je treniran u vidu korporativnih infografika u tom stilu, ali bi također bilo jako dosadno i bezukusno da nije odlučio spojiti taj stil s apstraktnim i neobičnim svijetom.

Odlučili smo prigrliti taj stil i proširiti mu vizualni vokabular - osim puste planete, dodali bismo još nešto, možda nešto potpuno neočekivano - antičke ruševine.

 

hramovi1.jpg

 

„A sada mi napravi jednu scenu iz ptičje perspektive s ta dva astronauta na tom planetu. Može biti puno ruševina neke drevne antičke civilizacije i hramova oko njih.“

Ovdje vidimo dva problema - prvi je format (ovo je format 9:16, a nama treba 16:9), a drugi je prevelika „geometričnost“. Ovakvi problemi se srećom mogu riješiti u ChatGPT-u kroz dijalog, ne samo za ovu sliku, već onda kroz trening i za sve buduće:

„Može li to biti u 16:9 formatu? I da bude puno manje tih ruševina, i puno manje geometrijski, da je svega možda jedan stup, i neki kamen. I može biti još dalje, da su oni još manje vidljivi.“

 

hram2.jpg

 

Zatim smo pokušali dodati i nas iz benda, i poslati fotografije s našeg nastupa kako bi ih ChatGPT ubacio u taj stil:

„A sada trebam imati i dio glazbenog spota gdje se svira. Probaj uzeti ovu fotografiju sa koncerta i pretvoriti je u scenu koja bi bila u tom stilu i bojama?“

 

 bend1.jpg

 

bend1ai.jpg

Lijevo: Ivona i ja na Ljetu na Velesajmu; desno: transformacija uz ChatGPT

 

ChatGPT ima mogućnost korištenja učitanih slika (i vlastitih) kao predložak za nove, a kroz dugi dijalog može sam sebe „trenirati“ da shvati naše želje i tako bolje prati buduće upute. Upravo ta mogućnost direktne komunikacije i „diskusije“ oko ilustracija unutar ChatGPT-a pokazala se u kreiranju ovog spota daleko superiornijom nad konkurencijom.

 

sven1.jpg

 

sven1ai.jpg

Lijevo: bubnjar Sven Staničić na Ljetu na Velesajmu; desno: transformacija uz ChatGPT

 

Nakon mnoštva izgeneriranih slika, shvatilo se da bi cijela pjesma u istoj paleti bila ipak pomalo dosadna, i da je potrebno otprilike svaku minutu spota promijeniti paletu i dodati još koje elemente:

„Dva Sunca, oba nisko na horizontu, i tamnije boje, kao u paleti sumraka. U prvom planu je velik kamen s izrezbarenim linijama“

 

kamen.jpg

 

Također, mogu se koristiti i već generirane ilustracije za generiranje novih, samo je važno da se osmisli zajednički „vokabular“ s ChatGPT-jem oko toga kako zovete koju paletu - primjerice, mi smo ove dvije palete uvijek konzistentno zvali „sumrak“ i „dan“, tako da nema zabune što želimo kada kažem „Napravi mi ovu sliku u sumrak paleti“.

 

 sven1ai.jpg

 

dusk.jpg

Lijevo: bubnjar Sven u „paleti dan“; Desno: bubnjar Sven u „paleti sumrak“

 

Još jedan dokaz superiornosti ilustracije kroz dijalog s ChatGPT-jem nad specijaliziranim alatima - u nekom trenutku se čak i bez promptova u slike dodaju elementi od ranije kojih se ni sam nisam sjetio promptati. Primjerice, dodavanje onog simbola na kamen, iako nije izričito rečeno u promptu:

„Mnogo gitarista, svi u pustinji, sviraju gitaru“

 

guitarists.jpg

 

„Vrlo psihodelično, pogotovo kad je animirano.“

Naravno, nije to uvijek uspješno, ponekad simbolika ode predaleko:

„Možeš li ga obući u crno i dodati narančastu paletu koju smo prije koristili za gitaru“

 

bandGuitar.jpg

 

wtf.jpg

Gore: tekstopisac i gitarist Adrian Satja Kurdija; Desno: Gitarist je otišao u suton a iza njega je ostala gitara praćena zmijom

 

 svenArtefakti.jpg

Čest problem previše dinamične AI animacije, očiti artefakti na mutnim dijelovima

Nakon što smo zadovoljni s 50-ak ilustracija, vrijeme je za animirati ih korištenjem KlingAI-ja. Svako malo izlaze novi modeli, ali većina ovih animacija je izrađena u modelima između 1.6 i 2.1 (trenutno je najnoviji 2.5 Turbo, ali on oduzima prilično puno „kredita“ po svakoj izvedbi), no naša preporuka je uvijek birati nove modele jer zaista puno bolje rješavaju artefakte, pogotovo u brzim animacijama (npr. kada Sven udara po bubnjevima, prilično je jasan AI artefakt oko palica jer smo koristili stariji model). Tu predlažemo uvijek animirati stvari sporije i manje dinamično, pa kasnije u montaži ubrzavati, čak i ako se radi o jednostavnim translacijama poput leta ptice.

Uputa za KlingAI je uvijek u obliku dodavanja ilustracije kao referentne slike i šturog opisa tipa „gitarist svira“ ili „sunce polako raste“, a KlingAI je sam spojen s DeepSeekom koji može (ako želite) to još dodatno uljepšati.

Također, ako ne želite stalno u montaži rezati logo iz slike, prijedlog je pretplatiti se na KlingAI kako biste mogli skidati animacije bez logotipa. Općenito, u oba slučaja (ChatGPT i KlingAI) pretplata se isplati jer značajno ubrzava brzinu generiranja. Uz pretplatu od 20 dolara na svakom od tih servisa (dakle, 40 dolara ukupno), uspjeli smo izgenerirati sve potrebno za čitav spot u nekoliko sati. Nažalost, nije korišten AI za montažu, nego (open source i besplatni) program za montažu ShotCut, a budući da nismo imali isksutva u montiranju spotova, čak i uz tutorstvo i pomoć ChatGPT-a, trebalo je preko 10 sati da se izmontira čitav spot - od čega je preko pola vremena otišlo na to da tranzicije odgovaraju ritmu pjesme. Srećom, dobra odluka kod apstraktne animacije jest ta da dok Ivona pjeva, ne vidimo njena usta, pa nije bilo potrebno pogađati lip sync u montaži (makar za to KlingAI i drugi programi zapravo rade jako dobar posao, doduše bolje za video nego za animaciju).

Spot se može pronaći na YouTubeu – „Otkucaji: Osvijetli me“. Iako je ovo bila zabavna vježba, za idući spot ćemo probati jednu drugačiju (i puno stariju) „budžet“ metodu - korištenje snimki iz javne domene (starih filmova i slično). No, čak i uz ovo malo truda i ovako rano u procesu, jedna stvar je jasna - unatoč tome što protivnici kažu, umjetna inteligencija će samo sve više postajati alat hobistima (i to ne samo bendovima) za pomoć u stvarima koje im nisu primarni fokus (primjerice - spotovi).

 

 

Ocijeni sadržaj
(0 glasova)

Vezani sadržaj:

  • Što je Gibberlink i zašto je napravio takvu pomutnju u svijetu?

    Skynet pred vratima: Gibberlink

    Kad računala odluče komunicirati na vlastiti način

  • VIDI AI kuharica - Pregled AI alata

    Pregled AI alata

    Popis AI alata po kategorijama namjene.

  • VIDI AI kuharica - Uvoz i pristup podacima u LLM sustavima

    Prikupljanje, priprema i korištenje podataka

    Što ako imate svoju vlastitu kolekciju podataka koju biste htjeli učiniti dostupnom drugim osobama korištenjem LLM (Large Language Model) sustava? Na primjer, veliku količinu podataka o vlastitom znanstvenom istraživanju, ili novootkrivenoj arheološkoj lokaciji.

  • VIDI AI kuharica - Ima li AI zapravo inteligenciju?

    Današnji modeli AI-a su statistički

    Prvi ugroženi poslovi su oni koji su visoko repetitivni, odnosno temelje se na stalnom ponavljanju istih radnji, uz vrlo ograničenu potrebu za kreativnošću, prosudbom ili interpretacijom.

  • VIDI AI kuharica - Ključne AI vještine

    Deset ključnih vještina koje morate naučiti za AI

    Današnji AI agenti, poput onih za korisničku podršku, koriste napredne modele poput GPT-a i mogu voditi gotovo ljudske razgovore.

  • VIDI AI kuharica - pregled AI alata - nastavak

    Pregled AI alata

    Napomena: Ovaj je članak izvorno napisann krajem srpnja 2025. te naknado objavljen, pa opisuje stanje i informacije dostupne do tog datuma. AI područje iznimno je dinamično, razvoj napreduje iz dana u dan, no unatoč tome smatramo da su ideje, analize i recepti u ovoj AI temi i dalje vrlo korisni.

  • Intervju: Filip Fruk - Kako profesionalci koriste AI

    AI alati za bržu video prezentaciju

  • VIDI AI kuharica - Savjeti za učinkovitiji prompt

    Prompt Engineering - ključna nova vještina

    Umjetna inteligencija mijenja način na koji pojedinci i poslovne organizacije funkcioniraju, a s tim promjenama nastaju i potpuno nove profesionalne vještine. Jedna od najbrže rastućih i najtraženijih vještina u 2025. godini postala je prompt engineering – disciplina koja spaja tehničko razumijevanje AI modela s kreativnim pristupom oblikovanju instrukcija. Kako biste maksimalno iskoristili AI potencijal, poželjno je naučiti pismeno se izražavati, ali s doista konkretnim i detaljnim uputama.

  • VIDI AI kuharica - AI alati za programere

    GitHub Copilot, Tabnine, CursorWP…

    Usporedba nekoliko najpopularnijih alata.

  • VIDI AI kuharica - LLM: Vlastito znanje dostupno svima

    LLM - Najveći knjiški moljac

    Pročitao je stotine milijardi „knjiga“ i nesebično prenosi znanje.

  • VIDI AI kuharica

    Postoje li recepti za AI kuhinju?

    Početna prašina oko generativnog AI se donekle slegla i još nas većinom nije zamijenila umjetna inteligencija. No, i dalje je i sve više oko nas, a ti se alati s predznakom AI-a s malo znanja mogu iskoristiti kao nadogradnja vaših poslovnih ili privatnih alata. Zaronili smo u vrlo napućen svijet AI alata i izronili s našom kuharicom u kojoj možete naći gotove recepte ili samo sastojke s kojima uz malo truda vi možete stvoriti svoj recept.

  • Intervju - Igor Štagljar

    AI i kvantna računala omogućuju puno brži razvoj lijekova 

    Igor Štagljar, hrvatski znanstvenik s impresivnom međunarodnom karijerom, već dva desetljeća vodi laboratorij na prestižnom Sveučilištu u Torontu – jednom od 15 najboljih sveučilišta na svijetu, a u području biomedicine među osam najboljih. Član je Hrvatske akademije znanosti i umjetnosti (HAZU), kanadske RoyalSociety of Canada te Europske molekularno- biološke organizacije (EMBO). Njegov tim bavi se otkrivanjem molekularnih mehanizama u različitim vrstama raka i razvojem novih tehnologija koje omogućuju brže i preciznije otkrivanje lijekova.

  • Umjetna Inteligencija i naši/njezini podatci

    Pozdrav redakciji,

    Vaš sam dugogodišnji pretplatnik i uvijek me oduševe vaši usporedni testovi koje najviše volim čitati.

  • Mainstream grafičke kartice za rendering i AI

    Grafičke kartice za kreativne profesionalce

    Ogromnu računalnu snagu modernih grafičkih kartica danas koristimo za brojne profesionalne zadatke, bilo da govorimo o foto i video obradi, renderingu, 3D animaciji ili - danas posebno popularnom - generativnom AI-ju. Testirali smo nekoliko Nvidijinih i AMD-ovih kartica u zahtjevnim aplikacijama kako bismo doznali kakve nam performanse mogu ponuditi u profesionalnom okruženju.

  • Samsung SmartThings uređaji

    Povezivanje AI kućanskih uređaja kroz SmartThings

    Kućanski aparati moraju imati vrhunske performanse, a dodatni svijet otključava se putem pametnih AI funkcionalnosti i povezivanja kroz centralno mjesto za upravljanje.

  • Whisper Transcribe

    Pričam ti priču

    Umjetna inteligencija se polako uvukla u naše domove i na naša računala, te ćemo sve teže pronalaziti alate koji se ne oslanjaju na nju.

  • Tajana Šimunić Rosing - hrvatska znanstvenica iza algoritma koji je 1.000 puta ubrzao analizu podataka

    Intervju Tajana Šimunić Rosing

    Cijenjena hrvatska računalna znanstvenica s Kalifornijskog sveučilišta u San Diegu, Tajana Šimunić Rosing, dobila je nagradu od Semiconductor Industry Association za dizajn algoritma strojnog učenja koji može 1.000 puta brže i efikasnije obraditi veliku količinu podataka.

  • Samsung dom s AI vizijom premijerno predstavljen u Zagrebu

    U Wespa Spaces, u Green Goldu, Samsung Electronics premijerno je predstavio svoju novu liniju televizora i bijele tehnike u Hrvatskoj.

  • Podaci svuda oko nas

    Izvori podataka i njihovo korištenje 

    Kako do podataka za testiranje vlastitih IT rješenja

  • Gigabyte GeForce RTX 5070 Ti Gaming OC 16G

    AI i DLSS u prvom planu

    Najnovija generacija Nvidijinih kartica donosi obilje tehnoloških novosti, unaprijeđene ray tracing i AI mogućnosti, a kao glavni adut nameće se i podrška za DLSS 4 s multi-frame generation tehnologijom. Nažalost, iznimno visoka cijena kartica poput RTX 5070 Ti ne čini ih osobito isplativim odabirom.

  • HONOR je predstavio svoju strategiju za ekosustav AI uređaja

    LIDERI MOBILNOSTI - HONOR ALPHA PLAN

    HONOR se s Magic7 Pro telefonom bori za vrh Android tržišta, Watch 5 Ultra je premium pametni sat, a u fokusu kompanije na nedavnom MWC-u bilo je predstavljanje HONOR ALPHA PLAN strategije za transformaciju u vodeću tvrtku za ekosustav AI uređaja.

  • Kako prepoznati AI generirani tekst

    Hrvatski nije dovojno podržan u anti-GPT alatima

    ChatGPT predvodnik je revolucije generativnih AI rješenja. Privatnim i poslovnim korisnicima nudi napredne mogućnosti sinteze teksta sa često upitnom faktografijom. Može li se učinkovito prepoznati AI generirani tekst uz pomoć dostupnih alata?

  • Hrvatski Telekom poklanja Perplexity Pro AI asistenta

    20.000 besplatnih licenci za Perplexity Pro danas dostupno svima putem Magenta Momentsa

  • 345 igara: superkolekcija koju morate imati

    345 koje morate imati

    Jeste li ih odigrali sve? Jeste li uopće čuli za sve? Donosimo vam gigantski popis od čak 345 igara koje, prema AI-u, morate imati. Od blockbustera poput Call of Dutyja i Grand Theft Auto V do uspješnica poput I Am Bread u kojoj igrate kao „feta kruva“. Sve su tu. Jesu li sve tu?

  • Asus Zenbook S16 UM5606WA

    Supertanak i supermoćan

    Velik 16-inčni ekran u kombinaciji s ultratankim kućištem jedinstven je slučaj u svijetu prijenosnih računala. Pritom najnoviji AMD-ov Ryzen AI 300 procesor omogućuje ovom Asusovom king-size ultraprijenosniku izvrsne performanse, odlične AI mogućnosti i iznimno dugo trajanje baterije.

  • Test Copilot+ prijenosnih računala: Jesen 2024.

    Računala budućnosti na AI pogon

    Copilot+ računala temeljena na Qualcommovim, Intelovim i AMD-ovim čipovima donose napredne AI mogućnosti, tehnološki najnaprednije procesore i potencijalno najdulje trajanje baterije. Istražili smo kakve su im doista performanse, jesu li im baterije stvarno toliko izdržljive, te koliko AI mogućnosti doprinose boljem korisničkom iskustvu.

  • IFA 2024 Berlin

    100 godina IFA sajma u Berlinu

    Prema očekivanjima, sajam IFA 2024 u Berlinu je sav bio u znaku umjetne inteligencije, koja se našla u uređajima i gadgetima svih oblika i namjena, a u inovacijama su ponovno prednjačili dobro poznati brendovi potrošačke elektronike.

  • Programiranje: AI server na vlastitom računalu

    CodeProject.AI Server

    Jednostavan pristup razvoju vlastitih AI aplikacija

  • Kibernetičke prijetnje: Kako se zaštititi?

    Profesionalna zaštita u svijetu s velikim porastom incidenata kibernetičke sigurnosti

    Broj ransomware napada globalno se povećao za 68%, a raste i broj napada potpomognut korištenjem AI-ja. Kibernetička sigurnost je temelj za kontinuitet poslovanja, a kvalitetna zaštita poput A1 Endpoint Protect poduzetnicima može ponuditi sveobuhvatno rješenje za sigurnost.

  • Brojke ne lažu – Weekend.17 je najbolji i najposjećeniji do sada

    Završio je najveći festival medija, komunikacija, biznisa i umjetne inteligencije u Rovinju

// možda će vas zanimati

Newsletter prijava


Kako izgleda naš posljednji newsletter pogledajte na ovom linku.

Copyright © by: VIDI-TO d.o.o. Sva prava pridržana.