Ako svakodnevno koristite računalo ili mobilni telefon, teško da ste se zadnjih nekoliko mjeseci mogli provući i ne probati na njima koristiti bar neki od AI alata. Na primjer, alate za postavljanje različitih vrsta upita AI sustavima i dobivanje odgovora, alate za generiranje različitih vrsta slika, odnosno audio i video zapisa, i tako dalje.
Najčešće korisnici takve alate koriste samostalno, alat po alat, bez međusobne suradnje različitih alata. Jeste li se probali zapitati kakve bi se tek stvari mogle napraviti kad biste za rješavanje nekog zadatka počeli koristiti više AI alata istovremeno? Tako da jedan ili više AI alata koristi već pripremljene rezultate od strane drugih AI alata. Pitanje na koje ćemo probati odgovoriti u tekstu koji upravo čitate.
Najjednostavniji oblik istovremenog korištenja većeg broja AI alata je slučaj kad se za istu namjenu koriste različiti, ali po koncepciji vrlo slični AI alati. Na primjer, umjesto da koristite samo jedan od danas vrlo popularnih LLM (Large Language Model) alata za odgovaranje na postavljene upite korisnika, istovremeno koristite više alata kako biste dobili što kvalitetnije odgovore. Na temelju vlastitog iskustva, ili nezavisnih istraživanja drugih izvora, vjerojatno ste već ustanovili kako ne daju svi LLM alati jednako kvalitetne odgovore u različitim situacijama. Zar ne bi bilo zgodno da umjesto korištenja općenamjenskih AI alata kao što su ChatGPT, Gemini ili Llama, u slučajevima kad vam je potrebna pomoć kod pisanja programskog koda koristite (na primjer) specijalizirani alat kao što je GitHub Copilot? A u slučajevima kad se očekuje postavljanje upita i prikaz odgovora na različitim jezicima (uključujući i jezike poput kineskog), možda bolje rezultate možete postići korištenjem Alibabinog sustava Qwen.
Ovakav način korištenja AI alata možete implementirati tako da u vlastitom AI sustavu koji upravo razvijate napravite početno filtriranje/kategorizaciju postavljenog upita, a onda se upit nakon početne analize proslijedi na rješavanje najboljem LLM modelu za konkretnu problematiku. Čime se već polako približavamo i do pojma AI Workflowa.
Qwen: Primjer postavljanja upita i dobivanja odgovora na Alibabinom LLM alatu Qwen
AI Workflow
Što je zapravo AI Workflow? Riječ je o nizu različitih koraka koji su uključeni u dizajniranje, razvoj, distribuciju i upravljanje inteligentnim sustavima. Takvi sustavi mogu sadržavati do osam različitih vrsta koraka.
Tipični koraci u AI Workflow sustavima nabrojeni su u sljedećoj tablici.
- Prikupljanje podataka - Ima za cilj prikupiti podatke iz različitih izvora kao što su IoT uređaji ili ETL cjevovodi.
- Početna obrada - Prikupljene podatke treba očistiti od eventualnog „smeća“ u podacima i pretvoriti ih u oblik pogodan za korištenje u AI sustavima.
- Razvoj i treniranje modela - Podaci prikupljeni u prethodna dva koraka se „ugrađuju“ u odgovarajući AI alat, odnosno izvodi se njegovo treniranje.
- Provjera i optimizacija modela - Sustav razvijen u prethodnom koraku treba provjeriti u smislu točnosti i pouzdanosti rada, te napraviti optimizaciju u pogledu korištenja resursa i brzine rada.
- Distribucija modela - Dovršen i optimiziran model treba uključiti u korištenje u produkcijsko okruženje.
- Zaključivanje i predviđanje - Nakon uključivanja u produkciju sustav ga može koristiti za zaključivanje i previđanje.
- Nadzor i održavanje - Svaki sustav, pa tako i AI sustavi, zahtijevaju nadzor u radu i održavanje u slučaju promjene okoline.
- Povratna veza - Na temelju podataka/grešaka iz korištenja modela u stvarnom svijetu dobivaju se podaci za njegovo dorađivanje i unapređivanje.
Za pripremu svih nabrojenih koraka koriste se različite vrste softverskih alata. Od onih „manje pametnih“ kao što su alati za čitanje podataka s IoT uređaja, do najsloženijih AI alata u kasnijim koracima. Pri tome se izlazni podaci jednog AI alata mogu koristiti kao ulazni podaci za drugi alat. A to se onda može više puta ponavljati ovisno o broju AI alata uključenih u sustav.
Za izgradnju složenog AI Workflow modela u koji su uključeni inteligentni AI dijelovi (te po potrebi i „neinteligentni“ dijelovi) potrebno je dobro poznavati različite alate i mogućnosti njihovog međusobnog povezivanja. Zadatak koji uvelike prelazi mogućnosti pojedinca, pa čak i manjih timova IT stručnjaka. Bar tako dugo dok se za izgradnju inteligentnih AI Workflow sustava ne upotrijebi još malo dodatne inteligencije (primjer u nastavku teksta).
Microsoftov pristup
Objasnimo prvo kako je problemu pristupio Microsoft u svojem Azure okruženju, kao jedna od najvećih softverskih kompanija u svijetu. U svojoj biblioteci inteligentnih alata Microsoft nudi preko 200 gotovih servisa te preko 11.000 različitih AI modela, spremnih za korištenje u vlastitim AI sustavima.
Pregled podržanih modela dostupan je na web adresi https://ai.azure.com/catalog. Kod početnog pregleda prvo se prikažu najpopularniji modeli, a po potrebi se može nastaviti s istraživanjem svih dostupnih modela. Nakon odabira jednog ili više modela potrebnih za izgradnju vašeg sustava, na raspolaganju je vrlo detaljna dokumentacija o svakom segmentu svakog pojedinog modela, što uključuje usporedbu s drugim sličnim modelima. Prije svega u brzini rada različitih modela.
Potencijalnim korisnicima dostupni su primjeri korištenja modela u različitim programskim jezicima: .NET jezici, Python, JavaScript i Java. Još jedna vrlo bitna stvar. Iako se korisnicima nude različite mogućnosti besplatnog proučavanja i pripreme vlastitih sustava, Microsoft nije „dobrotvorna ustanova“, što znači da se korištenje AI modula i drugih resursa u vašem sustavu naplaćuje. Budući da u svoj sustav možete uključiti različiti broj dostupnih AI modela, ali i drugih dodatnih usluga ili servisa (kao što su virtualne mašine ili baze/spremišta podataka), nije baš jednostavno onako „od oka“ unaprijed zaključiti koliko će stvarno koštati korištenje nekog sustava u praksi. Zato Microsoft također nudi posebne sustave za izračunavanje stvarnih iznosa korištenja vlastitih AI modula i/ili infrastrukture. Na taj način unaprijed (bar okvirno) možete očekivati koliko će vas nešto koštati, pa ovisno o tome modelirati vlastiti sustav uz uključivanje poneke komponente više ili manje.
Neki od primjera zajedničkog korištenja različitih AI modula koje navodi sam Microsoft u svojim uputama su:
- Istovremeno korištenje više LLM modela kao što su GPT-4.1 mini i GPT-5 u istom sustavu. Ideja u pozadini je da se jednostavniji model (čije je korištenje ujedno jeftinije) koristi za odgovaranje na jednostavnije upite, a složeniji upiti se proslijede na obradu naprednijem LLM modelu.
- Korištenjem modela za vizualno prepoznavanje kao što je Phi-3.5-vision-instruct može se na temelju početne slike (npr. nekakve vizualne informacije iz medicinskog sustava) pripremiti odgovarajući tekstualni izlaz, koji se onda preusmjerava jednom od većeg broja različitih AI modula optimiziranom za analizu takve vrste podataka.
- Korištenjem nekog od „mini modela“ kao što je Phi-3 može se pripremiti „lokalno“ AI rješenje koje dio obrade upita postavljenih od strane korisnika izvodi bez potrebe za komunikacijom s „većim“ AI modelima, čime se može uštedjeti poprilično komunikacijskih i financijskih resursa.
Dokumentacija i primjeri koji prate Microsoftove AI modele i servise vrlo su detaljni, ali to ipak ne znači da ih možete koristiti bez da prvo ne uložite određeno vrijeme za upoznavanje modula koje namjeravate koristiti.
Microsoft Azure AI Foundary: Pregled najpopularnijih AI modela dostupnih za korištenje
Phi-4-mini-reasoning: Primjer detaljne dokumentacije o jednom od dostupnih modela
AI-Flow
Može li se neki AI Workflow pripremiti jednostavnije od prije opisanog načina kakvog nudi Microsoft? Odgovor je srećom potvrdan, a jedno od mogućih rješenja nalazi se na web adresi https://ai-flow.net/.
Slično kao što su vizualno orijentirani razvojni alati (kao što je Visual Basic) postali vrlo popularni odmah nakon svoje pojave u odnosu na dotadašnje programske jezike (kao što je neka od klasičnih verzija C-a) zbog mogućnosti da se elementi sučelja jednostavno slažu povezivanjem odgovarajućih objekata, tako bi vizualni pristup trebao olakšati međusobno povezivanje različitih AI modula u AI Workflow rješenja.
AI-Flow omogućava odabir jednog ili više modula iz popisa od preko 1.000 dostupnih AI i drugih (manje inteligentnih) modula, njihovo postavljanje na svojevrsnu radnu površinu, definiranje vrijednosti za dostupne parametre u svakom elementu, te njihovo međusobno povezivanje, čime se definira međusobni način razmjene podataka vizualnim putem. Korisniku su također na raspolaganju različiti predlošci, gdje je većina posla odrađena već unaprijed. Neki od takvih predložaka mogu se prilagoditi vlastitim potrebama, što je još brže nego da se sve radi ispočetka, čak i u slučaju kad možete koristiti vizualni pristup modeliranju.
Kako sve to skupa izgleda u praksi demonstrirat ćemo na primjeru već unaprijed pripremljenog AI Workflow predloška, koji uz kombiniranje više modula priprema sažetak YouTube video zapisa. U ovom slučaju, AI Workflow je relativno jednostavan, jer se sastoji od svega dva elementa:
Prvi je ulazni YouTube Transcript element pomoću kojeg se definira video zapis koji se analizira. Na raspolaganju su dva parametra: URL adresa video zapisa, te neki od dostupnih jezika za analizu. U ovom slučaju smo kao URL adresu s video zapisom izabrali
, a kao jezik ostavili engleski.Na navedenoj YouTube adresi nalazi se video koji predstavlja sadržaj najpoznatijeg SF filma u povijesti. Naravno, to je Kubrickov film „2001: Odiseja u svemiru“. Jako je bitno da ovaj video zapis podržava klik na ikonu „CC“ zaduženu za prikaz pratećih tekstova uz tekst. Po želji možete isti postupak isprobati i s drugim video zapisima, tako da upišete njihovu punu web adresu.
Drugi modul u nizu (na koji je povezan ovaj početni modul) naziva se GPT, a on predstavlja podršku za odgovarajući LLM model. U podrazumijevanim postavkama na ovom mjestu je postavljen GPT 4.1 Mini zato što su resursi ovog modela sasvim dovoljni za ono što se obrađuje kao ulazni podatak s YouTube Transcript modula. Kao dodatne parametre drugog modula možemo još navesti URL slike koja će se uključiti u rezultate analize, kratki opis postupka te mogućnost uključivanja dodatnog web pretraživanja. Ostavimo za sada sve ovo bez promjene, pa jednostavno kliknimo na gumb RUN ALL koji se nalazi na vrhu stranice. Nakon nekoliko sekundi potrebnih za izvođenje modela dogodit će se „magija“ nastala u suradnji između spomenuta dva modula. Ako to niste isprobali sami, rezultat možete vidjeti na pratećoj slici uz tekst.
AI-Flow: Online alat koji omogućava vizualno orijentirano povezivanje različitih AI modula
Rezultati izvođenja: Sažetak video zapisa dodatno je ukrašen emoji sadržajem
Prvo je YouTube Transcript element s YouTube stranice pokupio tekst – razgovor između članova posade. Nakon toga je taj tekst poslan u GTP modul na analizu, a ovaj modul je pripremio sažetak te ga dodatno ukrasio emoji znakovima. Sve skupa je bilo vrlo jednostavno za pripremu i izvođenje, zar ne? Nismo pisali nikakav programski kod niti pripremali nekakve posebne konfiguracijske datoteke za definiranja načina međusobnog sporazumijevanja korištenih modula.
Primijetite da su u okviru AI-FLOW-a dostupni brojni drugi izvori podataka, AI moduli za različite vrste inteligentne obrade podataka, uključujući i one vizualno orijentirane kao što su DALL-E 3 ili Remove BG, brojni dodatni pomoćni alati za „manje inteligentnu“ obradu podataka kao što su Data Splitter ili Regex Extract, alati za pristup API pozivima, alati za izvođenje CRUD operacija nad podacima u Airtable sustavu, te dodatne metode za pripremu Notion sadržaja ili slanje poruka preko Telegrama. Istina, neki od modula su još uvijek u Beta fazi, ali će gotovo sigurno tijekom vremena doživjeti svoju punu implementaciju.
Probajte sad na temelju ovog jednostavnog primjera te kratkog nabrajanja dodatnih mogućnosti sustava razmisliti kakve bi se sve stvari mogle napraviti pomoću AI-FLOW tehnologije. Na primjer, AI sustav za prepoznavanje i liječenje bolesti vinove loze. Ovaj primjer je namjerno izabran, jer je autor teksta prije puno vremena radio na nečem sličnom, ali uz korištenje puno primitivnijih alata.
Na samom početku rada sustava, neki od AI elemenata za prepoznavanje slike bi opisao izgled oboljelog lista vinove loze, jer je slika navedena kao ulazni parametar. Taj tekstualni sadržaj bi nakon toga bio poslan složenijem LLM modelu, a on bi temelju njega prepoznao o kakvoj je bolesti riječ te što bi trebalo poduzeti u liječenju (recimo, prskanje odgovarajućim sredstvom). Nakon toga bi sljedeći element u nizu poslao u biljnu ljekarnu vašu narudžbu potrebnog sredstva, a vama osobno poruku da treba napraviti prskanje vinograda naručenim sredstvom. Naravno, uz detaljan opis načina primjene sredstva, jer su LLM modulu dostupni i takvi podaci. Na kraju bi zadnji modul u nizu u bazu podataka zabilježio sve podatke o bolesti, tretmanu i datumu kao bilješku o problemu nastalom u vinogradu te što je poduzeto za rješavanje problema, kao osnovu za nekakvu naknadnu analizu. A sve to bi se teoretski moglo napraviti vizualnim povezivanjem različitih AI modula u okviru AI Flowa, bez potrebe za programiranjem, konfiguriranjem i slično. Sjajno, zar ne?
A koliko korištenje takvog sustava stvarno košta u praksi? Zapravo i nije previše skupo, s obzirom na potencijalne mogućnosti sustava te jednostavnost korištenja. Ovisno o potrebnim resursima za rješavanje određenog problema, kreće se u rasponu od otprilike cijene jedne do oko četiri čaše pive na popularnim koncertima! Detalje o cijenama korištenja sustava možete pronaći sami na adresi https://app.ai-flow.net/.
Daljnje istraživanje alata prepuštamo samim čitateljima.
Cijena korištenja: S obzirom na mogućnosti alata i jednostavnost korištenja nisu pretjerane

































