Tekoäly audio- ja videotuotannoissa

Kirjoittaja: Eki Halkka

22.08.2023

Kuvaa, ääntä ja tekstiä generoiva keinoaly on edennyt viime vuosina huimin askelin, eikä kehityksen hidastumista ole näköpiirissä. Tällä on suuria vaikutuksia myös AV -tuotantoihin. Itse ajattelen generoivan keinoälyn olevan kuin aalto ja vaihtoehtoina olevan joko jäädä aallon alle tai surffata sillä.

Keinoälyn kehitys on tällä hetkellä niin nopeaa, ettei riitä että kerron tämän tekstin käsittelevän vuoden 2023 tilannetta: yhä uusien läpimurtojen aikaskaala on ennemminkin kuukausia, joten pitää myös mainita että kyseessä on nimenomaan loppukesä 2023.

Osin tuosta kehityksen nopeudesta johtuen tuotantokäyttöön riittävät AI -sovellukset ovat vielä usein vaativia käyttää, tietokeneosaamisen pitää olla monessa tapauksessa aika hyvällä tasolla, koodaamisen osaamisestakaan ei ole haittaa, ja jo pelkkä eri työkalujen etsiminen ja kehityksen seuraaminen on melkein kokopäivätoimista hommaa jos haluaa kuulua niihin surffaajiin. Tämä tulee toki muuttumaan kun työkalut kypsyvät.

MIKÄ tilanne on juuri nyt?

Kehitystä tapahtuu kaikilla rintamilla. ChatGPT:n kaltaiset kielimallit osaavat kirjoittaa jo sangen mainiota tekstiä, etenkin englanniksi. Alallamme tätä voi hyödyntää esimerkiksi käsikijoitusten ideoinnissa ja miksei viimeistelyssäkin. Pykälää nörtimpi tapa on käyttää kielimalleja esimerkiksi animaatio- tai kompositointiohjelmien skriptien koodaamiseen, vaikkapa automatisoimaan eri kuvaelementtien liikkeitä koodinpätkällä.

Kuvankäsittelyn puolella AI on jo nyt helpottanut monia paljon tarkkaa ja tuskaista käsityötä vaativia työvaiheita. Esimerkiksi rotomaski joilla irroitetaan esiintyjä taustasta silloin kun käytössä ei ole greenscreeniä tai syvyysmaski jolla saa muokattua erikseen lähellä ja kaukana olevia kuvan osia piti vielä muutama vuosi sitten tehdä käsin maskeja piirtämällä, ruutu ruudulta, 25 ruutua per sekunti.

Nyt tällaisen maskin saa parhaimmillaan tehtyä parilla klikkauksella. Vielä tässä vaiheessa tarvitaan silti usein käsin korjailua vaikka suurin osa työstä tapahtuu jo nyt automaattisesti keinoälyllä. Uskoisin että aika pian päästään riittävän korkeaan laatuun täysin automaattisesti.

Toinen merkittävä kuvankäsittelyn AI -sovellus on heikkolaatuisen kuvamateriaalin parantaminen. Keinoälypohjaisilla ohjelmistoilla voidaan poistaa kohinaa, lisätä resoluutiota ja jopa korjata väärin tarkennettua materiaalia – vaihtelevalla menestyksellä toki.

Ehkä suurimman vau -efektin on toistaiseksi aiheuttanut kuvien generointi. Parhaat AI -sovellukset pustyvät tekemään kuvia joita on vaikea erottaa oikeasti kuvatuista (tai piiretyistä, tai maalatuista). Generoiva AI on ollut omasa työssäni vahvasti käytössä jo melko pitkään. AI:lla generoituja kuvia tai kuvaelementtejä käytän esimerkiksi greenscreenstudiossa kuvatun materiaalin taustalla, tai tavallisen lokaatiossa kuvatun materiaalin muokkaamiseen. AI -generoidut kuvat ovatkin omasa käytössäni jo suurelta osin korvanneet kuvapankit. Yleensä käytän kuitenkin niitä yhdistettynä perinteisin menetelmin tehtyyn työhön.

Seuraava aalto on jo tulossa. Liikkuvaa videokuvaa generoiva keinoäly on laadultaan suunnilleen siinä missä oltiin reilu vuosi tai kaksi sitten tavallisten kuvien kanssa – jälki on kiehtovaa, mutta laadultaan pääosin vielä liian karkeaa todelliseen tuotantokäyttöön. Kehitys on kuitenkin niin nopeaa, että nämäkin mallit tulevat luultavasti lähikuukausina tuotantokäyttöön. Kaikenlaisia jänniä kokeiluja ja “taiteellisempia” tuotoksia voi toki tehdä vaikka heti.

Myös ensimmäisiä askelia keinoälyn ja 3D -animaation saralla otetaan juuri nyt. Itsekin olen jo esimerkiksi koemielessä käyttänyt pian ensi-iltaansa tulevassa teatterielokuvassa kokonaan keinoälyllä toteutettua 3D ihmishahmoa – joskin hyvin pienenä taustalla, laatu ei vielä riitä lähikuviin. On myös olemassa AI -sovellus jolla pystyy korvaamaan tavallisesta videokuvasta esiintyjän liikkeineen kaikkineen 3D -animaatiohahmolla, täysin automaattisesti. Tälläkin saralla odotan huimia kehitysloikkia lähikuukausina ja -vuosina.

Keinoälypohjainen puhesynteesi on yksi osa-alue joka on myös kehittynyt nopeasti. Keinoälyn tuottamaa puhetta on jo hyvin vaikea erottaa aidosta, etenkin englannin kielellä. Monissa käyttököhteissa keinoäly tuleekin korvaamaan ihmisselostajat. Aitoa ihmisääntä tavitaan yhä silloin kun tarvitaan näyttelijäntaitoja, mutta geneerisemmissä selostuksissa keinoälyn kätevyys, muokattavuus ja nopeus tulee painamaan vaakakupissa ilmaisun puutteita enemmän.

Vaikkapa käsikirjoitusmuutokset muuttuvat operaatiosta jossa pitää buukata studio ja spiikkeri siihen että vain syötetään malliin uusi teksti – valmis. Yksi kiinnostava mahdollisuus on “kloonata” oikean puhujan ääni – tällöin voitaisiin käyttää pääosin oikean ihmisen lukemaa tekstiä kaikkine luonnollisine vaihteluineen, mutta olisi myös mahdollista tehdä viime hetken korjauksia korvaamalla tarvittava pätkä (vaikka vain yksi sana) AI:lla.

On myös jo olemassa palveluita jotka generoivat luetun tekstin lisäksi myös puhujan liikkuvan avatar-kuvan. Lopputulos on usein vielä hieman jäykkä, tunnistettavissa generoiduksi, mutta kehitys tässäkin osa-alueessa on nopeaa.

Kielimallit toimivat myös toiseen suuntaan. Tekstitysten teko helpottuu kun AI osaa tunnistaa videon ääniraidalta puheen, ja muuttaa sen automaattisesti tekstitykseksi. Tämäkin toki toimii paremmin englanniksi, toistaiseksi.

Miltä tulevaisuus näyttää?

No, aika hurjalta. Emme ole mitenkään hirveän kaukana tilanteesta, jossa käyttäjä voi pyytää keinoälyä tekemään Marsiin sijoittuvan romanttisen scifikomedian jonka päähenkilönä on käyttäjä itse – ja AI tekee työtä käskettyä, alusta loppuun.

Joitain asioita AI ei kuitenkaan tee – jos halutaan vaikkapa esitellä yrityksen tiloja ja työntekijöitä, ne varmasti tullaan kuvaamaan ihan oikeasti tulevaisuudessakin. Uutiset, dokumentit ja reality ovat lähtökohtaisesti todellisesta maailmasta kotoisin. Voi olla että autenttisuudesta tulee myyntivaltti, kun synteettisen luominen muuttuu yhä helpommaksi. Myös elokuvatähtiä tulee varmasti olemaan jatkossakin – vaikka taustan extranäyttelijöiden työ saattaakin olla vaarassa.

Kysyin lopuksi ChatGPT:ltä mietteitä tämän kirjoituksen jatkoksi.

ChatGPT:

Tässä muutamia kommentteja ja pohdintoja, joita voit käyttää tekstin jatkoksi:

1. Käyttäjien osaaminen ja sovellusten käytettävyys: Kuten mainitsit, tällä hetkellä AI-sovellusten käyttöönottaminen edellyttää usein vahvaa tietoteknistä osaamista. Tulevaisuudessa voisi kuitenkin odottaa, että sovellukset ja työkalut tulevat yhä käyttäjäystävällisemmiksi. Tämä avaa oven monille luoville ammattilaisille, jotka eivät ole koodaajia tai tietotekniikan asiantuntijoita.

2. Eettiset kysymykset: Tekoälyn käyttö audiovisuaalisissa tuotannoissa tuo mukanaan monia eettisiä kysymyksiä. Miten suojaamme yksityisyyttämme, kun AI voi luoda uskottavia videoita meistä ilman suostumustamme? Miten varmistamme, että synteettiset tuotokset eivät johda disinformaatioon tai harhaanjohtaviin tulkintoihin? Nämä ovat aiheita, joita yleisö, lainsäätäjät ja teollisuus joutuvat pohtimaan yhä enemmän.

3. Luovuuden ja tekoälyn yhteispeli: Vaikka AI voi auttaa luomaan sisältöä, se ei korvaa inhimillistä luovuutta. Tulevaisuuden menestyvät luovat ammattilaiset osaavat yhdistää oman ainutlaatuisen näkemyksensä ja AI:n voiman. Tekoäly voi olla erinomainen työkalu, mutta se tarvitsee ohjausta ja visionääriä sen takana.

4. Henkilökohtaisen sisällön luominen: Kun AI-tekniikat kehittyvät, yksilöllisten sisältöjen luominen yksittäisille käyttäjille saattaa yleistyä. Esimerkiksi henkilökohtaiset elokuvat, joissa katsoja on päähenkilö, voivat tulla suosituiksi.

5. Uusien liiketoimintamallien synty: Tekoälyn tuoma tehokkuus ja automaatio voivat johtaa uusiin liiketoimintamalleihin. Esimerkiksi elokuva- ja TV-tuotanto voi muuttua edullisemmaksi, mahdollistaen pienten tuotantoyhtiöiden tai yksittäisten luovien ammattilaisten kilpailla suurten yhtiöiden kanssa.

6. Tekoälyn rajoitukset: On tärkeää ymmärtää, että vaikka AI on erittäin voimakas työkalu, sillä on myös rajoituksensa. Se voi tuottaa virheitä tai epätäydellisiä tuloksia, ja sen toimintaan voi olla vaikea puuttua tai sitä voi olla vaikea ymmärtää.

Lopuksi, on mielenkiintoista miettiä, miten yleisö suhtautuu synteettiseen sisältöön. Vaikka teknologia mahdollistaa monenlaista, yleisön luottamus ja arvostus ovat lopulta ratkaisevia tekijöitä. Autenttisuuden ja ”oikean” taiteen arvostus saattaa kasvaa, kun synteettinen sisältö yleistyy.

Tekoäly audio- ja videotuotannoissa

MIKÄ tilanne on juuri nyt?

Miltä tulevaisuus näyttää?

Lähetä kommentti Peruuta vastaus

Viimeisimmät artikkelit

Viimeisimmät kommentit

Yhteydenotto

Kiitos viestistäsi!