Torek, 14. 5. 2024, 8.24
5 mesecev, 3 tedne
Open AI predstavil novo različico umetne inteligence GPT-4o
Družba Open AI je predstavila najnovejšo različico umetne inteligence GPT-4o, ki je sposobna realističnega glasovnega pogovora in najrazličnejših drugih interakcij, ki jih izvaja v realnem času. Kot so sporočili iz podjetja, gre za korak k veliko bolj naravni komunikaciji med človekom in računalnikom, pri čemer je ta sposoben sprejemati kombinacije tekstovnih, zvočnih in slikovnih podatkov ter jih na vse te načine tudi podajati.
Interview prep with GPT-4o pic.twitter.com/st3LjUmywa
— OpenAI (@OpenAI) May 13, 2024
Na zvok oziroma govor se je GPT-4o, pri čemer o pomeni omni oziroma vsestranski, sposoben odzvati že v 232 millisekundah, v povprečju pa za to potrebuje 320 millisekund, kar je podobno odzivnemu človeku med pogovorom.
"Zdi se kot umetna inteligenca iz filma. Pogovor z računalnikom se mi nikoli ni zdel naraven, zdaj pa se mi," je poudaril predsednik uprave Open AI Sam Altman.
Kaj vse zmore GPT-4o?
Kot si lahko pogledate v spodnjih posnetkih, je GPT-4o med drugim sposoben prevajanja govora iz angleščine v španščino in obratno, prepevanja pesmi, ki si jih glede na uporabnikove želje izmisli sam, prepoznavanja dogodkov, ki jih vidi prek uporabnikovega telefona in njihovega opisa, ter interpretacije in reševanja matematičnih problemov.
Two GPT-4os interacting and singing pic.twitter.com/u9VuZoroxm
— OpenAI (@OpenAI) May 13, 2024
Lullabies and whispers with GPT-4o pic.twitter.com/5T7ob0ItuM
— OpenAI (@OpenAI) May 13, 2024
@BeMyEyes with GPT-4o pic.twitter.com/nWb6sEWZlo
— OpenAI (@OpenAI) May 13, 2024
Meeting AI with GPT-4o pic.twitter.com/rHkQ316MYj
— OpenAI (@OpenAI) May 13, 2024
Math problems with GPT-4o and @khanacademy pic.twitter.com/RfKaYx5pTJ
— OpenAI (@OpenAI) May 13, 2024
Rock, Paper, Scissors with GPT-4o pic.twitter.com/Cy4r3vABtH
— OpenAI (@OpenAI) May 13, 2024
Live demo of GPT-4o voice variation pic.twitter.com/b7lLJkhBt1
— OpenAI (@OpenAI) May 13, 2024