Applen viisi uutta tekoälymallia esiteltiin

Applen uudet tekoälymallit tukevat laajempia Apple Intelligence -ominaisuuksia.

Apple esitteli 8. kesäkuuta WWDC-tapahtumassaan merkittävät käyttöjärjestelmäversiot, jotka tuovat mukanaan huomattavasti parannellun Siri AI -tekoälyavustajan sekä laajasti lisää Apple Intelligence -tekoälytoimintoja eri sovelluksiin.

Siri AI:n ja tekoälytoimintojen taustalla ovat Applen uudet kolmannen sukupolven Apple Foundation Models -tekoälymallit, joiden kehittämisessä Apple on tehnyt yhteistyötä Googlen kanssa, ja joiden pohjana on Gemini-tekoälymalli.

Apple ei hyödynnä suoraan Googlen Gemini-tekoälymalleja, mutta ne ovat olleet perustana Applen uusille malleille.

Apple Foundation Models -mallit koostuvat viidestä eri mallista, joista osa toimii paikallisesti Apple-laitteissa, osa Applen pilviympäristössä ja yksi Googlen palvelimilla Nvidian suorittimilla. Tällä tavoin Apple laajentaa Private Cloud Compute -arkkitehtuuriaan ensimmäistä kertaa myös kolmannen osapuolen pilvi-infrastruktuuriin.

Kun Apple julkaisi ensimmäiset mallinsa vuonna 2024, kokonaisuuteen kuului noin 3 miljardin parametrin paikallinen malli sekä suurempi palvelinpohjainen malli, joka toimi Private Cloud Compute -järjestelmässä Applen omilla, itse suunnittelemillaan piireillä varustetuilla palvelimilla.

Private Cloud Compute on Applen ratkaisu, joka mahdollistaa yksityisen prosessoinnin.

Apple Foundation Models 3:n viisi mallia on suunniteltu eri käyttötarkoituksiin.

AFM 3 Core on seuraavan sukupolven noin 3 miljardin parametrin tiheä paikallinen malli. Se on tarkoitettu peruskäyttöön Apple-laitteissa ja tarjoaa Applen mukaan parempaa laatua edeltäjäänsä verrattuna.

AFM 3 Core Advanced on Applen tehokkain laitteessa toimiva malli. Se on natiivisti multimodaalinen ja tukee esimerkiksi ilmeikkäämpiä ääniä sekä tarkempaa sanelua. Mallissa on 20 miljardia parametria, mutta se käyttää harvaa arkkitehtuuria, jossa vain noin 1–4 miljardia parametria aktivoituu kerrallaan riippuen pyynnöstä.

AFM 3 Cloud on palvelinpohjainen yleismalli, joka on optimoitu nopeuden, tehokkuuden ja suorituskyvyn kannalta.

ADM 3 Cloud Image on kuvien generointiin ja muokkaukseen tarkoitettu diffuusiomalli. Se mahdollistaa edistyneemmät kuvankäsittelyominaisuudet, uuden Image Playgroundin sekä uusia kuvanmuokkaustoimintoja, kuten kuvien perspektiivin muuttamisen mahdollistavan Spatial Reframingin.

Kuvat-sovellus tarjoaa jatkossa kolme eri generatiiviseen tekoälyyn perustuvaa kuvanmuokkaustoimintoa. Uusina mukaan tulevat Spatial Reframing perspektiivin muuttamiseen sekä Extend kuvien laajentamiseen.

AFM 3 Cloud Pro on Applen kyvykkäin palvelinpohjainen malli. Se on suunniteltu vaativimpiin käyttötapauksiin, kuten agenttimaiseen työkalujen käyttöön ja monimutkaiseen päättelyyn.

Uusien mallien myötä AFM 3 Core Advanced tuo 20 miljardin parametrin mallin paikallisesti tehokkaimpiin laitteisiin. Tämä Applen paikallisesti toimiva tekoälymalli vaatii iPhone 17 Pron tai iPhone Airin tai uudemman, iPadin M4:llä tai uudemmalla ja 12 gigatavulla käyttömuistia tai Macin M3:lla tai uudemmalla ja 12 gigatavulla käyttömuistia.

Mallin 20 miljardin parametrin koko on poikkeuksellinen, sillä yleisesti paikalliseen käyttöön suunnitellut mallit ovat usein huomattavasti pienempiä, usein vain muutaman miljardin parametrin kokoisia.

Apple ratkaisee haasteen harvalla arkkitehtuurilla. Sen sijaan, että kaikki 20 miljardia parametria olisivat aktiivisia jokaisessa tehtävässä, malli aktivoi vain osan niistä tarpeen mukaan. Tämä muistuttaa Mixture of Experts -lähestymistapaa, mutta Apple kertoo käyttävänsä omaa Instruction-Following Pruning for Large Language Models -menetelmäänsä.

Käytännössä tämä voi mahdollistaa tehokkaamman paikallisen tekoälyn ilman, että muistin käyttö ja suorituskykyvaatimukset kasvavat kohtuuttomiksi.

Applen mukaan malli tuo Siri AI:n yhteydessä käyttöön ilmeikkäämmät äänet ja merkittävästi paremman sanelutarkkuuden.

Uusista malleista AFM 3 Cloud Pro eroaa Applen aikaisemmista malleista merkittävästi taustatekniikkansa osalta. Toisin kuin muut mallit, AFM 3 Cloud Prota ei ajeta Applen omilla piireillä varustetuilla palvelimilla, vaan Nvidian suorittimilla Google Cloudissa.

Apple ilmoittaa laajentaneensa Private Cloud Compute -arkkitehtuurinsa kolmannen osapuolen infrastruktuuriin siten, että sen turvallisuus- ja yksityisyysperiaatteet säilyvät.

”Koko tässä malliperheessä tavoitteemme on sovittaa jokainen käyttäjäpyyntö malliin, joka tarjoaa parhaan vasteen pienimmällä viiveellä. Siksi olemme yhdessä erittäin innoissamme tästä seuraavan sukupolven malleista ja niiden upeista ominaisuuksista, joita voimme rakentaa niiden päälle, mukaan lukien uusi Siri AI -kokemus ja mahtavat älykkäät kokemukset läpi käyttöjärjestelmän”, kommentoi Applen tekoälyjohtaja Amar Subramanya WWDC-esityksen jälkeisessä mediatilaisuudessa.

Applen mukaan kaikki viisi kolmannen sukupolven mallia jakavat yhteisen alkuperäisen perustan ennen erikoistumista eri arkkitehtuureihin ja käyttötapauksiin. Mallien kyvykkyyksiin kuuluvat muun muassa ääni, kuvien ymmärtäminen, pitkän kontekstin päättely ja laadukas visuaalinen generointi.

Koulutusdatasta Apple kertoo käyttäneensä yhdistelmää julkisesti saatavilla olevasta tiedosta, lisensoidusta tai ostetusta datasta, avoimen lähdekoodin aineistoista, erillisistä tutkimuksista kerätystä datasta sekä synteettisestä datasta. Apple korostaa, ettei mallien koulutukseen käytetty käyttäjädataa tai käyttäjien vuorovaikutuksia.

Apple kertoo tehneensä laajoja ihmisten suorittamia arviointeja uusille malleilleen. Sisäiset arvioijat vertasivat vastauksia eri osa-alueilla, kuten ohjeiden noudattamisessa, totuudenmukaisuudessa, esitystavassa ja kuvien ymmärtämisessä.

Applen mukaan AFM 3 Core ja AFM 3 Cloud ylittävät edeltäjiään yleisissä tekstitehtävissä eri kieli- ja aluejoukoissa. Kuvien ymmärtämisessä uudet mallit ovat Applen testien perusteella parempia kuin vuoden 2025 versiot.

Lisätietoa Applen kolmannen sukupolven tekoälymalleista löytyy sen verkkosivuilta.

GeminiGoogleiPhonetekoälyYK