Za razliku od većine velikih AI kompanija koje se oslanjaju na korisničke podatke za obuku svojih modela, Apple je predstavio inovativan pristup kojim balansira između napredne AI obuke i zaštite privatnosti.
Sintetički podaci kao prvi korak
Apple koristi syntetičke podatke — veštački generisane podatke zasnovane na sopstvenom velikom jezičkom modelu — da trenira svoje AI sisteme. Na primer, sistem može generisati lažne mejlove kako bi učio kako da ih sažima, umesto da koristi stvarne korisničke poruke.
Diferencijalna privatnost: Kombinovanje sa stvarnim podacima
Apple je dodatno unapredio proces koristeći diferencijalnu privatnost. Ova metoda omogućava da se podaci sa korisničkog uređaja uporede sa sintetičkim podacima, bez da se stvarni podaci ikada pošalju Apple-u.
Na primer, uređaj generiše „ugradnje“ (eng. embeddings) za korisničke mejlove, upoređuje ih sa sintetičkim, i Apple dobija samo informaciju o tome koji su sintetički primeri najbliži stvarnim. Nema IP adrese, nema identiteta korisnika.
Potpuna kontrola korisnika
Uključivanje u program deljenja analitike je isključeno po difoltu. Korisnici sami biraju da li žele da učestvuju, i mogu lako uključiti/isključiti ovu opciju u podešavanjima uređaja. Sve funkcioniše lokalno, a nova verzija iOS-a i macOS-a donosi dodatne opcije upravljanja podacima.
Praktična primena i budućnost
Apple već koristi ove metode u funkcijama poput Genmoji i Image Playground. U planu je širenje primene na dodatne alate za obradu teksta, vizualnu inteligenciju i kreiranje uspomena. Ova strategija je posebno relevantna za korisnike u EU i Srbiji gde je GDPR i svest o privatnosti vrlo izražena.
Zaključak
Kroz spoj sintetičkih podataka i diferencijalne privatnosti, Apple uspeva da unapredi AI performanse bez ugrožavanja poverljivosti korisnika. Ovaj model bi mogao postati industrijski standard za balans između korisnosti i etike.