Az Apple az adatvédelem iránti elkötelezettségéről ismert, ami komoly kihívást jelent az új Apple Intelligence funkciók bevezetésekor, hiszen a mesterséges intelligencia fejlesztéséhez általában hatalmas adatmennyiségre van szükség. A cupertinói cég azonban kidolgozott egy módszert, amellyel úgy tudja fejleszteni AI modelljeit, hogy közben tiszteletben tartja a felhasználók privát szféráját, és nem használja fel közvetlenül a személyes adataikat a tanítási folyamathoz.
A megoldás kulcsa a szintetikus adatok alkalmazása. Ahelyett, hogy valódi felhasználói tevékenységeket, például e-maileket vagy képeket elemeznének, az Apple mesterségesen generált adatokat hoz létre, amelyek az általános használati mintákat és trendeket próbálják leképezni. Ez a differenciális adatvédelemként ismert technikai megközelítés része, amely lehetővé teszi az adathalmazokból való tanulást anélkül, hogy egyedi, személyhez köthető információk kerülnének ki a rendszerből.
Például az e-mailek összefoglalásának pontosságának javításához az Apple nem a felhasználók valódi leveleit olvassa el. Ehelyett mesterségesen létrehozott e-mailekből származó mintázatok és jellemzők (úgynevezett beágyazások) kivonatát küldi el, anonimizált formában, azon felhasználók egy szűk körének eszközeire, akik előzetesen beleegyeztek a diagnosztikai és használati adatok megosztásába. A felhasználó készüléke helyben hasonlítja össze ezeket a mesterséges mintákat a saját, valós adataival, majd csupán általános visszajelzést küld az Apple-nek arról, hogy melyik szintetikus minta illeszkedett a legjobban a valósághoz. Így a cég csak aggregált trendeket és mintákat lát, a felhasználó konkrét üzeneteinek tartalma soha nem hagyja el a készüléket. A leginkább relevánsnak ítélt szintetikus mintákat használják fel aztán az AI-modell finomhangolására.
Ezt az adatvédelmi szempontokat előtérbe helyező módszert az Apple tervei szerint kiterjeszti majd más AI-vezérelt szolgáltatásokra is, mint a Genmoji, az Image Playground, a képszerkesztő eszközök és a különböző írássegédek.
Ez a felhasználói hozzájáruláson és a szintetikus adatokon alapuló eljárás jelentősen eltér más technológiai óriások gyakorlatától. A Meta például nyíltan használja a felhasználók által nyilvánosan megosztott tartalmakat (posztokat, kommenteket) és a saját AI-asszisztensével folytatott beszélgetéseket is az AI modellek képzésére, bár lehetőséget biztosít az adatok ilyen célú felhasználásának letiltására.