Para comenzar el entrenamiento de sus modelos de IA adaptados a cada función, Apple implementa lo que llama "datos sintéticos".
Apple integra funciones de inteligencia artificial en sus dispositivos, como corrección de escritura, resúmenes de notificaciones y generación de emojis a partir de texto. Para optimizar su IA y mejorar la calidad de los resultados, Apple planea utilizar datos de usuarios que hayan dado su consentimiento a través de la opción "Compartir análisis del iPhone".
Apple emplea una técnica denominada "datos sintéticos" para entrenar sus modelos de IA. Estos datos se crean para imitar las características importantes de los datos reales de los usuarios, como el formato y el estilo, pero sin contener información personal generada por ellos. El proceso implica el uso de un modelo de lenguaje avanzado para generar correos electrónicos sintéticos sobre temas comunes, que luego se transforman en "incrustaciones", representaciones matemáticas simplificadas que capturan las características clave de los mensajes sin almacenar el contenido real.
Estas incrustaciones se comparan con los correos electrónicos recientes de un grupo limitado de usuarios que han habilitado el análisis de dispositivos, utilizando privacidad diferencial para asegurar que no se revele información personal. El dispositivo del usuario selecciona la incrustación sintética más similar a sus mensajes reales sin identificar el contenido específico. Esta información permite a Apple aprender qué incrustaciones sintéticas se asemejan más a las conversaciones reales y utilizarlas para mejorar sus modelos de IA, creando nuevos ejemplos sintéticos basados en patrones populares.
En el caso de la herramienta para generar emojis a partir de descripciones, el entrenamiento se realiza de manera diferente. Para los usuarios que comparten el Análisis de Dispositivos, se aplican métodos de privacidad diferencial para identificar patrones y las indicaciones más utilizadas sin vincularlas a usuarios individuales ni revelar indicaciones poco comunes. Este enfoque permite a Apple mejorar los modelos basándose en las interacciones reales más representativas, como solicitudes de emojis con múltiples elementos, asegurando la detección de tendencias populares sin comprometer la privacidad de los usuarios.