
특히 알림 요약과 같은 영역에서 AI 제품의 성능이 기대에 미치지 못하자 비판을 받은 후, Apple은 월요일에 합성 데이터를 활용하여 사용자 데이터를 개인적으로 분석하여 AI 모델을 개선하고 있는 방법에 대해 상세히 설명했습니다.
회사는 '차별적 개인정보 보호'라는 접근 방식을 사용하여 먼저 합성 데이터를 생성한 다음 사용자 기기(사용자가 Apple과 기기 분석 정보를 공유하기로 선택한 경우)에 생성된 합성 데이터의 일부를 보내어 모델의 정확성을 비교하고 이를 통해 모델을 개선할 계획이라고 밝혔습니다.
회사는 블로그 글에서 “합성 데이터는 사용자 생성 콘텐츠는 포함하지 않지만 사용자 데이터의 형식 및 중요 속성을 모방하는 데 사용됩니다. 대표적인 합성 이메일 세트를 선별하기 위해 여러 주제에 대해 합성 메시지를 생성하는 것으로 시작합니다.[...] 그런 다음 각 합성 메시지의 핵심 차원인 언어, 주제 및 길이와 같은 일부 중요한 측면을 포착하는 표현인 임베딩을 도출합니다.”라고 설명했습니다.
회사는 이러한 임베딩을 사용하여 기기 분석에 동의한 일부 사용자 기기로 전송하고, 기기는 이를 샘플 이메일과 비교하여 Apple에 가장 정확한 임베딩을 알려줍니다.
회사는 이 방법을 사용하여 Genmoji 모델을 개선하고, 향후 합성 데이터를 사용하여 Image Playground, Image Wand, 메모리 생성 및 작성 도구뿐만 아니라 시각 지능도 개선할 계획이라고 밝혔습니다. Apple은 또한 사용자에게 이메일 요약을 개선하기 위해 기기 분석 정보를 공유하는 사용자들에게 합성 데이터를 사용하여 설문조사할 것이라고 밝혔습니다.