差分隐私:一种用于数据发布与统计分析的隐私保护标准。它通过在查询结果中加入适当的随机噪声,保证单个个体的数据是否被包含在数据集中,对输出结果的影响都很小,从而降低个人信息被推断或重识别的风险。(常用隐私参数为 ε,表示隐私保护强度。)
/ˌdɪfəˈrɛnʃəl ˈpraɪvəsi/
Differential privacy helps protect users when companies share statistics.
差分隐私帮助在公司分享统计数据时保护用户。
By applying differential privacy to the census data release, the agency reduced the risk that attackers could infer information about any specific household while still providing useful aggregate trends.
通过在人口普查数据发布中应用差分隐私,该机构在仍能提供有用总体趋势的同时,降低了攻击者推断任何特定家庭信息的风险。
“Differential”在这里指“差异/变化”:差分隐私关注的是当数据集中仅改变一个人的记录时,输出分布会发生多大变化;“privacy”即隐私。该术语在计算机科学与统计学语境中由研究者(如 Cynthia Dwork 等)在 2000 年代提出并系统化,用来给“隐私保护”提供可量化、可比较的定义。