k-匿名性:一种数据隐私保护标准/模型,要求在发布的数据集中,每一条记录在“准标识符”(如年龄、邮编、性别等可组合识别的信息)上,至少与另外 k−1 条记录不可区分,从而降低个人被重新识别的风险。(该术语也常与其他隐私模型一起讨论,如 l-diversity、t-closeness。)
/ˌkeɪ əˈnɒnɪmɪti/
The dataset was released only after it met k-anonymity with k = 10.
该数据集只有在满足 k-匿名性(k=10)后才被发布。
Although k-anonymity reduces re-identification risk, it may still allow attribute disclosure when sensitive values lack diversity.
尽管 k-匿名性能降低重新识别风险,但当敏感属性取值缺乏多样性时,仍可能发生属性泄露。
k-anonymity 由字母 k(表示“至少有 k 个相同/不可区分的个体”这一参数)与 anonymity(匿名性)构成。anonymity 源自希腊语 anōnymos(“无名的”),由 **an-**(否定前缀,“不”)+ onyma/onoma(“名字”)组合而来。该术语在数据隐私研究中被系统化提出并广泛使用。