满足个性化差分隐私的社交网络图生成方法

高 瑞,陈学斌,谷 铮,邹元怀

(华北理工大学 理学院,河北省数据科学与应用重点实验室,唐山市数据科学重点实验室,河北 唐山 063210)

摘 要:【目的】针对现有本地化差分隐私社交网络图生成算法中直接扰动邻居列表的方法会导致引入过多噪声且隐私保护程度不均衡的问题,提出了一种满足个性化的本地差分隐私社交网络图生成方法(GPDP)。【方法】首先,使用传统的社区发现算法Louvain对原始社交网络图进行划分,保留社区信息;其次,对于划分后的社区根据其社区内部平均权重度比值作为新的隐私预算参数分配给每个节点;然后,每个节点根据新的隐私预算各自扰动其邻居列表,同时利用随机邻接位向量(RABV)方法降低通讯成本;最后合并邻居列表形成生成图。【结果】通过在真实数据集上的实验结果表明,该算法在发布合成图数据时保证了数据隐私性和可用性的均衡,同时保留了更多的社区结构信息。

关键词:个性化差分隐私;社交网络;隐私保护;合成图生成

中图分类号:TP309.2

文献标识码:A

DOI:10.16355/j.tyut.1007-9432.2023BD001

文章编号:1007-9432(2024)01-0163-09

引文格式:高瑞,陈学斌,谷铮,等.满足个性化差分隐私的社交网络图生成方法[J].太原理工大学学报,2024,55(1):163-171.

GAO Rui,CHEN Xuebing,GU Zheng,et al.Social network graph generation method satisfying personalized differential privacy[J].Journal of Taiyuan University of Technology,2024,55(1):163-171.

收稿日期:2023-08-30;

修回日期:2023-10-05

基金项目:国家自然科学基金资助项目(U20A20179)

第一作者:高瑞(2000-),硕士研究生,(E-mail)634746251@qq.com

通信作者:陈学斌(1970-),教授,博士,主要从事大数据安全、物联网安全、网络安全等研究,(E-mail)chxb@ncst.edu.cn

Social Network Graph Generation Method Satisfying Personalized Differential Privacy

GAO Rui, CHEN Xuebin, GU Zheng, ZOU Yuanhuai

(CollegeofScience,HebeiKeyLaboratoryofDataScienceandApplication,TangshanKeyLaboratoryofDataScience,NorthChinaUniversityofScienceandTechnology,Tangshan063210,China)

AbstractPurposes】 Aiming at the problem that the randomized neighbor list method of directly disturbing the neighbor list in the existing local differential privacy social network graph generation algorithm will lead to excessive noise and imbalanced privacy protection, a new social network graph generation algorithm satisfying personalized local differential privacy is proposed. 【Methods】 First, the Louvain algorithm is used to partition the original social network graph and preserve community information; Second, for the divided community, a new privacy budget parameter is allocated to each node on the basis of the average weight ratio within the community; Then each node perturbs its neighbor list separately, meanwhile by using the Randomized Adjacency Bit Vector method to reduce communication consumption; Finally, merge the neighbor lists are merged to form a generated graph. 【Findings】 The experimental results on real datasets show that this algorithm ensures a balance between data privacy and availability when publishing synthetic graph data, while retaining more community structure information.

Keywordspersonalized differential privacy; social network; privacy protection; synthetic graph generation

大数据时代,越来越多的数据以图结构形式进行存储和发布,因为图结构可以很直观地表示各个实体之间的复杂关系且方便可视化。因此图数据拥有了广泛的应用场景如社交网络分析、知识图谱、推荐系统建模等。然而直接发布完整的图数据信息会造成严重的隐私泄露问题。2021年4月,Facebook出现了一起大规模的数据泄露事件,涉及到5.3亿用户的个人信息,包括姓名、生日、电话号码、地理位置等。因此如何在发布社交网络图数据[1]的同时,保护好用户隐私不被泄露成为了一个急需解决的难题。在针对图数据的传统隐私保护方法中,匿名化技术的影响力最为深远,但是其存在着信息丢失的缺点且不能抵抗拥有特定背景知识的攻击者的假设。因此差分隐私技术(differential privacy)[2]作为一种严格的数学模型且无需考虑攻击者所拥有的任何可能的背景知识,如今被广泛地用于图数据的隐私保护[3]中。

本文通过结合个性化本地差分隐私模型,对于不同社区中的节点根据其所在社区的重要程度施加不同强度的隐私保护。通过将社区内权重度比值作为新的隐私预算参数分配给每个节点,然后节点各自扰动其邻居列表合成生成图。通过实验证明该算法可以在减少噪声量的同时保留更多社区图拓扑信息,权衡了数据的隐私性和可用性。

1 相关工作

2009年,HAY et al[4]首次将差分隐私技术引入针对于图数据的隐私保护之中。经过十几年的发展与研究,目前差分隐私模型在社交网络图数据上的应用可以大致分为两个方向[5]:第一个是基于差分隐私技术的图统计数据分析任务,其中包括子图计数、度分布、链路预测、社区发现和频繁子图挖掘等[3];第二个是利用差分隐私发布一个与原始图相似的合成图。相比图分析任务需要为特定的图拓扑指标定制算法[6],合成图生成发布则是一个更为一般的范式[7],通过对原始图数据进行加噪扰动,在保证数据无偏的同时,尽可能保留更多原始图的结构特性,并且发布的合成图可以用于数据分析任务,同时保证了用户隐私。

然而如何在发布的合成图模型中既保证数据的隐私性,也能保留原始图的图拓扑信息成为了隐私保护合成图发布领域的一大难点。QIN et al[8]使用k-means聚类将结构相似的用户分成多个组,然后结合本地化差分隐私技术对聚类结果添加噪声提出了LDPGen模型。然而,在LDPGen中噪声扰动下的聚类精度通常较低,影响了图重构的准确性。ZHANG et al[9]也结合k-means聚类和本地化差分隐私提出了一个两阶段的LDPGM模型。先对节点的度数加噪再根据度数进行聚类分组,最后对每个组节点的邻居列表进行ldp扰动。然而LDPGM将节点按度数分组,忽略了原始图的社区结构信息。HUANG et al[10]在差分隐私基础上,结合了聚类和随机化算法提出了PBCN方法。通过对度序列进行聚类和随机扰动,再对重构的图加入差分隐私噪声实现,但是PBCN由于添加的噪声扰动过量会导致数据可用性降低。LIU et al[5]结合不确定图和差分隐私技术提出DP-LUSN方法。该方法首先对原始图进行社区划分得到社区结构,然后使用不确定图方法对每个社区中边重连的概率加入拉普拉斯噪声,再对社区之间添加扰动。ZHANG et al[11]提出了一种满足节点差分隐私的图发布算法PrivaCom.设计了基于Katz系数索引的图特征提取方法,在捕获图拓扑信息的同时大大降低了节点差分隐私带来的敏感度。周楠楠等[12]将差分隐私加入到dk-2序列中提出了DPPM模型。该方法结合分组的思想将dk-2序列中最大度相同的边分到同一组,再对划分后组添加不同敏感度的噪声,最后使用dk图生成算法得到合成图,然而该方法在大型数据集上通讯消耗过大导致实验效果并不理想。GAO et al[13]结合了dk-1、dk-2和dk-3序列提出了一个综合差分私有图模型,根据使用3种dk信息量设计了两个图重构方法CAT和LTH,增加了合成图的效用。KANG et al[14]提出一种基于个性化差分隐私的社交网络关系信息隐私增强方法,该方法通过结合降维分割采样技术并在生成图中加入差分隐私形成虚拟点和边,以实现对社交网络隐私保护。QUAN et al[7]利用社区信息提出了一种有效的图合成算法PrivGraph,其通过社区信息对图中的节点进行分组,再分别提取社区内部的节点度数和社区之间的边数量加入噪声进行扰动,最后利用含噪声的度和边进行图重构。

上述相关研究都是利用差分隐私技术进行合成图发布的工作来实现对图数据的隐私保护。本文将结合现有工作中存在的问题,围绕无向无权的社交网络图数据隐私保护,设计一个满足个性化差分隐私保护的社交网络图生成模型GPDP.在保留社区拓扑信息的情况下,通过分组方法减少了传统RNL方法直接扰动邻居列表带来的过量噪声,且提供个性化的隐私保护。在满足差分隐私性质的同时保持了数据较高的可用性。

2 预备知识

2.1 差分隐私

差分隐私自提出以来一直是数据隐私保护领域研究的热门,尤其是在数据查询和数据发布方面。它为数据的隐私保护提供了一个强有力的数学准则。通过添加噪声的方法,可以在攻击者拥有任意背景知识的假设下对数据发布提供保护。以下是关于差分隐私的一些定义。

定义1ε-差分隐私。一个随机化查询算法M满足ε-差分隐私,当且仅当对于任意两个邻近数据集DD′,使得|DΔD′|≤1,任意的S∈Range(M),有

Pr[M(D)∈S]≤eε×Pr[M(D′)∈S] .

(1)

定义2全局敏感度。对于一个查询函数f:DRd,输入为数据集D,输出为d维数据Rd.对于任意的相邻数据集DD′,记录查询结果产生的最大影响。

GSff=maxD,Df(D)-f(D′)‖1.

(2)

定理1拉普拉斯机制。对于数值型的数据集D,算法M对真实的查询结果f(D)中添加符合拉普拉斯分布的噪声,表示为M(D)=f(D)+Y.其中M(D)是最后返回的结果,Δf是查询函数f的敏感度,Y是添加的拉普拉斯噪声,并且服从参数为Δf/ε的拉普拉斯分布,则称该随机算法M满足拉普拉斯机制的差分隐私保护,记为Y~Lap(Δf/ε).

性质1序列组合性。对于同一个数据集Dn个随机化算法〈M1,M2,…,Mn〉,其中任一算法满足εi差分隐私,则算法组合M(M1(D),M2(D),…,Mn(D))满足ε-差分隐私,且提供的差分隐私保护。

性质2并行组合性。给定数据集Dn个随机化算法<M1,M2,…,Mn>,其中任一算法满足εi差分隐私。那么对于数据集D中互不相交的数据子集D1,D2,…,Dn,算法组合M(M1(D1),M2(D2),…,Mn(Dn))满足ε-差分隐私,且提供ε=max(εi)的差分隐私保护。

2.2 差分隐私图分析

通常来说社交网络一般抽象为图结构模型G(V,E)进行表示,其中V={v1,v2,…,vn}表示为图G中的节点集合,对应社交网络中的用户。E={eij=(vi,vj)|vi,vjV,ij}表示为图G中的边集合,对应着社交网络中两个用户的连接。将差分隐私引入图数据领域,自然而然就产生了节点差分隐私和边差分隐私[15]。显然节点差分隐私比边差分隐私有更强的隐私保证,但同时也会带来更大的敏感度。本文设计的图生成算法只用收集和扰动节点的邻居列表,通过限制图中任意一条边对输出的影响来保护节点间连接的隐私,因此专注于实现边差分隐私,以下是有关边差分隐私的定义。

定义3ε-边差分隐私。一个随机化算法M满足ε-边差分隐私,当且仅当对于任意两个邻近图G1(V1,E1)和G2(V2,E2),使得|V1V2|+|E1E2|=1,任意的S∈Range(M),有

Pr[M(G1)∈S]≤ee×Pr[M(G2)∈S] .

(3)

定义4ε-边本地差分隐私。一个随机化算法M满足ε-边本地差分隐私,当且仅当对于任意两个邻近列表rr′,使得rr′仅在一个bit位上有所不同,任意的S∈Range(M),有

Pr[M(r)∈S]≤ee×Pr[M(r′)∈S].

(4)

2.3 社区检测

社区检测[16](community detection,CD)又称社区发现是理解社交网络中用户节点行为的关键任务,通过对图的聚类分析将具有密切社会关系或相似行为的用户划分为同一组,使得社区内部连接密集,社区之间连接稀疏。目前常见的非重叠社区的发现算法主要包括:图分割方法、聚类方法如层次聚类谱聚类、模块度优化方法以及动力学方法如随机游走等。

本文选用经典的社区检测算法Louvain算法[18]来发现社区结构,该算法在计算效率和分组效果上都表现优异,并且能够发现层次性的社区结构。其通过模块度最大化的过程来探索社区结构,以下是有关模块度的相关定义。

定义5模块度[17]用来衡量一个社区的划分好坏的评价指标,它的公式定义如下。

(5)

式中:∑in是社区c中边的权重之和;∑tot表示与社区c内的节点相连的边的权重之和即社区c中的节点度数之和;m表示图G中所有边的权重之和。在无向无权图中,权重之和就是边数。

定义6模块度增益

(6)

模块度最大化的过程就是通过计算模块度增益ΔQ来得到,模块度增益是针对与单个社区定义的。所以说上式中前一个中括号表示将一个社区A加入到新社区B的模块度,后一个中括号表示社区A单独作为一个社区的模块度。如果第一项大于第二项,那么模块度增益ΔQ大于0,说明合并社区是有意义的,那么就将两个社区进行合并。

3 个性化差分隐私的图生成算法

目前,随机响应技术(random response,RR)是实现本地化差分隐私保护[19]的主要扰动机制。随机邻居列表扰动算法RNL,直接应用随机响应技术收集每个用户的邻居列表。然后在给定隐私预算ε的情况下,每个用户节点以的概率翻转邻居列表里的每一个bit位;再将扰动后的邻居列表发送给数据收集者进行组合形成合成图。然而该方法并没有考虑到不同社区节点的重要性不同且每个用户节点有自己的隐私偏好,导致了隐私保护程度不均衡的问题发生;同时生成的合成图往往比原始图更加密集,严重影响了数据的可用性。

因此本文提出的个性化差分隐私图生成算法GPDP,针对直接扰动邻居列表RNL方法导致的隐私保护不均衡和引入过多噪声的问题进行改进。通过节点分组,给不同重要度的节点提供不同的隐私保护强度,减少了噪声总体添加量。该算法主要包含3个步骤。第一个步骤是使用Louvain算法对原始图G进行社区发现,将原始图划分成多个分区;第二个步骤是提取每个社区内部的平均权重度比值作为扰动比p;第三个步骤是每个节点根据其所在社区的扰动比作为新的隐私预算参数对其邻居列表进行扰动,最后生成合成图G′.个性化差分隐私社交网络图生成算法模型如图1所示。

图1 个性化差分隐私图生成模型
Fig.1 Structure of GPDP

3.1 算法实现

算法1Louvain社区发现算法

---------------------------------------------------

输入:原始图G

输出:原始图的社区划分

1 初始化 ∥将每个节点作为一个单独的社区,模块度设为0

2 for遍历原始图节点集

3 for遍历当前节点邻接点

4 计算将当前节点加入到邻接点社区的模块性增益ΔQ

5 找到模块性增益最大的ΔQmax

6 if ΔQmax>0

7 将节点分配给ΔQmax邻接点所在社区

8 end for

9 对社区重新编号 ∥将每个社区看作超点

10 重复步骤2直到整个图的模块度不再发生变化

11 end for

return 社区划分C={c1,c2,…,ck}

---------------------------------------------------

在算法1中,使用传统的Louvain算法进行社区划分,目的是为了得到原始图的社区结构,然后针对不同社区的重要程度对节点进行个性化的隐私保护。这样做不仅可以均衡节点的隐私保护强度,还能够降低传统RNL方法中每条边以相同概率扰动带来的过量噪声,同时生成图还能保留更多的社区拓扑信息。

在这里使用社区的密集程度来定义社区的重要程度。一个社区内部节点连接的边数量越多,说明该社区在整个图中的重要度也越高,其社区内部的节点往往具有较高的介数中心度,那么该社区中的节点就需要更强的隐私保护。于是根据社区内部的节点平均权重度定义了扰动比p.

定义7扰动比

(7)

式中:davg是全图的节点平均权重度,dc,avg是当前社区的节点平均权重度。当社区内部越密集时,社区节点的平均权重度就会越大,扰动比p就相应越小。当乘上相同的隐私预算时,扰动比p越小的社区节点会被提供更强的保护,这样做使得噪声的添加更加均衡。

算法2社区扰动比提取

---------------------------------------------------

输入:原始图G,社区划分C={c1,c2,…,ck}

输出:社区的扰动比p={p1,p2,…,pk}

1 计算全图节点的平均度davg

2 for 遍历社区c

3 计算当前社区内部节点的平均度dc,avg

4 得出当前社区扰动比

5 end for

return 扰动比p={p1,p2,…,pk}

---------------------------------------------------

在算法2中,通过计算社区内部的平均权重度与全图的平均度比值得到了所有社区的扰动比p={p1,p2,…,pk}.接下来将应用扰动比p得到新的隐私预算参数ε′=ε×p来进行不同社区中每个节点的邻居列表扰动。

算法3个性化邻居列表扰动

---------------------------------------------------

输入:原始图G,社区扰动比p={p1,p2,…,pk},原始隐私预算ε

输出:生成图G

1 初始化 ∥从原始图提取每个节点的邻居列表γ1={b1,b2,…,bn}

2 for 遍历每个节点

3 根据节点的社区标签找到对应社区的扰动比p

4 计算新的隐私预算参数ε′=ε×p

5 依概率对邻居列表进行扰动

6 得到扰动后的邻居列表

7 end for

8 将邻居列表合并形成生成图

returnG

---------------------------------------------------

在算法3中,使用个性化的隐私预算对节点的邻居列表进行扰动。使用的扰动机制还是传统的GRR而不是优化一元编码OUE[19]或是优化本地哈希OLH[19],因为在无向无权图中节点的邻居列表都是由二进制向量0和1组成,传统的GRR就能获得更好的精度。

然而在算法3的扰动过程中会出现两个问题。因为本文针对的无向无权图的邻接矩阵是对称的,但是当依据概率对邻居列表即邻接矩阵中的每一行施加扰动时,可能会造成上三角矩阵和下三角矩阵不对称的问题,即MijMji.因此还需要对扰动后的邻接矩阵进行后处理操作,使同一条边在其对应节点邻居列表中的扰动结果一致。并且由于原始图中不存在节点自环,所以要对扰动后的生成图检查其对角线元素是否全部为0.

为了使生成图满足Mij=Mji,进行扰动时就需要对扰动的每一条边控制扰动结果一致。这样就会消耗双倍的隐私预算,为了解决这个问题,参考了文献[6]中的随机邻接位向量方法RABV.通过扰动一半复制一半的思想,只扰动每个节点邻居列表一半的bit位再复制另一半,这样做降低了算法3个性化扰动中的通讯消耗和计算成本。

3.2 隐私性分析

在个性化本地差分隐私的社交网络图生成算法GPDP中,只有子算法3通过对每个节点的邻居列表施加随机响应机制来实现差分隐私。由于每个社区中节点使用的隐私预算ε′不同,所以无法直接对整体算法进行隐私性分析。因此通过差分隐私的并行组合性质进行分析,不同节点的邻居列表都是相互独立的不相交的子集,因此符合并行组合性质。具体证明过程如下。

证明:设初始隐私预算为ε,γi={b1,b2,…,bn}和是只差一个bit位的邻居列表,这里假设对于任意的输出结果S∈Range(M),有

以上是对于一个节点的隐私性证明,对于其他所有节点的邻居列表因满足并行组合性质证明同理。因此所有节点邻居列表组成的生成图整体满足差分隐私,即GPDP算法满足ε-边本地差分隐私。

3.3 复杂度分析

本节将分析所提出的个性化图生成算法GPDP的时间复杂度和空间复杂度。

针对时间复杂度,该算法主要包含3个子步骤。步骤一是使用经典的社区发现算法Louvain将节点划分为多个社区,在这一阶段中社区划分的时间复杂度是O(nlogn),其中n是图中的节点数。在步骤二中遍历划分好的每一个社区提取扰动比,所以时间复杂度为O(k),其中k是社区的数量。步骤三需要对所有节点进行个性化扰动,因此对节点进行遍历,此过程的时间复杂度为O(kn).所以算法总的时间复杂度为O(nlogn+k+kn)<O(n2).然而社区数量k往往远小于n,实际计算效率上时间复杂度近似于O(nlogn).

针对空间复杂度本文所提出算法,仅需要申请空间存储划分后的社区信息和每个节点的信息,因此所需空间复杂度为O(k+n).

4 实验结果与分析

4.1 实验设置

本节将用实验来对提出的图生成算法GPDP进行性能评估,本文实验环境为 Windows 11,系统内存16 GB,所有算法均采用Python实现,编程环境为Python 3.7.

4.2 实验数据

本文的实验数据均采用真实的数据,实验数据集均来自斯坦福大学官网SNAP的4个公共数据集由小到大分别是football、email-univ、Facebook和Wiki-vote.具体实验数据如表1所示。

表1 实验数据
Table 1 Experimental data

数据集名称节点数边数football115616email-univ1 1335 451Facebook4 03988 234Wiki-Vote7 115103 689

4.3 对比实验

为了验证本文所提出的GPDP图生成算法的性能,将从以下几个方面对生成图进行性能评估,比较不同隐私预算下的生成图与原始图的图拓扑指标差异。同时与不加个性化扰动的传统RNL方法进行比较验证本文算法的有效性。

社区分类情况主要关注原始图和生成图社区划分结果的相似性程度。因此使用归一化互信息指数NMI来评估社区聚类结果的相似程度,其中NMI指数越高说明分类结果就越相似,NMI公式如下:

(8)

度分布情况,度分布序列是图领域十分重要的图拓扑指标,可以提供关于图的全局结构特征。本文中使用KL散度来度量原始图与生成图的度分布序列差异,KL散度公式如下:

(9)

平均路径长度可以用来衡量整个图的连通性指标,大多真实的小世界网络都有较低的平均路径长度。本文通过对比原始图和生成图的平均路径长度差异来刻画扰动对于图结构产生的影响。

实验设置隐私预算范围[1,2,3,4,5],并对每个隐私预算下的实验结果取10次平均。在4个数据集上的实验结果图如图2所示。

图2 不同隐私预算下度序列KL散度的实验结果
Fig.2 Experimental results of KL divergence of degree sequence under different privacy budgets

图2为4个数据集在GPDP和传统的RNL方法下度序列KL散度的实验结果。由图2的实验结果可知,当隐私预算从1到5时,隐私预算的增加使得噪声添加的扰动变少。生成图和原始图的度序列越来越接近,相应的KL散度也随之降低。从图2(a)-(c)可以看出在隐私预算较小时,GPDP算法添加了分组扰动的机制使得数据受扰动带来的误差较少,相较RNL方法的KL散度较小,数据可用性更高。但是当隐私预算增大到5时,这时由于算法受到的扰动变少,两个算法对度分布的影响较小,获得的生成图度序列分布与原始图十分接近。

图3是4个数据集在GPDP和传统的RNL方法下对原始图和生成图社区分类的实验结果,使用nmi来评估社区聚类的相似性。从图3的实验结果可知,当隐私预算从1到5时,随着隐私预算的增大,生成图和原始图的社区划分也变得更加相似,nmi指数也相应增高。从图3(a)和(b)中可以看出在小数据集中,GPDP算法与传统的RNL算法相差不大,nmi指数十分接近。但在图3(c) Facebook和(d)Wiki-Vote较大数据集上的实验结果表明,当隐私预算较小时,GPDP算法的nmi指数显著高于传统的RNL方法。这说明在强隐私性的保证下,GPDP算法通过对划分社区的方法保持了数据较高的可用性,同时保留了更多的社区拓扑信息。

图3 不同隐私预算下归一化互信息指数的变化
Fig.3 Change of normalized mutual information index under different privacy budgets

图4则是4个数据集在GPDP和传统的RNL方法下计算平均路径长度的实验结果,并且与原始图的平均路径长度进行对比。从实验结果图4中可以看出,随着隐私预算的增大,两个算法慢慢增加的平均路径长度也会越靠近真实值。从图4的(b)-(d)可以看出尽管在小隐私预算的情况下,GPDP算法略优于传统的RNL算法,但是即使当隐私预算增加到5时,两个算法计算出的生成图平均路径长度仍与原始图有较大的的差异。原因在于两个算法都是通过对节点的邻居列表进行扰动来合成生成图,然而这样会产生更多细粒度的噪声,以至于生成更多的边使得生成图密集从而导致节点的平均路径长度较短。

图4 不同隐私预算下平均路径长度的变化
Fig.4 Change of average path length under different privacy budgets

5 结束语

本文针对本地化差分隐私中直接扰动邻居列表的图生成算法RNL隐私保护程度不均衡和引入过量噪声导致数据可用性差的问题,提出了一种满足个性化差分隐私的社交网络图生成算法(GPDP)。首先对原始图进行社区划分,再根据不同社区的重要程度施加个性化扰动,通过将噪声注入社区的方法在一定程度上减少了噪声的添加量,提高了数据的可用性。通过在多个真实数据集上的实验表明,本文算法在保护了数据隐私的同时保留了原始图更多的社区拓扑结构信息。但此方法在较大型数据集上实验得到的生成图仍会比原始图更加密集导致节点平均路径长度较短,效率有待进一步优化。

参考文献:

[1] 刘文斌,李佳龙,徐双,等.大数据背景下的数据安全治理研究进展[J/OL].太原理工大学学报,2013:1-21[2023-08-19].http:∥kns.cnki.net/kcms/detail/14.1220.N.20230726.1542.002.html.

LIU W B,LI J L,XU S,et al.Research progress on data security governance under the background of big data[J/OL].Journal of Taiyuan University of Technology,2023:1-21[2023-08-19].https:∥kns.cnki.net/kcms2/detail/14.1220.N.20230726.1542.002.html

[2] DWORK C.Differential privacy[C]∥Automata,Languages and Programming: 33rd International Colloquium,ICALP 2006,Venice,Italy,July 10-14,2006,Proceedings,Part II 33.Springer Berlin Heidelberg,2006:1-12.

[3] JIANG H,PEI J,YU D,et al.Applications of differential privacy in social network analysis:A survey[J].IEEE Transactions on Knowledge and Data Engineering,2021,35(1):108-127.

[4] HAY M,LI C,MIKLAU G,et al.Accurate estimation of the degree distribution of private networks[C]∥2009 Ninth IEEE International Conference on Data Mining.IEEE,2009:169-178.

[5] LIU P,XU Y X,JIANG Q,et al.Local differential privacy for social network publishing[J].Neurocomputing,2020,391:273-279.

[6] YE Q,HU H,AU M H,et al.LF-GDPR:A framework for estimating graph metrics with local differential privacy[J].IEEE Transactions on Knowledge and Data Engineering,2020,34(10):4905-4920.

[7] YUAN Q,ZHANG Z,DU L,et al.PrivGraph:differentially private graph data publication by exploiting community information[EB/OL].arXiv preprint arXiv,2023:2404.02401.[2023-06-18].https:∥arxiv.org/pdf/2304.02401.pdf.

[8] QIN Z,YU T,YANG Y,et al.Generating synthetic decentralized social graphs with local differential privacy[C]∥Proceedings of the 2017 ACM SIGSAC Conference on Computer and Communications Security,2017:425-438.

[9] ZHANG Y,WEI J,ZHANG X,et al.A two-phase algorithm for generating synthetic graph under local differential privacy[C]∥Proceedings of the 8th International Conference on Communication and Network Security,2018:84-89.

[10] HUANG H,ZHANG D,XIAO F,et al.Privacy-preserving approach PBCN in social network with differential privacy[J].IEEE Transactions on Network and Service Management,2020,17(2):931-945.

[11] ZHANG S,NI W,FU N.Community preserved social graph publishing with node differential privacy[C]∥2020 IEEE International Conference on Data Mining (ICDM).IEEE,2020:1400-1405.

[12] 周楠楠,龙士工,刘海.满足差分隐私dk序列合成图发布[J].计算机研究,2023,40(5):1528-1534.

[13] GAO T,LI F.Protecting social network with differential privacy under novel graph model[J].IEEE Access,2020,8:185276-185289.

[14] KANG H,JI Y,ZHANG S.Enhanced privacy preserving for social networks relational data based on personalized differential privacy[J].Chinese Journal of Electronics,2022,31(4):741-751.

[15] KARWA V,RASKHODNIKOVA S,SMITH A,et al.Private analysis of graph structure[J].Proceedings of the VLDB Endowment,2011,4(11):1146-1157.

[16] FORTUNATO S.Community detection in graphs[J].Physics reports,2010,486(3-5):75-174.

[17] NEWMAN M E J.Fast algorithm for detecting community structure in networks[J].Physical review E,2004,69(6):066133.

[18] BLONDEL V D,GUILLAUME J L,LAMBIOTTE R,et al.Fast unfolding of communities in large networks[J].Journal of Statistical Mechanics:Theory and Experiment,2008,10008:1-12.

[19] 叶青青,孟小峰,朱敏杰,等.本地化差分隐私研究综述[J].软件学报,2018,29(7):1981-2005.

[20] WANG T,BLOCKI J,LI N,et al.Locally differentially private protocols for frequency estimation[C]∥26th USENIX Security Symposium (USENIX Security 17),2017:729-745.

(编辑:薄小玲)

Baidu
map