一种在线社交网络中朋友关系预测的方法
在线游戏社交互动性强,增进朋友关系 #生活乐趣# #网络游戏#
一种在线社交网络中朋友关系预测的方法
【专利摘要】本发明涉及一种在线社交网络中朋友关系预测的方法,该具体过程为:基于社交网站提供的API接口采集用户在社交网络上的签到数据及朋友关系;根据采集的数据提取特征来表征用户之间的关系,选取信息增益最大的三个特征来表征用户之间的朋友关系;按城市选取社交网络中在的所有在该城市有签到数据及有签到数据的用户的朋友关系作为训练数据,将朋友关系数据和非朋友关系数据比例定为1∶3,按选取的三个特征采用分类算法建立朋友关系模型;选取要预测用户的签到和朋友关系数据作为测试数据,对选取的每个用户,预测其与测试数据中其他所有用户之间的关系。本发明使得预测效果更接近用户的客观实际情况,有效的提高朋友关系预测的正确率。
【专利说明】一种在线社交网络中朋友关系预测的方法
【技术领域】
[0001]本发明涉及社会计算【技术领域】,尤其涉及一种在线社交网络中朋友关系预测的方法。
【背景技术】
[0002]近年来社交网络得到了迅猛的发展,人们对信息的获取和消息的传递开始变得越来越依赖于网络,用户可以通过分享新闻、日志、视频、音乐及相片等方法,维持和开拓人际关系。在线社交网络是虚拟和现实的结合,人们在现实生活中的行为和他们在社交网络中的行为有很大程度的相似性,这些行为相似的并且在地理上相距比较近的人更有可能成为朋友。
[0003]在线社交网络基于六度分割理论运作,即你和任何一个陌生人之间所间隔的人不会超过六个,也就是说,最多通过六个人你就能够认识任何一个陌生人。这就是六度分割理论,也叫小世界理论。每个个体的社交圈不断放大,最后形成一个大型的社交拓扑网络。
[0004]专利200610157496.9提出了一种社交网络社区的推荐朋友的方法,但其没有考虑用户的社交圈子以及用户之间的距离。专利200910213921.5只公开了社交网络中社区推荐异性朋友的方法,其只考虑了用户的特征信息,没有用户的行为信息。专利200810009403.7提出了社会网络的竞争性朋友排名的方法,强调朋友之间的互动,忽略了用户本身的行为和地域等信息。
[0005]鉴于上述缺陷,本发明创作者经过长时间的研究和实践终于获得了本创作。
【发明内容】
[0006]本发明的目的在于提供一种在线社交网络中朋友关系预测的方法,用以克服上述技术缺陷。
[0007]为实现上述目的,本发明提供一种在线社交网络中朋友关系预测的方法,该具体过程为:
[0008]步骤101,基于社交网站提供的API接口采集用户在社交网络上的签到数据及朋友关系;
[0009]步骤102,根据采集的数据提取特征来表征用户之间的关系,以信息增益为标准,衡量选取特征的信息含量,选取信息增益最大的三个特征来表征用户之间的朋友关系;
[0010]步骤103,按城市选取社交网络中在的所有在该城市有签到数据及有签到数据的用户的朋友关系作为训练数据,将朋友关系数据和非朋友关系数据比例定为1: 3,按选取的三个特征采用分类算法建立朋友关系模型;
[0011]步骤104,选取要预测用户的签到和朋友关系数据作为测试数据,对选取的每个用户,预测其与测试数据中其他所有用户之间的关系。
[0012]进一步,上述步骤102中选取用户社交拓扑、用户签到地点类型和用户签到地点三个特征;上述特征的具体计算方法如下:[0013]定义社交网络Gs (Us,Es),节点Us表示用户,假定Gs为完全图,若两用户Ui,Uj是朋友,则用一条朋友边连接;若他们为非朋友,则用一条非朋友边连接,当去掉用户Ui,+.之间的朋友边后,他们之间即为非朋友边,非朋友边不能被删除。
[0014]进一步,所述用户社交网络的计算方法如下:
[0015]在社交网Gs中,去掉社交网Gs中用户i和用户j之间的朋友边,用户i和用户j拓扑网络中的最短距离即为他们在用户拓扑网络中的社交距离;若用户之间为朋友边,则其距离为1,否则为无穷大;在计算用户i和用户j社交距离之前,若用户i和用户j之间为朋友边则先在社交网Gs中删除该边,若为非朋友边则直接计算;
[0016]设用户i和用户j之间的用户边在社交网络结构中的社交距离为属性as,其计算方法如公式I所示;
[0017]as(i, j) =shortest_dis tan ce (Ui, Uj) inG' s (Us, Es-Gij) (I)
[0018]最短距离的计算方法可采用Dijkstra算法或Floyd算法。
[0019]进一步,所述用户签到地点类型的计算方法如下:
[0020]定义用户Ui签到地点类型为i,每个地点签到的次数分别为(cn,ci2,......,ciN),
总的签到次数为Ci,设共有L个用户,每个用户在地点i签到的次数为(Tn,Ti2......,TiL),
定义用户k在地点tik,签到的概率为p(k);引入地点信息熵的概念,定义如公式2所示,
【权利要求】
1.一种在线社交网络中朋友关系预测的方法,其特征在于,该具体过程为: 步骤101,基于社交网站提供的API接口采集用户在社交网络上的签到数据及朋友关系; 步骤102,根据采集的数据提取特征来表征用户之间的关系,以信息增益为标准,衡量选取特征的信息含量,选取信息增益最大的三个特征来表征用户之间的朋友关系; 步骤103,按城市选取社交网络中在的所有在该城市有签到数据及有签到数据的用户的朋友关系作为训练数据,将朋友关系数据和非朋友关系数据比例定为1: 3,按选取的三个特征采用分类算法建立朋友关系模型; 步骤104,选取要预测用户的签到和朋友关系数据作为测试数据,对选取的每个用户,预测其与测试数据中其他所有用户之间的关系。
2.根据权利要求1所述的在线社交网络中朋友关系预测的方法,其特征在于,上述步骤102中选取用户社交拓扑、用户签到地点类型和用户签到地点三个特征;上述特征的具体计算方法如下: 定义社交网络Gs(Us,Es),节点us表示用户,假定Gs为完全图,若两用户Ui, +是朋友,则用一条朋友边连接;若他们为非朋友,则用一条非朋友边连接,当去掉用户Ui, +之间的朋友边后,他们之间即为非朋友边,非朋友边不能被删除。
3.根据权利要求 2所述的在线社交网络中朋友关系预测的方法,其特征在于,所述用户社交网络的计算方法如 下: 在社交网Gs中,去掉社交网Gs中用户i和用户j之间的朋友边,用户i和用户j拓扑网络中的最短距离即为他们在用户拓扑网络中的社交距离;若用户之间为朋友边,则其距离为1,否则为无穷大;在计算用户i和用户j社交距离之前,若用户i和用户j之间为朋友边则先在社交网Gs中删除该边,若为非朋友边则直接计算; 设用户i和用户j之间的用户边在社交网络结构中的社交距离为属性as,其计算方法如公式I所示;
4.根据权利要求2或3所述的在线社交网络中朋友关系预测的方法,其特征在于,所述用户签到地点类型的计算方法如下: 定义用户Ui签到地点类型为i,每个地点签到的次数分别为(cn,ci2......,ciN),总的签到次数为Ci,设共有L个用户,每个用户在地点i签到的次数为(Tn,Ti2......,TiJ,定义用户k在地点tik,签到的概率为p(k);引入地点信息熵的概念,定义如公式2所示, Eiti) = Yj-Pi(Ji)Xogp'^( 2 )
/=1 定义用户签到地点类型属性为at,用户在地点信息熵小的地方有共同签到的人更有可能成为朋友,如用户a的住宅,用户a签到的次数较多,其他用户签到次数较少,这个地点的地点信息熵小,为私密地点,若用户b也在该地点签到,则用户b很可能是用户a的朋友或者用户b成为用户a的朋友的概率更大; 则对每个用户i和用户j,其对应的用户关系有:
5.根据权利要求2或3所述的在线社交网络中朋友关系预测的方法,其特征在于,用户签到地点, 定义用户Ui签到的地点序列i,每个地点签到的次数分别为(cn,Ci2......,CiN),总的签到次数为CyDistaim, Ijn)表示用户i的第m个签到地点和用户j的第η个签到地点之间的距离;在距离相同时签到的次数越多成为朋友的可能性越大;如果两个用户经常签到地点相近则表明他们是邻居或在相同的地方工作,否则表明他们只是偶然碰见。
6.根据权利要求2所述的在线社交网络中朋友关系预测的方法,其特征在于,上述步骤101中,采集的数据有用户签到时间、签到地点及其类型、用户的朋友关系。
7.根据权利要求2所述的在线社交网络中朋友关系预测的方法,其特征在于,在上述步骤104中,对于要预测朋友关系的用户,选取其在社交网络上的签到时间、签到地点及其类型、用户的朋友关系;按选取的特征描述该用户与其他用户的关系,根据建立的朋友关系模型将这些特征描述的用户关系分成朋友关系与非朋友关系。
8.根据权利要求7所述的在线社交网络中朋友关系预测的方法,其特征在于,通过挖掘潜在的朋友关系建立朋友预测模型并进行测试验证,该具体过程为: 在已有的社交拓扑网络中先随机删除部分朋友边,然后根据删除朋友边后的社交拓扑网络计算边的特征属性值,将删除的朋友边数据以及随机选取的部分数据作为测试数据,随机选取一定的朋友边和非朋友边数据采用分类算法建立模型,根据模型对测试数据分类的结果检测模型挖掘社交拓扑网络中潜在朋友关系的性能。
9.根据权利要求7或8所述的在线社交网络中朋友关系预测的方法,其特征在于,通过交叉验证建立朋友预测模型并进行测试验证,该具体过程为: 以一个社交拓扑网络中的数据建立模型,以另一个社交拓扑网络中的数据做测试,然后反过来以作测试的社交拓扑网络为训练数据,以训练的社交拓扑网络为测试数据。
【文档编号】G06F17/30GK103795613SQ201410025336
【公开日】2014年5月14日 申请日期:2014年1月16日 优先权日:2014年1月16日
【发明者】郭斌, 於志文, 罗惠, 周兴社, 倪红波, 王柱 申请人:西北工业大学
网址:一种在线社交网络中朋友关系预测的方法 https://klqsh.com/news/view/159474
相关内容
“预制朋友圈”:一场社交生活中的自我记录之行八字看朋友关系
网络社交对大学生现实生活中人际关系的影响
朋友之间存在几种关系
最终,你还是要回到线下生活|研究:社交网络是你孤独的一个原因
扩大社交圈与结识优秀朋友的五种有效方法
中国语境下的饮食社交:从传统走向网络
在线免费制作人际关系网络的工具 – NRD Studio
建立有意义的社交网络:社群互动的重要性
扩大你的圈子:建立真正的朋友网络