技术实现的要素:
本发明实施例的目的在于提供一种挖掘微博用户潜在特征的方法和装置,能够有效挖掘微博用户的潜在特征,从而为分析网络关系或推送相关信息提供有效依据。
为了实现上述目的,本发明实施例提供了一种挖掘微博用户潜在特征的方法,包括以下步骤:
收集微博用户的数据;
根据微博用户的数据获取微博用户的固有属性,所述固有属性包括年龄、性别、居住地和认证信息;
根据微博用户的数据获取微博用户的行为属性,所述行为属性包括评论、喜欢和转发;
根据微博用户的固有属性和行为属性,获取微博用户的潜在特征。
与现有技术相比,本发明通过收集微博用户的数据,根据数据获取微博用户的固有属性,根据数据获取微博用户的行为属性,其中行为属性包括评论、喜欢和转发,根据微博用户的固有属性和行为属性获取微博用户的潜在特征,能够有效挖掘微博用户的潜在特征
作为上述方案的改进,潜在特征包括兴趣和职业。
作为上述方案的改进,收集微博用户的数据具体包括利用大规模并行技术收集微博用户的数据。
作为上述方案的改进,收集微博用户数据具体包括:
接收微博用户的大量数据,将微博用户的数据分发到多台服务器,进入消息队列系统后快速写入硬盘存储备份,解决了数据消耗差的问题。它不仅可以快速接收海量数据,还可以保证数据的完整性。系统用于存储和备份,数据更加可靠。
本发明实施例还提供了一种挖掘微博用户潜在特征的装置,包括:
采集模块,用于采集微博用户的数据;
固有属性获取模块,用于根据微博用户的数据获取微博用户的固有属性,所述固有属性包括年龄、性别、居住地和认证信息;
行为属性获取模块,用于根据微博用户的数据获取微博用户的行为属性,所述行为属性包括评论、喜欢和转发;
潜在特征获取模块,用于根据微博用户的固有属性和行为属性获取微博用户的潜在特征。
与现有技术相比,本发明的挖掘微博用户潜在特征的装置首先通过采集模块采集微博用户的数据,然后通过固有属性采集模块根据微博用户的数据采集微博用户的固有属性,再通过行为属性采集模块根据微博用户的数据采集微博用户的行为属性,行为属性包括评论、喜欢和转发,然后, 潜在特征获取模块根据微博用户的固有属性和行为属性获取微博用户的潜在特征,可以有效挖掘微博用户的潜在特征,为分析网络关系或推送相关信息提供有效依据。
作为上述方案的改进,潜在特征包括兴趣和职业。
作为上述方案的改进,收集模块专门用于利用大规模并行技术收集微博用户的数据。
作为上述方案的改进,采集模块具体用于接收微博用户的大量数据,并将微博用户的数据分发到多个服务器,进入消息队列系统后,快速写入硬盘存储备份。
附图简述
图1是本发明实施例中挖掘微博用户潜在特征的方法流程图。
图2是本发明实施例中挖掘微博用户潜在特征的装置的结构示意图。
限定词
将参照本发明实施例中的附图,清楚完整地描述本发明实施例中的技术方案。显然,所描述的实施例仅仅是本发明实施例的一部分,而不是全部。基于本发明的实施例,本领域普通技术人员在没有创造性劳动的情况下获得的所有其他实施例都属于本发明的保护范围。
参见图1,本发明实施例一提供的挖掘微博用户潜在特征的方法流程图,包括以下步骤:
S1,收集微博用户数据;
其中,可以利用大规模并行技术收集微博用户的数据,有利于快速接收海量数据。
S2,根据微博用户的数据获取微博用户的固有属性,所述固有属性包括年龄、性别、居住地和认证信息;
S3,根据微博用户的数据获取微博用户的行为属性,所述行为属性包括评论、喜欢和转发;
S4,根据微博用户的固有属性和行为属性,获取微博用户的潜在特征。
其中潜在特征包括兴趣和职业。
在具体实现中,首先收集微博用户的数据,然后根据这些数据获取微博用户的固有属性,再根据这些数据获取微博用户的行为属性,包括评论、喜欢和转发,然后根据微博用户的固有属性和行为属性获取微博用户的潜在特征,可以有效挖掘微博用户的潜在特征,从而为分析网络关系或推送相关信息提供有效依据。
优选地,收集微博用户的数据具体包括:
接收微博用户的大量数据,将微博用户的数据分发到多个服务器,进入消息队列系统后,快速写入硬盘存储备份。
通过上述方案,解决了数据消耗差的问题,可以快速接收海量数据,保证数据的完整性。系统用于存储和备份,数据更加可靠。
参见图2,是本发明实施例二提供的挖掘微博用户潜在特征的装置的结构示意图,包括:
收集模块101,用于收集微博用户的数据;
固有属性获取模块102,用于根据微博用户的数据获取微博用户的固有属性,所述固有属性包括年龄、性别、居住地和认证信息;
行为属性获取模块103,用于根据微博用户的数据获取微博用户的行为属性,行为属性包括评论、喜欢和转发;
潜在特征获取模块104,用于根据微博用户的固有属性和行为属性获取微博用户的潜在特征。
其中潜在特征包括兴趣和职业。
在具体实现中,通过采集模块采集微博用户的数据,然后通过内在属性采集模块采集微博用户的内在属性;然后行为属性获取模块根据微博用户的数据获取微博用户的行为属性,包括评论、喜欢和转发;然后潜在特征获取模块根据微博用户的固有属性和行为属性获取微博用户的潜在特征,可以有效挖掘微博用户的潜在特征
在优选实施例中,收集模块101具体用于利用大规模并行技术收集微博用户的数据。
在一个优选实施例中,收集模块专门用于接收大量微博用户的数据,将微博用户的数据分发到多个服务器,进入消息队列系统后快速写入硬盘存储备份,解决了数据消耗差的问题。它不仅可以快速接收海量数据,还可以保证数据的完整性。系统用于存储和备份,数据更加可靠。
综上所述,本发明实施例公开了一种挖掘微博用户潜在特征的方法,通过收集微博用户的数据,根据微博用户的数据获取微博用户的固有属性,获取微博用户的行为属性,包括评论、喜欢和转发,根据微博用户的固有属性和行为属性获取微博用户的潜在特征,可以有效挖掘微博用户的潜在特征
以上是本发明的优选实施例,应当指出的是,对于技术领域的普通技术人员来说,在不脱离本发明原理的情况下,可以进行多种改进和修饰,这些改进和修饰也视为本发明的保护范围。
相关阅读
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除
标签: #一种热门事件的挖掘方法及装置