应用场景
- 安全风控:风险控制(团伙挖掘、行为图)
- 实时推荐
- 知识图谱、企业图谱
- 智能运维
- 数据血缘
团伙挖掘
- 如何将业务经验抽象成Graph
- 经典社区发现算法
Spark GraphX中算法介绍
1 | 图计算的场景 |
1. 数三角形
TriangleCount用于统计每个顶点所在的三角形个数
2. PageRank
PageRank是谷歌提出的用于解决链接分析中网页排名问题的算法,目的是为了对互联网中数以亿计的网页进行排名。
3. LabelProgagation
社区发现、节点预测(分类预测、标签预测)、
LPA、MLPA
4. 最短路径
5. 连通分量 ConnectedComponents
6. 强连通分量 StronglyConnectedComponents
基于Spark Grahpx+Neo4j 实现用户社群发现
大数据——Spark GraphX中算法介绍