2 GraphEmbedding

发表于2022-01-07|更新于2024-05-28|机器学习

|总字数:445|阅读时长:1分钟|浏览量:

图嵌入

0 引言

概述

在图上进行每一个节点的embedding，最终得到的结果是图上每一个节点的嵌入表示。这里主要通过无监督的方法实现embedding的过程。主要包括五种传统算法

Deepwalk
LINE
SDNE
node2vec
struct2vec

作用

n维onehot向量表示图上的每一个节点。有多少个节点，就有多少onehot向量。如果节点的数量比较多，那么n的维度就会比较大。

代码

https://github.com/shenweichen/GraphEmbedding

1 deepwalk

对每一个节点进行多次随机游走得到一系列语义信息。
w表示前后照顾的节点的数量、d表示嵌入后向量的维度、$\gamma$表示迭代的次数、t表示行走的步长
嵌入的维度为d=2的时候，就可以进行二维可视化了。如下所示，通过嵌入后的二维向量可是话，能够得到点的距离关系，相当于利用了图特征。

2 LINE

基于以下两个原理：
- 节点相互连接，并且相互连接的节点之间的权重很大，具有很高的相似性。
- 节点的邻居如果很相似的话，那么这两个节点即使不连接，那么他们也非常相似。
同时使用了一阶相似度和二阶相似度。

3 node2vec

同质性：节点和周围节点的是非常相似的。
结构等价性：结构等价性
有策略的随机游走。根据概率进行随机游走，选择游走序列。

4 struct2vec

这个可以以后再学，有点复杂。而且大概率用不到。

能够捕捉不相邻节点的同构信息。

5 SDNE

使用deeplearning的方式训练节点的embedding

文章作者: Estom

文章链接: https://estom.github.io/2022/01/07/%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0/%E8%87%AA%E5%AD%A6%E7%AC%94%E8%AE%B0/%E5%9B%BE%E8%A1%A8%E7%A4%BA%E5%AD%A6%E4%B9%A0/2%20GraphEmbedding/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Estom的博客！

使用实现节点

相关推荐

意图给定一个语言，定义它的文法的一种表示，并定义一个解释器，这个解释器使用该表示来解释语言中的句子。 Given a language, define a represention for its grammar along with aninterpreter that uses the representation to interpret sentences in the language. 结构参与者 AbstractExpression 声明一个抽象的解释操作，这个接口为抽象语法树中所有的节点所共享。 TerminalExpression 实现与文法中的终结符相关联的解释操作。一个句子中的每一个终结符需要该类的一个实例。 NonterminalExpression 对文法中的规则的解释操作。 Context 包含解释器之外的一些全局信息。 Client 构建表示该语法定义的语言中一个特定的句子的抽象语法树。调用解释操作适用性当有个语言需要解释执行，并且你可将该语言中的句子表示为一个抽象语法树时，可以使用Interpreter 模...

分支限界1 概述基本思想在分支限界法中，每一个活结点只有一次机会成为扩展结点。活结点一旦成为扩展结点，就一次性产生其所有儿子结点。在这些儿子结点中，导致不可行解或导致非最优解的儿子结点被舍弃，其余儿子结点被加入活结点表中。此后，从活结点表中取下一结点成为当前扩展结点，并重复上述结点扩展过程。这个过程一直持续到找到所需的解或活结点表为空时为止。常见的两种分支界限法队列式(FIFO)分支限界法：按照队列先进先出（FIFO）原则选取下一个节点为扩展节点。优先队列式分支限界法：按照优先队列中规定的优先级选取优先级最高的节点成为当前扩展节点。使用条件问题的多米诺性质叶子节点的解一定满足其父节点。叶子结点为真则父节点一定为真。同理父节点为假则叶子结点一定为假（逆否命题）。用父节点为假的情况进行剪枝操作。求解最优解或一个可行解设计要素针对问题定义解空间问题解向量解向量分量取值集合构造解空间树判断是否满足多米诺性质确定剪枝函数确定存储搜索路径的数据结构分支限界发的核心思想在于界的设计分支限界法的程序结构队列+循环的方法 2 分治限界实现...

1 概述构建阶段工作流程 2 使用流程安装kubebuilder12brew install kubebuilderkubebuilder version 创建工程初始化一个项目目录 123mkdir -p $GOPATH/src/ykl.com/customer-controller/go mod init contollers.happyhacker.io 定义crd所属的domain，生成一个工程.定义 crd 所属的 domain，这个指令会帮助你生成一个工程。 1kubebuilder init --domain estom.com --license apache2 --owner "Estom" 创建后的目录结构如下: cmd目录下是启动脚本，编译后会在bin目录下生成manage可执行文件 config目录下是基础工程配置。 1234567891011121314151617181920212223242526272829303132.├── Dockerfile├── Makefile├── PROJECT├── READ...

Scala Trait(特征)Scala Trait(特征) 相当于 Java 的接口，实际上它比接口还功能强大。与接口不同的是，它还可以定义属性和方法的实现。一般情况下Scala的类只能够继承单一父类，但是如果是 Trait(特征) 的话就可以继承多个，从结果来看就是实现了多重继承。 Trait(特征) 定义的方式与类类似，但它使用的关键字是 trait，如下所示： trait Equal { def isEqual(x: Any): Boolean def isNotEqual(x: Any): Boolean = !isEqual(x)}以上Trait(特征)由两个方法组成：isEqual 和 isNotEqual。isEqual 方法没有定义方法的实现，isNotEqual定义了方法的实现。子类继承特征可以实现未被实现的方法。所以其实 Scala Trait(特征)更像 Java 的抽象类。以下演示了特征的完整实例： /* 文件名：Test.scala author:菜鸟教程 url:www.runoob.com */trait ...

4.3 – RNN 循环神经网络 (回归 Regression)循环神经网络让神经网络有了记忆, 对于序列话的数据,循环神经网络能达到更好的效果. 如果你对循环神经网络还没有特别了解, 请观看几分钟的短动画,RNN 动画简介（如下）和 LSTM（如下）动画简介能让你生动理解 RNN. 上次我们提到了用 RNN 的最后一个时间点输出来判断之前看到的图片属于哪一类, 这次我们来真的了, 用 RNN 来及时预测时间序列. RNN 简介LSTM 简介训练数据我们要用到的数据就是这样的一些数据, 我们想要用 sin 的曲线预测出 cos 的曲线. 12345678910111213import torchfrom torch import nnfrom torch.autograd import Variableimport numpy as npimport matplotlib.pyplot as plttorch.manual_seed(1) # reproducible# Hyper ParametersTIME_STEP = 10 # rnn time...

06 JUC并发容器

2 J.U.C -并发容器并发集合是指使用了最新并发能力的集合，在JUC包下。而同步集合指之前用同步锁实现的集合。其对应的基础集合类的接口并没有发生太大变化，主要是针对并发场景进行优化，使用各种方式保证并发集合的安全性。 1 CopyOnWriteCopyOnWriteArrayListCopyOnWriteArrayList在写的时候会复制一个副本，对副本写，写完用副本替换原值，读的时候不需要同步，适用于写少读多的场合。 CopyOnWriteArraySet基于CopyOnWriteArrayList来实现的，只是在不允许存在重复的对象这个特性上遍历处理了一下。读写分离写操作在一个复制的数组上进行，读操作还是在原始数组中进行，读写分离，互不影响。写操作需要加锁，防止并发写入时导致写入数据丢失。写操作结束之后需要把原始数组指向新的复制数组。 123456789101112131415161718public boolean add(E e) { final ReentrantLock lock = this.lock; lock.lock(); ...

数据加载中