12

发表于2021-03-20|更新于2021-04-22|pytorch

|总字数:425|阅读时长:1分钟|浏览量:

3.4 – 保存和恢复模型

训练好了一个模型, 我们当然想要保存它, 留到下次要用的时候直接提取直接用, 这就是这节的内容啦. 我们用回归的神经网络举例实现保存提取.

保存

我们快速地建造数据, 搭建网络:

torch.manual_seed(1)    # reproducible

# 假数据
x = torch.unsqueeze(torch.linspace(-1, 1, 100), dim=1)  # x data (tensor), shape=(100, 1)
y = x.pow(2)   0.2*torch.rand(x.size())  # noisy y data (tensor), shape=(100, 1)
x, y = Variable(x, requires_grad=False), Variable(y, requires_grad=False)

def save():
    # 建网络
    net1 = torch.nn.Sequential(
        torch.nn.Linear(1, 10),
        torch.nn.ReLU(),
        torch.nn.Linear(10, 1)
    )
    optimizer = torch.optim.SGD(net1.parameters(), lr=0.5)
    loss_func = torch.nn.MSELoss()

    # 训练
    for t in range(100):
        prediction = net1(x)
        loss = loss_func(prediction, y)
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

接下来我们有两种途径来保存

1 2	torch.save(net1, \'net.pkl\') # 保存整个网络 torch.save(net1.state_dict(), \'net_params.pkl\') # 只保存网络中的参数 (速度快, 占内存少)

提取网络

这种方式将会提取整个神经网络, 网络大的时候可能会比较慢.

def restore_net():
    # restore entire net1 to net2
    net2 = torch.load(\'net.pkl\')
    prediction = net2(x)

只提取网络参数

这种方式将会提取所有的参数, 然后再放到你的新建网络中.

def restore_params():
    # 新建 net3
    net3 = torch.nn.Sequential(
        torch.nn.Linear(1, 10),
        torch.nn.ReLU(),
        torch.nn.Linear(10, 1)
    )

    # 将保存的参数复制到 net3
    net3.load_state_dict(torch.load(\'net_params.pkl\'))
    prediction = net3(x)

显示结果

调用上面建立的几个功能, 然后出图.

这样我们就能看出三个网络完全一模一样啦.

所以这也就是在我 github 代码中的每一步的意义啦.

文章来源：莫烦

文章作者: Estom

文章链接: https://estom.github.io/2021/03/20/pytorch/%E5%85%B6%E4%BB%96%E6%95%99%E7%A8%8B/12/

版权声明: 本博客所有文章除特别声明外，均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Estom的博客！

实现功能可能

相关推荐

3 结构型设计模式

Structural Patterns（结构型模式）1 概述目标结构型模式涉及到如何组合类和对象以获得更大的结构。结构型类模式采用继承机制来组合接口实现。结构型对象模式不是对接口和实现进行组合，而是描述了如何对一些对象进行组合，从而实现新功能的一些方法。因为可以在运行时改变对象组合关系，所以对象组合方式具有更大的灵活性，而这种机制用静态组合是不可能实现的。 Adapter（适配器）将一个类的接口转换成客户希望的另外一个接口。 Adapter 模式使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。 Bridge（桥接）将抽象部分与它的实现部分分离，使它们都可以独立地变化。 Composite（组合）将对象组合成树形结构以表示 “部分-整体” 的层次结构。 Composite 使得用户对于单个对象和组合对象的使用具有一致性。 Decorator（装饰）动态地给一个对象添加一些额外的职责。就增加功能来说，Decorator 模式相比生成子类更为灵活。 Facade（外观）为子系统中的一组接口提供一个一致的界面。 Facade 模式定义了一个高...

2.2. 流形学习校验者: @XuJianzhi @RyanZhiNie @羊三 @Loopy @barrycg翻译者: @XuJianzhi @羊三 Look for the bare necessities The simple bare necessities Forget about your worries and your strife I mean the bare necessitiesOld Mother Nature’s recipes That bring the bare necessities of life – Baloo的歌 [奇幻森林] 流形学习是一种非线性降维方法。其算法基于的思想是：许多数据集维度过高的现象完全是人为导致得。 2.2.1. 介绍高维数据集通常难以可视化。虽然,可以通过绘制两维或三维的数据来...

简介Spring是轻量级企业级解决方案，可以基于Java Spring解决Java EE的所有问题。特性IOC容器（控制反转）通过控制反转，对象在被创建的时候，由一个调控系统内所有对象的外界实体将其所依赖的对象的引用传递给它。也可以说，依赖被注入到对象中。 IoC是一个很大的概念,可以用不同的方式实现。其主要形式有两种：依赖查找：容器提供回调接口和上下文条件给组件。EJB和Apache Avalon 都使用这种方式。这样一来，组件就必须使用容器提供的API来查找资源和协作对象，仅有的控制反转只体现在那些回调方法上（也就是上面所说的类型1）：容器将调用这些回调方法，从而让应用代码获得相关资源。依赖注入：组件不做定位查询，只提供普通的Java方法让容器去决定依赖关系。容器全权负责的组件的装配，它会把符合依赖关系的对象通过JavaBean属性或者构造函数传递给需要的对象。通过JavaBean属性注射依赖关系的做法称为设值方法注入(Setter Injection)；将依赖关系作为构造函数参数传入的做法称为构造器注入（Constructor Injection）Spring 的 Io...

复制0 概述Redis中，用户可以执行saveof命令或设置saveof选项，让一个服务器去复制（replicate）另一个服务器。被复制的服务器叫做master，对master进行复制的服务器叫做slave。进行复制中的master和slave应该保存相同的数据，这称作“数据库状态一致”。一个从服务器只能有一个主服务器，并且不支持主主复制。 1 旧版复制功能的实现Redis的复制功能分为同步（sync）和命令传播（command propagate）两个操作：同步用于将slave的数据库状态更新至master当前所处的数据库状态。命令传播用于master的数据块状态被修改，导致和lsave的数据库状态不一致时，让两者的数据库重回一致状态。同步复制开始时，slave会先执行同步操作，步骤如下： slave对master发送SYNC命令 master收到SYNC执行BGSAVE，在后台生成一个RDB文件，并使用一个缓冲区记录从现在开始执行的所有写命令。 master的BGSAVE执行完毕后，将生成的RDB文件发送给slave，slave接收并载入这个RDB，更新自己...

gpm提供文字模式下的滑鼠事件处理补充说明gpm命令是Linux的虚拟控制台下的鼠标服务器，用于在虚拟控制台下实现鼠标复制和粘贴文本的功能。语法1gpm(选项) 选项12345-a：设置加速值；-b：设置波特率；-B：设置鼠标按键次序；-m：指定鼠标设备文件；-t：设置鼠标类型。

统计函数实现概率论和数理统计相关的功能

数据加载中