6文本处理
发表于|更新于|Python
|总字数:61|阅读时长:1分钟|浏览量:
常见字符串操作
re正则表达式操作
difflib — 计算差异的辅助工具
textwrap — 文本自动换行与填充
unicodedata — Unicode 数据库
stringprep — 因特网字符串预备
readline — GNU readline 接口
rlcompleter — GNU readline 的补全函数
文章作者: Estom
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Estom的博客!
相关推荐

2020-09-26
dsintro
数据结构简介本节介绍 Pandas 基础数据结构,包括各类对象的数据类型、索引、轴标记、对齐等基础操作。首先,导入 NumPy 和 Pandas: 123In [1]: import numpy as npIn [2]: import pandas as pd “数据对齐是内在的”,这一原则是根本。除非显式指定,Pandas 不会断开标签和数据之间的连接。 下文先简单介绍数据结构,然后再分门别类介绍每种功能与方法。 SeriesSeries 是带标签的一维数组,可存储整数、浮点数、字符串、Python 对象等类型的数据。轴标签统称为索引。调用 pd.Series 函数即可创建 Series: 1>>> s = pd.Series(data, index=index) 上述代码中,data 支持以下数据类型: Python 字典 多维数组 标量值(如,5) index 是轴标签列表。不同数据可分为以下几种情况: 多维数组 data 是多维数组时,index 长度必须与 data 长度一致。没有指定 index 参数时,创建数值型索引,即 [0, ..., ...

2021-09-02
atomic
概述为了保证并发安全,除了使用临界区之外,还可以使用原子操作。顾名思义这类操作满足原子性,其执行过程不能被中断,这也就保证了同一时刻一个线程的执行不会被其他线程中断,也保证了多线程下数据操作的一致性。 在atomic包中对几种基础类型提供了原子操作,包括int32,int64,uint32,uint64,uintptr,unsafe.Pointer。对于每一种类型,提供了五类原子操作分别是 Add, 增加和减少 CompareAndSwap, 比较并交换 Swap, 交换 Load , 读取 Store, 存储 具体函数名由原子操作名和类型关键字组成,例如对于int32的Add操作,函数名为AddInt32,其他函数名以此类推,后文中仅以int32类型系列函数为例进行说明,其他类型函数功能类似。 AddInt32AddInt32可以实现对元素的原子增加或减少,其函数定义如下,函数接收两个参数,分别是需要修改的变量的地址和修改的差值,函数会直接在传递的地址上进行修改操作,此外函数会返回修改之后的新值:...

2022-02-23
2 模型
消息传递网络1 原理Message Passing 是图网络中学习 node embedding 的重要方法。 公式$$\mathbf{x}_i^{(k)} = \gamma^{(k)} \left( \mathbf{x}i^{(k-1)}, \square{j \in \mathcal{N} (i)} , \phi^{(k)}\left(\mathbf{x}_i^{(k-1)}, \mathbf{x}j^{(k-1)},\mathbf{ e}{j,i}\right) \right),$$ x 表示表格节点的 embedding,e 表示边的特征,ϕ 表示 message 函数,□ 表示聚合 aggregation 函数,γ 表示 update 函数。上标表示层的 index,比如说,当 k = 1 时,x 则表示所有输入网络的图结构的数据。 函数 propagate(edge_index, size=None, **kwargs)这个函数最终会调用 message 和 update 函数。 message(**kwargs)这个函数定义了对于每个...

2021-03-08
TensorFlow-code architecture
http://www.360doc.com/content/17/0220/19/39202731_630623149.shtml TF系统依赖TF托管在github平台,有google groups和contributors共同维护。 TF提供了丰富的深度学习相关的API,支持Python和C/C++接口。 TF提供了可视化分析工具Tensorboard,方便分析和调整模型。 TF支持Linux平台,Windows平台,Mac平台,甚至手机移动设备等各种平台 TF的系统架构第一层设备通信层负责网络通信和设备管理。设备管理可以实现TF设备异构的特性,支持CPU、GPU、Mobile等不同设备。网络通信依赖gRPC通信协议实现不同设备间的数据传输和更新。 第二层是Tensor的OpKernels实现。这些OpKernels以Tensor为处理对象,依赖网络通信和设备内存分配,实现了各种Tensor操作或计算。Opkernels不仅包含MatMul等计算操作,还包含Queue等非计算操作,这些将在第5章Kernels模块详细介绍。 第三层是图计算层(Graph),包含本地计...

2021-04-11
7 处理继承关系
7 处理继承关系1 Pull Up Field(字段上移)如果两个子类有相同的字段,则将该字段上移至超类中。 2 Pull Up Method(函数上移)如果两个子类有相同的函数而且产生完全相同的结果,则将该函数上移至超类。 3 Extract Superclass(提炼超类)如果两个类有相似特性,可以为这两个类建立一个超类,将相同特性移至超类。如果继承不合适,可以使用[Extract Class](#Extract Class)来提取重复代码。 4 Form Template Method(塑造模板函数)该重构的手法其实就是设计模式中的模板模式,如果有一些子类,其中对应的某些函数以相同顺序执行类似的操作,但在各个操作的细节上有所不同。可以将这些操作分别放到独立的函数中,替换在原函数中原有的操作代码,并上移至超类。 重构示例2212345678910111213141516171819202122232425262728// 重构前class Site {public: virtual double GetBillableAmount() = 0; /...

2022-04-18
09 特殊函数
匿名函数JavaScript 可以将函数作为数据使用。作为函数本体,它像普通的数据一样,不一定要有名字。默认名字的函数被称之为匿名函数。 如下示例: 1function (a){return a;} 匿名函数的两种用法: 可以将匿名函数作为参数传递给其他函数。这样,接收方函数就能利用所传递的函数来完成某些事情。 可以定义某个匿名函数来执行某些一次性任务。 自调函数所谓自调函数就是在定义函数后自行调用。如下示例: 123(function(){ alert("javascript");})(); 上述代码的含义如下: 第一对括号,放置的是一个匿名函数。 第二对括号的作用,是“立即调用”。 自调函数只需将匿名函数的定义放进一对括号中,然后外面再跟一对括号即可。 自调函数也可以在调用时接收参数,如下示例: 123(function(name){ alert("hello " + name + "!");})("javascript"...
公告
欢迎参观Estom的小屋



