-
NumPy学习笔记
欢迎访问我的GitHub
https://github.com/zq2599/blog_demos
内容:所有原创文章分类汇总及配套源码,涉及Java、Docker、Kubernetes、DevOPS等;
本篇概览
- 欣宸是个Java程序员,最近正在学习Python,本文记录了NumPy库的学习过程,主要用途是作为笔记来总结和温习,另外如果您也是一位初学者,希望本文能给您一些参考;
关于NumPy
- NumPy是Python的一个扩展程序库,支持多维度数组与矩阵计算,并且对数组运算提供了大量的数学函数库;
- 今天,咱们就通过实战来了解NumPy最常用的一些功能;
版本
操作系统:macOS Big Sur (11.6)
Anaconda3:2021.05
python:3.7.3
Jupyter Notebook:5.7.8
常规
import numpy as py
print(py.__version__)
- 结果如下:
- 用于生成array的数据源中如果有多种类型的元素,转成NumPy数组的时候,会统一成精度更高的元素
- NumPy数组有个dtype属性,用来描述数组中每个元素的类型:
- 还可以强转:
- 对于嵌套列表,转为NumPy数组后就是高维数组:
- 可以用NumPy的arange生成数组(注意是列表不是迭代器),arange的四个入参分别是:起始、截止、步长、类型:
- 如果知道了起始和截止值,以及均分的数量,那么arange就不合适了,因为它只知道间隔,不知道总数,此时用linspace方法更合适:
- 上述linspace方法的结果是左闭右闭区间,可以增加endpoint=False属性,将结果改成左闭右开区间,此时的其实就是均分成七份,返回前六个元素:
- zero方法也常用到,下面是生成3*4的二维数组,元素值全是零,注意参数是元组:
- 如果您觉得元组和括号和函数的括号放在一起不好理解,也可以用以下方式,既shape参数,这是个数组:
- ones方法,看名字就知道和zeros方法的区别和相似指出了:构建元素值全是1的数组:
- zeros_like方法,入参是数组,作用是构造新数组,类型和尺寸都参考入参数组的:
- 有zeros_like,就会有类似的ones_like:
-
类似的还有empty_like,不过它生成的都是未初始化的元素
-
还有个使用的方法full_like,可以指定初始化的值:
- 几个与维度相关的字段和方法:
- 三位数组:假设已有二维数组是35的形状,现在变成三维的,也就是两个35的二维数组,形状参数就是(2,3,5)那么写法如下:
- NumPy数组支持加号操作,结果是数组中每个元素相加:
- 还可以做平方运算:
- dot方法是点乘,既a的行与b的列,每个元素相乘后再相加,得到的值就是新矩阵的一个元素:
- 除了用数组的dot做点乘,还可以将两个矩阵对象直接相乘,结果与dot结果一致:
- 另外还要有逆矩阵、转置矩阵、矩阵转数组的成员变量需要注意:
爱因斯坦求和约定
-
这里不细说爱因斯坦求和约定本身,只聊聊NumPy对该约定的支持,主要是einsum方法的使用:
-
如下图,表达式i->,箭头左侧只有一个字母,表示输入是一维,箭头右侧空空如也,表示降到0维,也就是求和:
- 三维矩阵降为二维矩阵:
- 矩阵转置:
- 还可以输入两个矩阵,做矩阵相乘,注意ij和jk相乘后,变为ik,j维度消失了:
- 上图的ij,jk->ik改成ij,jk->,既结果是零维,矩阵相乘就变成了内积计算:
关于轴
-
约减,即减少元素的数量,以sum方法为例,例如一个2行2列的二维数组,可以垂直约减,也就是将所有行的同一列相加,最后只剩下一行,也可以水平约减,也就是将所有列的同一行相加,最后只剩一列:
-
min、max、mean等函数也支持axis参数,做类似操作(mean是计算平均值)
数据访问
- slice:分片参数
- transpose:转置二维数组
- ravel:展平多维数组,返回值是原值的视图,修改返回值会导致原值被改
- flatten:展平多维数组,返回值是新的内存对象,修改返回值不会影响原值
广播
-
NumPy的广播,也叫张量自动扩张,在两个数组实施运算的时候,如果两个数组形状不同,可以扩充较小数组来匹配较大数组的形状
-
一维数组与单个数字相加的时候,单个数字会被扩充为数组,值就是它自己:
- 例如52数组与51数组相加,5*1的数组就会自动填充一行,内容是自己的第一行:
高级索引
- 一维数组,方括号中的方括号,例如a[[3,3,2,1]],里面的数字代表要取的元素的索引:
- 二维数组,方括号中的方括号,例如a[[3,3,2,1]],里面的数字代表要取的行数:
- 二维数组,[:,[0,0]]表示所有行都访问,但是列只取两个:第0列和第0列,要注意的是第一个逗号,它左边是行信息,右边是列信息:
- 找出符合条件的元素:
堆叠
- 试想两本书可以怎么摆放? 水平方向平铺(水平堆叠hstack)、垂直方向平铺(垂直堆叠vstack)、两本书竖起来对齐(深度堆叠dstack),如下图所示,类似的,数组也可以按照这个思路去堆叠:
- hstack、vstack、dstack这三个方法将两个数组向上图的两本书一样做堆叠,要注意的是入参是元组:
- 这个图比较形象,二维数组在深度方向堆叠,形成了三维数组:
- concatenate函数也能实现堆叠功能:
- column_stack:将每个一维数组作为一列,水平堆叠
- row_stack:将每个一维数组作为一行,垂直堆叠
分割
-
与堆叠相对应的是分割:水平分割、垂直分割、深度分割
-
先来看水平分割hsplit,就像切竖着西瓜,西瓜在水平方向被分割成几段:
- 垂直分割vsplit就像横着切西瓜,结果是西瓜在垂直方向被分割成几段:
- 以上的操作也可以共split方法辅以axis参数来实现:
- 深度分割,会在深度的方向切下,假设原有两个二维数组组成的三维数组,每个都会被水平分割,这样就变成了四个二维数组,最终成了两个三维数组,分割的示意图如下:
- 代码如下:
随机数
- NumPy生成随机数的方法:
- 至此,NumPy常用功能已经体验完毕,这只是对NumPy初步的了解,今后还需要更多的编码才能熟练使用;