资源技术动态人工智能基础-张量的常用描述及图像表征

人工智能基础-张量的常用描述及图像表征

2019-12-07 | |  111 |   0

原标题:人工智能基础-张量的常用描述及图像表征

来源:今日头条        链接:https://www.toutiao.com/a6707733924631544324/

深度学习中的所有数据张量的第一个轴都是样本轴,也称之为样本维度。另外,深度学习模型不会同时处理整个数据集,而是将数据拆分成小批量,比如前面的案例就是每次取128个数据作为一个批量。

batch = train_images[:128]
# next
batch = train_images[128:256]
# nth 
batch = train_images[128 * n: 128 * (n+1)]

在数字标号记住两个点:

从0开始

左闭右开

这是老外喜欢的调性。

在这个场景里,第一个轴称之为批量轴 batch axis或者也称之为批量维度 batch dimension。

这些术语对于构建整个理解知识体系很重要。

现实世界的数据张量描述

这里给出的几个例子,可以作为参考:

向量数据:2D张量,形状:(samples, features)
时间序列数据:3D张量,形状:(samples, timesteps, features)
图像:4D张量,形状为:(samples, height, width, channels)或者(samples, channels, height, width)

向量数据

每一条/行就是一个数据,第一个轴是样本轴,第二个轴是特征轴。一般的CSV数据都是这类。

时间序列或序列数据

这里给出的例子极好,以股票数据为例,每一分钟可以记录三个数据:

股票当前价格

前一分钟最高价

前一分钟最低价

image.png


所以每一分钟的数据可以编码为一个3D向量,注意这不是3D张量。一天下来,交易日有390分钟,可以得到一个2D张量,形状为(390,3)。一年250天则可以保存在一个形状为(250, 390,3)的3D张量中。一天的股票数据即为一个样本。

第一个轴是样本轴,第二个轴是时间轴,第三个轴是特征轴,这是约定的惯例。

图像数据

image.png

数字图像文件内容由两个部分组成:图像头信息和数据。

图像头信息定义了图像的基本信息,主要包括起点位置(Origin),像素间隔(space)和维数(dimension)。通过这三个参数即可以决定图像空间位置和规模。图像可以看做是空间中的一个规则网格,网格中的每个最小单元称之为一个像素(二维)或者体素(三维),这样网格在每个方向上的像素或者体素个数即为图像在该方向的维数。像素索引表示每个像素在图像网格中的位置,是图像内部的网格坐标。而在医学图像中,每个图像除了内部坐标外,还存在一个世界坐标。这个世界坐标依赖于成像设备。在医学图像中起点位置(Origin),像素间隔(space)和图像维数决定了世界坐标系。这样通过起点位置,像素间隔和像素索引即可计算每个像素的世界坐标位置。

image.png

图像数据即为图像像素的像素值,一般采用一维数组来表示和存储。已知像素索引和图像维数下,即可计算每个像素对应的像素值。通常图像的像素值为一个标量,例如一般灰度图像;图像像素值也可以是一个向量,例如彩色图像;另外图像像素值还可以是张量,如梯度场图像。医学图像处理中大部分的图像都是灰度图像。

这里需要注意灰度图像的灰度值的数据类型,在一般的灰度图像处理中不需要考虑,因为其范围默认为0-255,可以采用一个unsigned char类型来表示。但是在医学图像处理中,256灰度级远远不能满足要求,因此灰度范围往往大于256级。常见的医学图像的像素数据类型为unsigned short,灰度范围为0-65536。

THE END

免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:微软发布新AI:能生成图像描述,还能回答场景相关问题

下一篇:Python-OpenCV 16. 图像特征检测与描述算法

用户评价
全部评价

热门资源

  • 应用笔画宽度变换...

    应用背景:是盲人辅助系统,城市环境中的机器导航...

  • GAN之根据文本描述...

    一些比较好玩的任务也就应运而生,比如图像修复、...

  • 端到端语音识别时...

    从上世纪 50 年代诞生到 2012 年引入 DNN 后识别效...

  • 人体姿态估计的过...

    人体姿态估计是计算机视觉中一个很基础的问题。从...

  • 谷歌发布TyDi QA语...

    为了鼓励对多语言问答技术的研究,谷歌发布了 TyDi...