资源经验分享AI-数据标注类型

AI-数据标注类型

2019-11-08 | |  71 |   0

原标题:AI-数据标注类型

原文来自:博客园      原文链接:https://www.cnblogs.com/surpassme/p/11809441.html


随着数据的暴增和计算机硬件技术的发展,也催生了AI技术在各行各业的应用渗透。而想将AI技术应用到各行各业,数据是必需品。因为数据直接影响到AI最终训练出来的模型好坏。AI建模没有太大门槛,但数据才是真正的门槛。因此,目前业界流传着一段话有多少人工智能,就有多少人工。前一篇讲述了数据如何标注及其注意,今天来学习一下数据标注的类型有哪些?

谁来做数据标注

目前各个公司需要标注的数据,一般同下面几大公司或人员承担

  • 公司自己招聘人员或实习生进行标注

    这种方式最大的优势是:可以随时检查标注的质量和进度,便于快速沟通和调整,数据可以做到保密不外泄;劣势是成本较高

  • 外包给数据标注公司

    这种方式最大的优势是:速度非常快,成本低廉,标注公司也具备一定的开发标注工具能力,可定制性化能力较强;但劣势也明显标注公司鱼龙混杂,参差不齐,需要随时检查标注质量,返工成本较大。另外数据也无法做到保密不外泄

  • 外包给私人团体

    这种方式的优劣势基本同标注公司。优势是成本较低,因为可以大量招收人员,如农村闲置人员,兼职人员等。稍微培训下即可投入标注。

谁来管理数据标注

    针对数据分配给不同的人员,相应的角色也可以分为三种类型:

  • 数据标注人员

    主要负责数据的标注和汇总

  • 数据检查人员

    主要负责数据标注的质量检查,常采用抽检方式检查,可细分为部分抽检(比例约20%~30%)或全部抽检

  • 数据管理人员

    负责人员任务分配、进度跟进、标注培训及对外/对内协调沟通等

数据标注类型

    因AI技术应用到具体的实例场景,会有很大差异,因此标注的类型也有很多,详细如下所示:

图像标注-2D边框标注

    这种类型应该是最常见的标注方式,常用于检测目标对象的相应区域,标注框位于目标对象的四周,如下图所示:

1.png

图像标注-3D边框标注

    也称立方体标注,相比2D标注而言,还可以展现目标对象的近似深度。如下所示:

2.png

图像标注-语义分割

根据检测区域的不同,将图像标注为不同的像素,如下所示:

3.png

图像标注-多边形标注

根据需求标注目标对象的形状,常用于无法使用边框标注的不规则的目标对象,需要在目标对象的各个关键点进行描点,无论最终为何形状,均要能反应目标对象的轮廓形状和所有边缘,如下所示:

4.png

图像标注-直线或曲线标注

 根据需求标注目标对象对应的线条位置,线条可能是直线也可能是曲线,常用于分隔表明边界的事物。常用于自动驾驶,如下所示:

5.png

图像标注-点标注

 这种标注一般用于人脸识别,人体姿态跟踪(如POSE算法)等

6.png

视频标注-跟踪标注

在视频或连续的图像中跟踪标注的目标对象,形成与ID关联的运动轨迹

文本标注-中英文语音转写与校对

    英文语音转中文文本或中文文本转英文语音。

语音标注-客服语音标注

外呼机器人进行外呼记录语音标注呼叫成功或失败,从而训练话术。

常用标注工具

    常用标注工具如下所示:


免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:Tensorflow 2.0 datasets数据加载

下一篇:conda安装的国内镜像配置,实现快速下载

用户评价
全部评价

热门资源

  • Python 爬虫(二)...

    所谓爬虫就是模拟客户端发送网络请求,获取网络响...

  • TensorFlow从1到2...

    原文第四篇中,我们介绍了官方的入门案例MNIST,功...

  • TensorFlow从1到2...

    “回归”这个词,既是Regression算法的名称,也代表...

  • TensorFlow2.0(10...

    前面的博客中我们说过,在加载数据和预处理数据时...

  • 机器学习中的熵、...

    熵 (entropy) 这一词最初来源于热力学。1948年,克...