资源经验分享用深度学习做命名实体识别(二):文本标注工具brat

用深度学习做命名实体识别(二):文本标注工具brat

2019-11-23 | |  64 |   0

原标题:用深度学习做命名实体识别(二):文本标注工具brat

原文来自:博客园      原文链接:https://www.cnblogs.com/anai/p/11459789.html


本篇文章,将带你一步步的安装文本标注工具brat。

brat是一个文本标注工具,可以标注实体,事件、关系、属性等,只支持在linux下安装,其使用需要webserver,官方给出的教程使用的是Apache2。

使用示例

20191118180009718.png

下载brat

建议下载brat的release版本,地址:https://github.com/nlplab/brat/releases/tag/v1.3p1

安装环境

本文将在Ubuntu18.04操作系统下介绍brat的安装过程。

安装过程

首先,安装apache2,使用命令:

sudo apt-get install apache2

 

安装完成后会在 /var 目录下生成一个www/html目录,进入该目录: 

cd /var/www/html

 

将下载的brat-1.3p1.zip文件移动到该目录下,使用 如下命令解压到当前目录:

unzip brat-1.3p1.zip

 

在当前目录下使用如下命令将brat-1.3p1重命名为brat

mv brat-1.3p1 brat

 

使用 如下命令对brat目录授权:

sudo chmod 777 -R /var/www/html/brat

 

进入brat目录

cd /var/www/html/bratsudo ./install.sh

 

执行以下命令,根据提示输入用户名、密码、管理员邮箱

./install.sh

 

现在开始配置apache2.conf文件:  执行命令:

vim /etc/apache2/apache2.conf

 

在文件末尾加入如下内容,注意缩进:

<Directory /var/www/html/brat>  AllowOverride Options Indexes FileInfo Limit
  Require all granted
  AddType application/xhtml+xml .xhtml
  AddType font/ttf .ttf
  Options +ExecCGI
  AddHandler cgi-script .cgi</Directory>

 

重新启动apache2:

sudo service apache2 restart

 

然后打开 http://xxx.xxx.xxx.xxx/brat  , xxx是你brat所在主机的ip,默认80端口。

打开网页后,会发现报错,是关于协议什么的错误,这就是坑的地方,我们还需要一个步骤,如下:

cd /etc/apache2/mods-enabledsudo ln -s ../mods-available/cgi.load

 

只有这样才能使用cgi模块,而这步在brat的官方文档中貌似没有提及。但是在issue的#1141中提到了这点。

接下来,重新加载apache2的配置:

sudo service apache2 reload

 

此时再访问 http://xxx.xxx.xxx.xxx/brat,就能看到下面的界面了:

newsimg1108_05.png


然后,用之前输入的用户名、密码登录后,就可以使用了,使用教程可以参考官方文档:   http://brat.nlplab.org/configuration.html

最后,我们看看如何添加多个用户:
找到/var/www/html/brat/config.py 对应的行,增加:

USER_PASSWORD = {'admn': 'admin','test': 'test',
# (add USERNAME:PASSWORD pairs below this line.)
}

 

重新启动apache2后,使用test就可以登录了。

ok,工具搭建好了,下一篇《用深度学习做命名实体识别(三):文本数据标注过程》 将介绍如何标注我们的数据,本篇就这么多内容啦~,感谢阅读O(∩_∩)O,88~


免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。

合作及投稿邮箱:E-mail:editor@tusaishared.com

上一篇:mxnet在windows使用gpu 出错

下一篇:几何变换_遮挡

用户评价
全部评价

热门资源

  • Python 爬虫(二)...

    所谓爬虫就是模拟客户端发送网络请求,获取网络响...

  • TensorFlow从1到2...

    原文第四篇中,我们介绍了官方的入门案例MNIST,功...

  • TensorFlow从1到2...

    “回归”这个词,既是Regression算法的名称,也代表...

  • 机器学习中的熵、...

    熵 (entropy) 这一词最初来源于热力学。1948年,克...

  • TensorFlow2.0(10...

    前面的博客中我们说过,在加载数据和预处理数据时...