原标题:用深度学习做命名实体识别(二):文本标注工具brat
原文来自:博客园 原文链接:https://www.cnblogs.com/anai/p/11459789.html
本篇文章,将带你一步步的安装文本标注工具brat。
brat是一个文本标注工具,可以标注实体,事件、关系、属性等,只支持在linux下安装,其使用需要webserver,官方给出的教程使用的是Apache2。
使用示例
下载brat
建议下载brat的release版本,地址:https://github.com/nlplab/brat/releases/tag/v1.3p1
安装环境
本文将在Ubuntu18.04操作系统下介绍brat的安装过程。
安装过程
首先,安装apache2,使用命令:
sudo apt-get install apache2
安装完成后会在 /var 目录下生成一个www/html目录,进入该目录:
cd /var/www/html
将下载的brat-1.3p1.zip文件移动到该目录下,使用 如下命令解压到当前目录:
unzip brat-1.3p1.zip
在当前目录下使用如下命令将brat-1.3p1重命名为brat
mv brat-1.3p1 brat
使用 如下命令对brat目录授权:
sudo chmod 777 -R /var/www/html/brat
进入brat目录
cd /var/www/html/bratsudo ./install.sh
执行以下命令,根据提示输入用户名、密码、管理员邮箱
./install.sh
现在开始配置apache2.conf文件: 执行命令:
vim /etc/apache2/apache2.conf
在文件末尾加入如下内容,注意缩进:
<Directory /var/www/html/brat> AllowOverride Options Indexes FileInfo Limit
Require all granted
AddType application/xhtml+xml .xhtml
AddType font/ttf .ttf
Options +ExecCGI
AddHandler cgi-script .cgi</Directory>
重新启动apache2:
sudo service apache2 restart
然后打开 http://xxx.xxx.xxx.xxx/brat , xxx是你brat所在主机的ip,默认80端口。
打开网页后,会发现报错,是关于协议什么的错误,这就是坑的地方,我们还需要一个步骤,如下:
cd /etc/apache2/mods-enabledsudo ln -s ../mods-available/cgi.load
只有这样才能使用cgi模块,而这步在brat的官方文档中貌似没有提及。但是在issue的#1141中提到了这点。
接下来,重新加载apache2的配置:
sudo service apache2 reload
此时再访问 http://xxx.xxx.xxx.xxx/brat,就能看到下面的界面了:
然后,用之前输入的用户名、密码登录后,就可以使用了,使用教程可以参考官方文档: http://brat.nlplab.org/configuration.html
最后,我们看看如何添加多个用户:
找到/var/www/html/brat/config.py 对应的行,增加:
USER_PASSWORD = {'admn': 'admin','test': 'test',
# (add USERNAME:PASSWORD pairs below this line.)
}
重新启动apache2后,使用test就可以登录了。
ok,工具搭建好了,下一篇《用深度学习做命名实体识别(三):文本数据标注过程》 将介绍如何标注我们的数据,本篇就这么多内容啦~,感谢阅读O(∩_∩)O,88~
免责声明:本文来自互联网新闻客户端自媒体,不代表本网的观点和立场。
合作及投稿邮箱:E-mail:editor@tusaishared.com