StarSpaceのためのユーティリティツール

StarSpaceはtestモードを用いることで、未知のデータに対して、学習したEmbeddingに基づいて分類等を行うことができる。
このとき、テストデータ中の事例が未知語のみで構成されていると、読み込みの段階でその事例はロードされず、分類結果がpredictionFile中にoutputされなくなってしまう（hit@nの計算にも使用されない）。
この結果、predictionFile中の事例IDが、inputと対応しなくなるため、inputとpredictionFile中の事例の対応がとりづらい。
また、predictionFileには、input中の各事例が記載されるが、事例中の未知語は飛ばして記載されるため、inputとpredictionFileの事例間のExact Matchを行うことができない。
ので、inputとpredictionFileに含まれる事例の対応を取るユーティリティツールを作成する。

Usage

$ python star_align.py test_file prediction_file vocab_file label_side > output

ここで、vocab_fileはStarSpaceが生成したモデルのtsvファイルを指定し、label_sideでは{RHS, LHS}のいずれかを指定する。
test_file中において、ラベルが記載されている位置と対応づけて{RHS, LHS}を指定する。

上一篇：pytorch-starspace

下一篇：turicreate-notebooks

用户评价

全部评价

还没有评论，说两句吧！

热门资源

Keras-ResNeXt

Keras ResNeXt Implementation of ResNeXt models...
seetafaceJNI

项目介绍基于中科院seetaface2进行封装的JAVA...
spark-corenlp

This package wraps Stanford CoreNLP annotators ...
capsnet-with-caps...

CapsNet with capsule-wise convolution Project ...
inferno-boilerplate

This is a very basic boilerplate example for pe...

智能在线

400-630-6780
聆听.建议反馈

E-mail: support@tusaishared.com