资源算法starspace_utils

starspace_utils

2019-12-30 | |  47 |   0 |   0

StarSpaceのためのユーティリティツール

StarSpaceはtestモードを用いることで、未知のデータに対して、学習したEmbeddingに基づいて分類等を行うことができる。
このとき、テストデータ中の事例が未知語のみで構成されていると、読み込みの段階でその事例はロードされず、分類結果がpredictionFile中にoutputされなくなってしまう(hit@nの計算にも使用されない)。
この結果、predictionFile中の事例IDが、inputと対応しなくなるため、inputとpredictionFile中の事例の対応がとりづらい。
また、predictionFileには、input中の各事例が記載されるが、事例中の未知語は飛ばして記載されるため、inputとpredictionFileの事例間のExact Matchを行うことができない。
ので、inputとpredictionFileに含まれる事例の対応を取るユーティリティツールを作成する。

Usage

$ python star_align.py test_file prediction_file vocab_file label_side > output

ここで、vocab_fileはStarSpaceが生成したモデルのtsvファイルを指定し、label_sideでは{RHS, LHS}のいずれかを指定する。
test_file中において、ラベルが記載されている位置と対応づけて{RHS, LHS}を指定する。


上一篇:pytorch-starspace

下一篇:turicreate-notebooks

用户评价
全部评价

热门资源

  • Keras-ResNeXt

    Keras ResNeXt Implementation of ResNeXt models...

  • seetafaceJNI

    项目介绍 基于中科院seetaface2进行封装的JAVA...

  • spark-corenlp

    This package wraps Stanford CoreNLP annotators ...

  • capsnet-with-caps...

    CapsNet with capsule-wise convolution Project ...

  • inferno-boilerplate

    This is a very basic boilerplate example for pe...