Ahogrammer

Deep Dive Into NLP, ML and Cloud

2019-09-16から1日間の記事一覧

TensorFlow Textを使ってテキストのトークン化をする

自然言語処理で欠かせない処理にテキストのトークン化があります。テキストをトークン化することで、その後のボキャブラリの構築やID化の処理を行うことができるようになります。本記事では、トークン化をTensorFlow Textの機能を使って実現する方法について…

アクティブラーニングを使って固有表現のアノテーション数を25%にする

ICLR 2018より以下の論文を紹介。 Deep Active Learning for Named Entity Recognition この論文では、固有表現認識向けのアクティブラーニング手法を提案している。最近の固有表現認識ではディープなモデルが使われる。そういったモデルではラベル付きのデ…