Ahogrammer

Deep Dive Into NLP, ML and Cloud

2019-10-01から1ヶ月間の記事一覧

単語分散表現の信頼性を考慮した固有表現認識

ACL 2019より以下の論文を紹介。 Reliability-aware Dynamic Feature Composition for Name Tagging この論文では、単語分散表現の信頼性を考慮した固有表現認識を行うモデルを提案している。単語分散表現は広く使われているが、低頻度語や未知語のように文…

辞書を用いてテキストから病名を抽出する

医療分野の自然言語処理で基本となるタスクの一つにテキストからの病名の抽出があります。テキストから病名を抽出できると、たとえば、SNSのテキストから病気の流行を予測したり、広告技術と組み合わせて受診や薬の購入を促したり、対話システムと組み合わせ…

検索エンジンにBERTを組み合わせて検索性能を向上させる手法

SIGIR 2019より以下の論文を紹介。NLP2019でも発表されており、わかりやすいスライド付き。 FAQ Retrieval using Query-Question Similarity and BERT-Based Query-Answer Relevance 【論文】行政対話システムにおける検索エンジンTSUBAKIとBERTを併用したFA…

生体医療分野における自然言語処理の10種競技

ACL 2019より以下の論文を紹介。 Transfer Learning in Biomedical Natural Language Processing: An Evaluation of BERT and ELMo on Ten Benchmarking Datasets この論文では、生体医療分野の自然言語処理におけるベンチマークの提案とベンチマークに対す…

生体医療分野のテキストのためのアノテーションツール

EMNLP 2019より以下の論文を紹介。 MedCATTrainer: A Biomedical Free Text Annotation Interface with Active Learning and Research Use Case Specific Customisation この論文では、MedCatTrainerと呼ばれる生体医療分野のテキストに対する固有表現認識と…