Ahogrammer

Deep Dive Into NLP, ML and Cloud

Health

辞書を用いてテキストから病名を抽出する

医療分野の自然言語処理で基本となるタスクの一つにテキストからの病名の抽出があります。テキストから病名を抽出できると、たとえば、SNSのテキストから病気の流行を予測したり、広告技術と組み合わせて受診や薬の購入を促したり、対話システムと組み合わせ…

生体医療分野における自然言語処理の10種競技

ACL 2019より以下の論文を紹介。 Transfer Learning in Biomedical Natural Language Processing: An Evaluation of BERT and ELMo on Ten Benchmarking Datasets この論文では、生体医療分野の自然言語処理におけるベンチマークの提案とベンチマークに対す…

生体医療分野のテキストのためのアノテーションツール

EMNLP 2019より以下の論文を紹介。 MedCATTrainer: A Biomedical Free Text Annotation Interface with Active Learning and Research Use Case Specific Customisation この論文では、MedCatTrainerと呼ばれる生体医療分野のテキストに対する固有表現認識と…

日本語の電子健康記録のテキストを匿名化する手法

EMNLP 2018より以下の論文を紹介。 De-identifying Free Text of Japanese Dummy Electronic Health Records この論文では、日本語の電子健康記録(EHRs: Electronic Health Records)のテキストを匿名化する手法を提案している。近年、医療関連のデータが増加…

Tweetから薬の副作用に関する分類と抽出を行う手法

ACL 2019より以下の論文を紹介。 HITSZ-ICRC: A Report for SMM4H Shared Task 2019-Automatic Classification and Extraction of Adverse Effect Mentions in Tweets この論文は、Tweet中に出現する薬の副作用に関するメンションの分類と抽出を行う手法を提…

ユーザ生成型医療テキストのスペル修正

ACL 2019より以下の論文を紹介。 Lexical Normalization of User-Generated Medical Text この論文では、ユーザ生成型の医療テキストに対するスペル修正を行う手法を提案している。ユーザ生成型の医療テキストとは、たとえばTwitterでつぶやかれた健康情報や…

個人の健康に関するTweetか否かの分類を行う手法

ACL 2019より以下の論文を紹介。 Figurative Usage Detection of Symptom Words to Improve Personal Health Mention Detection この論文では、与えられた文が個人の健康状態に関する言及(PHM: Personal Health Mention)を含むか否かを分類する手法を提案…