Ahogrammer

Deep Dive Into NLP, ML and Cloud

2018年のふりかえりと2019年にしたいこと

あけましておめでとうございます。

今日までお正月休みで明日から会社に復帰します。三週間ほど家にこもってゲームばかりしていて頭もだいぶボケてきているので、出社前のリハビリがてら2018年のふりかえりをしたいと思います。まずは2018年に何をしていたか思い出すために、やったことを時系列で書いてみました。

翻訳した技術書が発売される

f:id:Hironsan:20190109104619p:plain

2018年の8月に翻訳を担当した「直感ディープラーニング」が発売されました。この本の企画自体は一年前の2017年7月辺りに立ち上がったのですが、それから一年経ってようやく発売されました。書店に並んでいる本を見たときは感慨深かったです。本当にいい経験をさせてもらったのでやってよかったです。

アノテーションツールのリリース

https://github.com/chakki-works/doccano/blob/master/docs/named_entity_recognition.png?raw=true

同じく2018年の8月には開発したテキスト用のアノテーションツールであるdoccanoをリリースしました。doccanoは企画から開発、リリースまで一人で行ったプロジェクトなのですが、最近は徐々にユーザたちがIssueやPRを上げてくれるようになってきました。2019年は開発者であると同時にマネージャとして多くのユーザとともにdoccanoを発展させていきます。

資格取得

2018年はIPAデータベーススペシャリストネットワークスペシャリストの資格を取得しました。IPAの試験を受けるのは学生時代以来(3年ぶりくらい?)で午前試験の免除もなく体力が持つか不安だったのですが、どちらも一発で合格することができました。よく「実際には役に立たない」等の批判を受けているのを目にしますが、私としては資格取得を通じて体系的に視野を広げられたり、勉強法について見直したのは今後も活かせると思っています。

AutoMLの講演

speakerdeck.com

2018年の12月にはAutoMLについて90分間の講演を行いました。相手が技術者ではなかったので話す内容について結構悩んだ上でスライドを作成したのですが、あまりウケなかった(一番前のおじさんが寝てた(´;ω;`))ので失敗だったかなと思います。ただ、内容自体は結構良いと思っていますし、今後確実に伸びてくる分野なので以下の記事と合わせて見ていただくと役に立つと思います。

qiita.com

2019年にしたいこと

2018年の失敗は色々なことを同時並行にやろうとしたことだと思っています。よく言われていることではあると思いますが、マルチタスクで進めると切り替えのコストが高いことに加えて、一つ一つの仕事がなかなか進まないのでモチベーションがどんどん落ちていくのを感じました。2019年は一つずつ片付けるような仕事のやり方に変える予定です。

2019年は以下のことに絞って取り組みたいと考えています。

  • doccanoのマネジメントとサービス化
  • 研究成果のソフトウェア化
  • 書籍の出版

doccanoはありがたいことにどんどん成長しています。はじめは一人で開発していたので誰かに何かをして貰う必要はなかったのですが、開発してくれる人が増えてきたので何らかの対策を打たないとまずい状況になっています。なので、今年はOSSのマネージャとしてプロダクトを成長させつつ経験を積んでいきたいと思います。

研究成果のソフトウェア化では、研究結果を誰にでも使える形で公開しようと思っています。2019年はテキストからの知識の獲得と活用について取り組もうと考えているのですが、まずはその要素技術である固有表現認識とエンティティリンキングについてソフトウェアを公開できればと思います。

固有表現認識は以下のような感じ。

f:id:Hironsan:20190109122446p:plain

エンティティリンキングは以下のような感じ。以下は「原辰徳」についてエンティティリンキングをした結果です。固有表現を知識ベースにリンクすることで様々な情報を取得できることを示しています。

f:id:Hironsan:20190109122545p:plain

もう一つ取り組みたいのは書籍の出版です。実は昨年から自然言語処理の入門本を書いているのですが、なかなか筆が進まず昨年中に書き終えることができませんでした。今年の早い段階で書き終えて年内には出版できるようにしたいです。

最後になりますが、今年もよろしくおねがいしますm( )m