NLP班

NLP (Natural Language Processing)  班では自然言語処理と呼ばれる分野の研究を行っています。自然言語処理とは、日常的に使われている自然言語をコンピュータに処理させる研究分野で、文を品詞などの単語に分ける形態素解析、語同士の関係を判別する係り受け解析などの技術があります。NLP班ではブログ、 Twitter、Wikipedia、オープンソースなどを対象に、以下のような研究を行っています。

  • ブログ記事からの著者情報の抽出
  • 字幕テキストを利用したブログで引用されているテレビ番組の推定
  • 一定期間の報道番組の自動要約
  • プログラミング補助ツールの開発
  • Twitterユーザーの関心分析

過去の研究例

プレスリリースに関連する特許文章検索

tokkyo プレスリリースから,掲載されている製品が使用している可能性が高い特許文章を検索する.

LDAを用いたソフトウェアの高速分類

lda 2段階にLDAを用いることにより,高速にソフトウエアの分類を行う.

Twitterから価値のある情報の抽出

retweet Twitterに投稿された情報から,投稿者の知名度などのバイアスを排除し,第三者にとって価値のある情報を抽出する.

Twitterユーザコミュニティの抽出

Twitterユーザのプロフィール情報とフォロー関係から,検索語句と関連性の高いユーザのコミュニティを抽出する.