研究室紹介(配属希望者の方へ)

研究室概要

  • 教授:山名早人
  • 研究室メンバー
  • 研究室:51号館11階05/06室
  • 研究分野:
    • データマイニング:
      データ処理技術やマイニング技術に関する研究
      (ソーシャルメディア解析、情報検索、検索エンジン、テキストマイニング、Webマイニング、Webクローリング、バイオインフォマティクス、超高速データ処理など)
    • インテリジェント・ユーザインタフェース、HCI:
      人間とデータが直接触れるインタフェースに関するデータ処理技術の研究
      (手書きコンピューティング、画像処理、情報検索インタフェース、情報推薦インタフェースなど、知的ユーザインタフェース全般)
    • 暗号:
      プライバシー保護技術開発のため、データを暗号化したままで演算を進める国家プロジェクトを実施中(2015-2020)

2017年 オープンハウス日程

研究室説明会

オープンハウス

  • 日時:3月27日(月)(15時〜18時)、28日(火)~30日(木)(10時〜18時)
  • 場所:51号館11階05,06室(研究室)

オープンハウス期間外に見学希望の方は yamanalab [at] yama.info.waseda.ac.jp まで連絡をお願いします。

研究テーマ

mindmap

SNS、マルチメディア、センサ情報など、私たちの身の回りには様々な「データ」であふれています。特にUCCで称される個人が発信する情報が爆発的に増加してきています。これらは、個人と密接に関連しているため、個人のニーズに対するピンポイントの商品推薦など、より個人に適した便利なサービスを作るための重要なデータとなっています。しかし、確立されない方法論、非定型データから由来する正解の不在とノイズ、大量データ処理、プライバシーの保護など、さまざまな挑むべき課題があります。山名研ではこれらのデータを活用して、世の中に役立てる技術の構築を目標にしています。
この目標を実現するために、私たちは分野を狭く限定せずに「データ」に関わる技術を対象に、基盤となる高速データ処理技術からマイニングアルゴリズム、ユーザインタフェースまで広い分野を取り扱っています。今までおおまかに以下の分野を研究しております。

  • データマイニング
    • データ処理技術やマイニング技術に関する研究(ビッグデータ・データサイエンティスト)
  • インテリジェント・ユーザインタフェース
    • 人間とデータが直接触れるインタフェースに関するデータ処理技術の研究
  • 暗号
    • プライバシー保護技術開発のため、データを暗号化したままで演算を進める国家プロジェクトを実施中(2015-2020)

ここでは各グループの研究内容について概要を説明します。詳細な研究内容については、各グループのリンクを参照してください。

データマイニング

データマイニンググループではWebデータを中心に、身の回りに存在する様々な情報を研究対象とし、世の中の発展に貢献する解析手法、システムを研究しています。このようなデータ工学と呼ばれる研究分野について高速データ処理技術やデータ収集システムといった基盤となる技術から、人工知能のようなデータをもとに自動判別を行う機械学習などを用いた解析手法に関する研究、そしてこれらを統合的に用いたシステムに至るまで幅広く研究を行っています。研究例など詳細は以下のページを参照してください。

Data Mining Group

LBSN基盤場所推薦 プロファイル推定
アクティブ認証 単語分割(Word Segmentation)

インテリジェント・ユーザインタフェース(IUI)

インテリジェント・ユーザインタフェース(IUI)グループでは、主に人間とデータ(コンピュータ)が直接触れ合う部分について研究しています。このようなユーザインタフェースやHCI (Human-Computer Interaction) と呼ばれる研究分野において、人間が生み出すデータを取得・解析しユーザの手助けをする知的UIに関する研究を主に行っています。研究例などの詳細は以下のページを参照してください。

Intelligent User Interface (IUI) Group

 

Eyefree Japanese IME

暗号(Secure Computing Group)

プライバシー保護技術開発のため、データを暗号化したままで演算を進める国家プロジェクトを実施中(2015-2020)。

secretComp secretComp
secretComp secretComp

暗号グループでは、暗号化したままの演算(秘匿計算)についての研究に取り組んでいます。秘匿計算の一例として、ある企業が自社内にもつデータを解析して何らかの知見を得たい場合に、解析ノウハウがない・計算資源がない等の理由から、解析のための計算をクラウドサービスなどの第三者に依頼することが考えられます。その際、データそのものに企業利益につながるような内容や個人情報が含まれる場合、実際に計算を行う第三者や悪意のある攻撃者にデータ内容を知られる恐れがあります。秘匿計算では、依頼主がデータを暗号化してから第三者に依頼することで、第三者がデータを復号化することなく(つまり、中身を知ることなく)計算を行い、結果のみを依頼主が復号することができるため上述のリスクを回避することができます。
秘匿計算を可能とする従来の暗号化方式には速度面に問題があるため、暗号グループでは秘匿計算の高速化に取り組んでいます。秘匿計算のアルゴリズムを考える作業はパズルを解く感覚です。他拠点との連携により実用的に使用可能な秘匿計算によるオープンソースライブラリ構築を目標としています。具体的な研究内容は下記ページ参照

Secure Computing Group

普段の研究活動

毎週全体ゼミを行います。さらに、定期的に各グループごとのディスカッションを行います。

  • 全体ゼミ:研究の進捗報告をプレゼンテーション形式で紹介します。
  • グループディスカッション:研究の計画や進捗を先生と他の班員に報告し、方向性についてお互いに議論します。

研究室の行事

  • 8月    前期中間発表(合宿形式 場所未定)
  • 12月   後期中間発表(西早稲田キャンパス)
  • 新入生歓迎会、卒業生送別会、ACMプログラミングコンテスト etc…

研究設備

  • 1人に対してCore i7のメインマシン1台以上と20インチ以上のディスプレイ2台
  • 1人1台iPadを貸し出し
  • サイボウズグループウェアによる円滑なコミュニケーション
  • 大規模データを扱える研究用マシン

 

personal_machine
個人研究環境
高速データ処理クラスタ

 

研究室の求める人材

  • いつも研究室に来てくれる人
  • 責任を持ってやるべきことをやれる人
  • コミュニケーションを大事にする人
  • チャレンジ精神のある人
  • 論理的に物事を考えるのが好きな人
  • プログラミングやアルゴリズムの知識を伸ばしたい人
  • サーバ管理、システム設定が好きな人

山名研OB/OG就職先(抜粋/*は複数)

日本電気*、富士通*、富士通研究所*、日立*、三菱電機、東芝研究開発センター、
NTT東日本、NTTドコモ、NTTデータ*、NTTソフト、NTTサイバースペース研究所
日本IBM*、日本IBM東京基礎研究所、統計数理研究所、産業技術総合研究所*
リコー*、キャノン、パイオニア、東芝電波システムエンジニアリング
新日鐵ソリューションズ*、TIS
野村総研*、三菱総研、アクセンチュア
Goldman Sachs*、三菱UFJモルガン・スタンレー証券
ヤフー*、Google、楽天*、楽天技術研究所、PFI、グルコース
GREE、mixi、Microsoft、任天堂、サイボウズ、Lunascape、リンクアンドモチベーション
JR東海、JR東日本、日通、オルガノ
経済産業省、特許事務所、東京証券取引所
高校教員*、
アジア太平洋研究科進学*、医学部進学* など

過去の卒論・修論テーマ

一目でわかる山名研の研究内容

2016年度

  • 修士論文
    • 完全準同型暗号を用いた秘匿ゲノム検索(石巻 優)
    • 完全準同型暗号による安全頻出パターンマイニングの省メモリ高速化 (今林 広樹)
    • オンライン学習を用いたアクティブ認証の実現 –スマートフォンを対象として− (石山 雄太)
    • ShuttleBoard:スマートウォッチにおけるタップ動作の少ない仮名文字入力手法 (下岡 純也)
    • ニューラルネットワークを用いた\\系列ラベリングによる単語分割手法 (篠原 正太)
    • Predicting User Reaction to Recommended Items in Job Advertisement (Elie GATETE MAGAMBO)
    • Improving Survey Response and Completion Rate with User Experience (Pritesh Chandra)
  • 卒業論文
    • CTR 向上を目的としたオンライン広告のWEB ページにおける配置位置の推定 (大谷 一善)
    • 構図を用いた写真と絵画間の類似判定 (塩浦 尚久)
    • HMD付属コントローラを用いた3Dキャラクタ作成による没入感の向上 (伊藤 仁一)
    • 完全準同型暗号による計算回路のループ部におけるbootstrap配置最適化と最近傍法への適用 (佐藤 宏樹)
    • Deep Q-Networkを用いた株の自動売買システムの提案 (中西 梓)
    • タブレットPCにおけるペン操作時のハンドジェスチャーショートカット入力手法 (堀川 右京)
    • スマートウォッチを対象とした歩行中の片手ジェスチャ入力手法 (武井 彩佳)

2015年度

  • 博士論文
    • User Interfaces and Data Analysis on Digital Handwriting Environment (浅井 洋樹)
  • 修士論文
    • Personalized PageRank を利用した網羅的Twitter ユーザ属性推定 (上里 和也)
    • 視線情報を用いた視聴者の非侵襲型可読言語推定 (王 琛)
    • Improving Chinese Native Language Identification by Cleaning Noisy Data and Adopting BM25 (Lan Wang)
    • キーワードに基づく一般的な回答を行う相談システムの提案 (畠山 恭明)
    • 発話間関係の構造化による会議録からの 議論マップ自動生成システム (林 佑磨)
    • 生成型一文要約のためのマルチアテンションモデル (吉岡 重紀)
  • 卒業論文
    • シーンテキスト位置の高速検出手法の提案-日本語と英語を対象として- (馬屋原 昂)
    • BluetoothのRSSI値を用いた「歩きスマホ」事故防止システ厶 (小林 弘樹)
    • SVパッキングによる完全準同型暗号を用いた安全な委託Aprioriの高速化 (髙橋 卓巳)
    • 特定分野に対する単語重要度計算手法の提案とTwitterにおける専門性推定への適応(滝川 真弘)
    • Locality-­Sensitive Hashingを用いた大規模な著者推定の高速化 (田中 博己)
    • 国会議事録を用いた専門性と一貫性の判定による注目すべき政治家の推薦 (中西 勇)
    • 電子ペンを用いた手書き解答データによる幾何学解答パターン分類手法 (森山 優姫菜)

2014年度

  • 修士論文
    • 結合・非結合時における特異な特徴量を用いたGタンパク共役受容体と化学化合物の結合予測(大野)
    • マイクロブログを対象とした100,000人レベルでの著者推定手法の提案(奥野)
    • 字配りの平均化による手書き文章の魅力的な文字配置方法(鬼沢)
    • 国会議事録を用いた経済指標のナウキャスティング(高杉)
    • 学習データ選別とOkapi BM25 を用いた母語推定の精度向上(田中)
    • 医薬品の既知の副作用に着目した未知の副作用推定手法の提案(三上)
    • Topics and Influential User Identification in Twitter using Twitter Lists(ZHOU)
    • Cross-Domain Investigations of User Evaluations(LE)
  • 卒業論文
    • 新規カーネル関数を使用したSVMによるヘテロ二量体タンパク質複合体予測手法の提案(石巻)
    • オントロジーにおける概念間関係の意味的アプローチを用いた集約(石山)
    • SVMを用いた遺伝子制御ネットワーク推定における特徴ベクトルの算出手法の検討(下岡)
    • マイクロブログにおける単語間の依存性を考慮した 語義曖昧性解消(篠原)
    • 3軸加速度計を用いたデスクワーク中の割り込み可能性の推定(ゾル)
    • テレビ放送の映像解析によるサッカー選手の自動判別(二階堂)

2013年度

  • 修士論文
    • メンション情報を利用したTwitterユーザプロフィール推定(奥谷)
    • 商品評価ツイートからの属性語自動抽出手法の提案(駒田)
    • ストレージ性能を考慮したDBMSクエリのコストモデル最適化と実装(鈴木)
    • 認知心理学的記憶調査に基づく記憶支援システムの構築(苑田)
    • オンライン広告の効果改善を目的としたユーザ分類手法の提案と評価(田中)
    • 携帯端末に適用可能なモーションブラー警告システム(手塚)
  • 卒業論文
    • 文体及びツイート付随情報を用いた乗っ取りツイート検出(上里)
    • 入力ストローク数削減による高速手書き入力手法(王)
    • 指定時刻での目的地到着を支援する歩行ペースナビゲーションシステム(志知)
    • レビューサイトにおけるレビューおよびレビュアーの信頼性評価(中里)
    • 印象語を含むクエリを用いたオブジェクトの対話的な検索システム(畠山)
    • 地域後によるツイートのスコア付けを利用したTwitterユーザの活動エリア推定(浜田)
    • 意味概念に基づいた関連論文検索システム〜近傍文書からのキーフレーズ抽出を用いた自動クエリ生成〜(林)
    • AjaxページクロールのためのJavaScript解析(吉岡)

2012年度

  • 博士論文
    • QueueLinker: A Framework for Parallel Distributed Data-Stream Processing(上田)
  • 修士論文
    • テレビ番組に対する意見をもつTwitterユーザのリアルタイム検出(山本)
    • 検索ヒット数の正確性評価〜大規模クロールデータに対する文書頻度との比較〜(佐藤)
    • 表情・動作情報とタッチパネル操作情報の統合による学習状態の推定(須藤)
    • SVMを用いたタンパク質のディスオーダー領域における機能部位の予測(片岡)
    • Intensity 制約を用いたコーディングパターン抽出と三角形特徴量に基づく三次元形状検索(武井)
    • 経時的な関連語句の変化を考慮したクエリ拡張による Twitter からの情報抽出手法(藤木)
    • 大規模候補者群に対する著者推定手法の提案と評価(井上)
  • 卒業論文
    • 複数の分類手法を併用した日本語テキストの高精度な含意関係認識手法(伊藤)
    • CQA に投稿された質問からの重要文抽出と文圧縮によるタイトル自動生成手法(奥野)
    • SVM による G タンパク共役受容体と化合物の相互作用予測(大野)
    • Twitter におけるアカウント乗っ取りによるスパムツイートの検出(和田)
    • 医薬品副作用情報を用いた副作用検索システムの提案(三上)
    • 顔文字推薦のための顔文字カテゴリ推定手法(鬼沢)
    • 形態素の極性と限定表現を考慮した文章間含意関係認識(田中正)
    • jQuery プラグインに特化したアニメーションサムネイル自動生成手法(野澤)

2011年度

  • 修士論文
    • 講義動画における単語密集度を用いたトピック分割手法の提案(矢野)
    • 原語における形態素間の相対的な優先関係を利用した略語推定手法(及川)
    • カスタマイズ性とリアルタイムなデータ提供を考慮したクローラの設計と実装(打田)
    • 領域分割結果の投票処理を用いた背景に頑健な衣服領域抽出(金)
    • 2段階GrabCutを用いた注目物体の視認性を向上させたサムネイル生成(新井)
    • Multiple Kernel Learningを用いた階層的画像分類(小林)
    • 可視光カメラから得られる低解像度目画像を用いた視線推定(福田)
    • 筆記者の強調意図を利用した手描きドキュメントのスニペット生成(浅井)
  • 卒業論文
    • DNSクエリログを用いたインターネット利用者の興味傾向推定手法(駒田)
    • 繰り返し表現を用いた感情を含むツイートの抽出手法(高橋)
    • オンライン手書きデータによる記憶度推定システムの構築(苑田)
    • 複数特徴量の統合による画像劣化検知システム(手塚)
    • プロフィール情報を用いたTwitterユーザコミュニティの抽出手法(奥谷)
    • 分散Key-Valueデータベースを用いたRDFストアの構築と評価(鈴木)
    • 検索時間の調節可能な類似動画検索手法(田中)

2010年度

  • 修士論文
    • 品詞と助詞の出現パターンを用いた類似著者の推定とコミュニティ抽出(中島)
    • Web-WABOT: ウェブサーバにやさしいクローラ(森本)
    • Resizable-LSHによる閾値可変の近似的類似検索手法の高速化(山崎)
    • 非頻出アイテムセットを用いた頻出アイテムセット抽出数削減手法(松崎)
  • 卒業論文
    • 筆記者の強調表現に基づいたオンライン手書きノートの圧縮サムネイル生成手法(浅井)
    • アライメントと立体構造情報を用いた G タンパク質共役型受容体の機能解析システム構築(姜)
    • Canny エッジ情報に基づく人物画像における髪型の定量化(須藤)
    • RetweetReputation: バイアスを排除した Twitter 投稿内容評価手法(藤木)
    • 2 段階 LDA を用いたインクリメンタルなソフトウェアリポジトリの自動分類手法(井上)
    • 検索エンジンのヒット数の信頼性に対する評価(佐藤)
    • 結晶化環境における pH 値を考慮した SVM によるタンパク質結晶化の予測(片岡)
    • 字幕テキストの利用によるマイクロブログからのテレビ番組に言及したメッセージ検出手法(山本)