04-header

コラボリー/Beats!でも取り上げました が、2015年3月7日に All Analytics Championship ~データサイエンス・アドベンチャー杯 (以下、アドベンチャー杯)本選が行われ、見事予選を通過した9チームによるプレゼンテーションが行われました。

アドベンチャー杯は実務で統計・データ・言語分析を行う社会人ならびに統計学や情報学・言語処理一般に関心を持つ学生の方々を対象に、分析アイデアおよび分析スキル・得られた成果の優劣を競うコンテストです。主催は(独)科学技術振興機構、後援は経済産業省/文部科学省/データサイエンティスト協会で、弊社は SAS Institute Japan と共にプラチナスポンサーとしてお手伝いしています。

今回、作品名「研究を主導する次世代のリーダーを探る」で見事ジー・サーチ賞を受賞されたteranoLab(東京工業大学)の原田泰輔さんに作成の苦労話や今だから話せる裏話をお伺いいたしました。後編は原田泰輔さんのインタビューです。

東京工業大学 寺野研究室 原田 泰輔さん(当時)
聞き手:株式会社ジー・サーチ新規事業開発室担当部長 長谷川 均

発表された研究内容については前編 研究の現場で聞いてみた!次世代のリーダー研究者をデータ解析で探索する!データサイエンス・アドベンチャー杯受賞者 Terano Lab. 原田さんに聞く(研究発表解説編) をご覧ください。

お金の話というのはインパクトもあるし、重要なこと

Terano Lab. 原田さん
長谷川:ジー・サーチ賞受賞おめでとうございます。「研究を主導する次世代のリーダーを探る」というのは大変興味深いテーマなのですが、どのようなきっかけでこのテーマを選ばれたのでしょうか。

原田:実は、去年、アドベンチャー杯というものがあることを知って、出ることを先に決めました。テーマは後から付いてきた形です(笑)。他にないものができないかと考えてこのテーマを選びました。最初は研究費についてはあまり考えずに、研究者のネットワーク中心にやっていこうかと考えていました。でもやっぱりお金の話というのはインパクトもありますし、重要なことだろう、ということで織り交ぜていくことにしました。

長谷川:お金の話ってなかなか踏み込みにくいところがあるかと思いますが、その点はいかがですか。

原田:僕がまだ学生ということもあったので、あまりしがらみがなかったです。学生という立場だから言えるというところはあると思います。

一番大変だったのは研究費のデータ

Terano Lab. 原田さん
長谷川:実際の手順ですが、分析パッケージなどを使ったのでしょうか。また、チーム内での分担はどのようにされましたか。

原田:手法としてはパッケージのようなものはあまり使っていません。ネットワークを構築して研究者自体を分類するところまではJavaであったり、Rであったり、そういったものを使って分類したのですが、その後はそれぞれのクラスタに入っている研究者の情報を個別に集めてきて、統計的に比較するという方法で分類を進めていきました。

研究内容自体については、ほとんど全部一人で作業しています。最後にプレゼンの資料を作るときにちょっと手伝ってもらいました。

長谷川:作品を作る上で、どんなところが大変でしたか。今回、応募から締め切りまでの時間があまりなかったと思いますが。

原田:一番大変だったのは研究費のデータでした。今回は科研費のデータを使ったのですが、それを抽出するのが大変な作業でした。本来なら研究者のネットワークを作るところで一番時間がかかるのですが、実際には昨年のデータがあったので、そこ自体は去年の段階でクリア出来ていました。後は研究者を個別にクラスタに分けて比較していくのですが、そこについては結構時間がかかりました。締め切り間際は大変でした。それこそ朝から晩までという感じで。

長谷川:ここでコラボリー/Grants(研究助成)を紹介したいと思います(笑)。採択実績は、民間の助成財団を含めてデータが取れるものについては金額データも入っています。ところで、研究者のクラスタを4つのカテゴリーに分けていますが、研究分野の違いは考慮されているのでしょうか。

原田:おそらく分野ごとである程度の違いがあると考えたので、今回の分析については分野を絞っています。分析した分野を絞った理由としては、自分の所属している分野だと先生たちに感覚的なところが聞きやすかったといことがあります。

長谷川:もっとこんなデータがあればよかった、あるいはこんなこともやってみたかった、というのはありますか。

原田:プレゼンでも今後の課題として触れましたが、論文を書くときの引用関係というのは大事だと思っています。やっぱり多く引用される論文というのは出来がいいと思うので。今回は共著者だけでネットワークを作っていますが、引用関係を含めればより正確な分析ができるのでは、と思います。

後、若手の研究者が今後どういったキャリアパスを選択していくのか、意思決定の材料となるような成果を出せればいいなと思いました。

長谷川:意思決定というのは、大学の研究者を目指すのか、あるいは企業に行くのかといったことですか。

原田:それも含めてなんですが、次の転職先というか所属先を探す際に自分と近いところに行くのがいいのか、それとも思い切って、遠くに、全然関係ないところに行くのがいいのかというところまで分かればよかったかなと思います。

次ページへ 1 2