松尾ぐみ since 2000(過去の情報です)

松尾ぐみは、東大石塚研の学生を中心として、自然言語処理、Web上の情報処理、推論などの研究を行うグループです。だいたい常時10~20名くらいの学生・若手研究者から構成されています。卒論や修論といったレベルにとどまらず、本質的なよい研究を目指します。活動内容は、

です。あとは、適宜、個人的に打ち合わせします。

松尾ぐみでは、Web上の情報を整理・構造化・知識化する「高次Webマイニング」というテーマを中心に研究を進めていきます。自然言語処理、機械学習、推論、コミュニティなどさまざまな研究テーマを含みます。

松尾ぐみは2013年ごろまでで休止し、Deep Learning勉強会が立ち上がっています。

論文の書き方

論文の執筆についてまとめています。

よい研究をするために

よい研究といっても、アイディアだけでできるものではありません。

という段階を繰り返すことが必要です。逆に言うと、この段階を何サイクルも回せば、1ヶ月でもよい研究はできますし、このサイクルを回せなければ1年かかっても研究は進みません。もちろん、研究としてのメインは研究の内容について自分で考えることですが、上の3つをバランスよくやる必要があります。行き詰まったときには、文献を探すか、ディスカッションすれば、たいてい次にやるべきことが分かります。

研究をしていると、どうしても「どうせ他の人には分からないや」と思って、閉じこもりがちになります。でも、他の人に内容を分かってもらうことも大事ですし、違った視点から意見をもらうことは、研究を進める近道です。松尾ぐみの打ち合わせはできるだけフランクな雰囲気でやるので、発表したければどんどん発表して、積極的に活用してください。

また、「こうやればきっとできるはず。」「でもこういう問題があるから・・・」と思って、実装せずに考えるだけになってしまうこともよくあります。でも、実装し結果を見てはじめて気づくことがとてもたくさんあります。たくさんの賢い研究者が同じ分野の研究をしているのですから、少し考えて分かることは、みんなわかっています。対象をしっかり理解するために、いろいろやってみることがよい研究をするために必要です。面倒がらずに手を動かす。これが大事です。

それから、「自分のテーマは、こういう新しいことだから、他にやっている研究はない」とか「関連研究は先輩の引いているこれだけ」と思って文献調査を怠りがちです。でも、世界中の多くの研究者が長い年月、たくさんの研究をしています。調べれば関連した研究はあります。でも、探し出すのはそんなに簡単ではありません。他のいろいろな研究を理解して初めて、自分の研究が他の研究とどう位置づけられるのか分かります。きちんと文献調査できることも研究能力のひとつです。

研究には、仮定があります。その仮定は、現象の抽象化であったり、目的の固定化であったり、さまざまです。その上で、いろいろな方法を提案するわけですが、その仮定の有効な範囲と限界を理解することが大切です。ある分野にとって、ある仮定がほぼ暗黙的になっていたり、先輩の研究の中で行われた仮定が所与のものとして引き継がれたりします。「本当にこの目的、この方法でいいのかな」と常に自分で考えて、理解しながら研究することが大事です。金出先生の本「素人のように考え、玄人として実行する」はとても参考になります。

文献調査

まず、調べたいテーマについてGoogleで調べてみましょう。そして、日本語の論文をいくつか探しだしましょう。Web上に論文本体がない場合は、図書館(応物・計数図書館か情報科学の図書館がお勧め)で探しましょう。教科書的な本を読むことも必要です。また、関連する英語の文献が必ずあるので、だいたい内容を把握した後は、英語の文献を中心にサーベイします。特にNECのCiteseerはとてもたくさん論文がありますので、関連する論文から芋づる式にたくさんとって来れます。主要な国際会議が分かれば、そこの新しい論文を中心に関連したものがないか探すこともあります。たくさん論文を集めていくつか読んでいくうちに、その研究分野でのだいたいの問題意識、研究の流れ、引用すべき論文が分かってきます。ひとつの論文を時間をかけて読むよりも、その論文で言いたい内容を把握することを重点に流し読みをして、本当に重要だと思うものを特にきっちり読むスタイルが効率的です。

いずれにしても、最終的には国内・国外問わず、自分の研究する分野でどういう研究が行われているのか概観すること、その分野における主要な論文のいくつかを把握して読んでおくこと、自分の手法に近いいくつかの論文について正確に読んでおくことが必要です。

研究テーマについて

研究テーマを決めること自体、非常に難しいことです。卒論ではテーマが与えられます。修士ではだいたいの分野が与えられます。博士では基本的に自分で考えます。先生や先輩と相談しながら、決めればいいと思います。これについて、ここではあまり深入りしません。というのも、よい研究テーマとは、学会の研究の流れや社会の流れにおいて、重要な貢献をするようなものですが、たどっていけば実は国としての科学技術政策の方針に影響されています。研究室全体としての方向性の戦略などもあります。私がやりたい研究もいろいろありますので、興味があれば一緒にやりましょう。

研究のステップ

研究のゴールは、新しい手法・知見を発見して、論文を書くことです。(最近は特許を取る、実用化する、ビジネスとして立ち上げることも重要になってきています。)論文執筆についてまとめてみましたので、こちらも参考にしてください。英語の論文の執筆についてもまとめてみました。論文を書くために、

などのステップがあります。最終的には論文誌(人工知能学会誌、情報処理学会誌、電子情報通信学会誌など)を目指すことになります。卒論では全国大会での発表、修士では研究会での発表が最低ラインだと思いますが、できるだけ論文誌の投稿を目指しましょう。 全国大会は基本的に発表すること自体が目的の場です。(人工知能学会の全国大会は、活気があって楽しいですが。)研究会は、より長い時間(30分程度)の発表ができ、それなりのコメントをもらえます。どちらも積極的に交流すれば、他の学生や先生と知り合いになるよい機会です。 国際会議および論文誌では、査読者が論文を読んで、採否およびコメントをくれます。通常、研究者としての業績は、論文誌(と国際会議)の論文数で判断されます。例えば、東工大なら論文誌1点、国際会議0.5点で2点以上が博士課程修了の条件、NIIなら論文誌1本以上が条件などとなっています。東大は明示的な基準はありませんが、修士課程の研究で論文誌1本、博士課程修了までに3本くらいを目安にがんばればいいと思います。

To Pagetop