Reports

同期で交流を深めながらデータ分析の技を磨く「データサイエンスモクモクLT勉強会」

こんにちは、リクルートジョブズでデータ分析やエンジニアリングをしている新卒2年目の古澤です。

実データの分析や論文のアルゴリズム実装など、データサイエンティスト的な仕事を普段からやっている私ですが、そうなると基礎的な数学・統計の知識や最新の論文情報など日頃のインプットが超重要となります。
1人で勉強することもありますが、みんなで勉強した方が学ぶことも多くモチベーションも続くので、主に同期入社を中心として社内で集まって勉強会を定期開催しています。

今日はデータ解析系の職種として入社した我々が日頃どんな勉強会をして知識のインプットや共有を行っているかについて、その歴史的変遷と共にご紹介したいと思います。

1年目(前半):PRMLの輪読

データサイエンス系の勉強会の定番といえばPRML(脚注:『パターン認識と機械学習』)であり、勉強会の王道的な形式といえば輪読です。

そこで、1年目は基礎的な部分をきちんと押さえようということで、PRMLを輪読形式で読み進めていく形の勉強会をしておりました。

章ごとに担当者を決めて月に数回集まって、担当者が解説を聞いて参加者が聞くというものです。

(↑章の担当を決めて、スライドで発表)

PRMLについては、やはり難しい部分が多く、参加者も四苦八苦しながら読み進めていきました。 そうして1年目の前半は基礎的な統計や機械学習の知識を抑えていきました。 しかし、こうした勉強会の形式ではいくつか課題もあったので次に示すような形式に途中で変更することとなりました。

1年目(後半):PRMLを解く

PRMLの輪読についてはそれなりにうまく回っていたのですが、輪読担当者以外の当事者意識が薄れてしまうということで、PRMLにある問題を複数参加者で解いて解説するという形式に変えてみました。

(↑ 問題の解き方を解説してもらい、みんなで確認する)

問題の担当者が解き方をみんなに解説しながら、周辺知識を身につけるというものです。 正直PRMLの問題はどれも「激ムズ」でまったく解けないものもあったりはしましたが、みんなで協力しつつ実力をつけていくという感じでした。

(そして、ネット上の回答に何度も助けられたのでした…。)

1年目(最後):1年で学んだことをそれぞれ発表

勉強会とはちょっと違いますが、スピンオフ企画として1年間でそれぞれのメンバーがどんな壁にぶつかり、何を学び、何を達成したのかといった発表会も行いました。
データ解析職の同期は学んできたことやスキルセットは近しいのですが、それぞれ会社で担当している事業ドメインがバラバラなため(人材や消費、住宅など多岐にわたる)、どのように機械学習手法を生かしているのかお互いに紹介することによって多くの学びを得ることができました。
これは、とても刺激的で楽しい会となりました。

2年目:緑本をその場で読み進めて、わかったことをLT形式で共有する

とはいえ、輪読形式は発表者の負担が大きいので、2年目は負担を減らして参加しやすくしてみました。 ここがタイトルになっている「データサイエンスモクモクLT勉強会」の内容です

1年目の反省などを踏まえて、現在、以下のような形式で勉強会を進めています。

  • 書籍をなんらか決めて読む、グループとして推奨は緑本(『データ解析のための統計モデリング入門』)
  • 勉強会の終わりに2分〜5分でその日学んだことをスライドで発表(参加者全員)
  • 2〜5分で発表する内容がある人は、遅刻しても、本読まなくても、雑談していてもOK

また、勉強会を進めるにあたって重視するポイントも3つほど掲げています。

  • 知識のインプットとアウトプット
    会の中で「なんらかの知識・技術を身につけて、誰か(参加者)に伝える」というのをきちんとやっていきましょう。
  • 短時間で学びを共有する
    後半の学んだことプレゼンは「いかに短時間で正確に伝えられるか」のトレーニングの場として使っていきましょう。
  • データっぽい人が集まる場があるのが良い
    とくに用事がなくてもプレゼンだけ用意して参加しましょう。なんかお話できる場があるだけでも良いかと思われます。

ということで、現在上記のような内容で進めています。
初回は緑本の中のポアソン分布について参加者で説明しあい、議論が大いに弾みました。
プレゼンのスライドを使って発表してくれる人、Jupyter Notebookでコードを見せてくれる人、iPadの手書きノートをベースに説明する人など、様々な角度から説明が聞けてとても勉強になりました。
今後はしばらくこの形式で勉強会を進めていこうと思っています。

まとめ

上記のように色々試行錯誤しながら形を変えてきてはいますが、常にインプットをしていこうという気持ちは多くの社員が持っています。 そのため勉強会自体も楽しく、刺激的なものとなっております。
時折、忙しくて開催できなかったりする日もあるのですが、今後も定期的に開催していきたい気持ちです。
興味のある方はいつでもウェルカムですので、一緒にデータサイエンスを勉強していきましょう!

その他:勉強会の支援がある

上記の勉強会ですが、主に業務後などに開催されることが多いのですが、お腹が減っても大丈夫なように食事代の支援があります。なので、毎回参加者はご飯が出ます。
過去の内容だと以下のような食事を用意しました。

  • 寿司
  • ピザ
  • 牛タン弁当

おいしいもの食べながら勉強できるのでとても良いです!


PROFILE

古澤 智裕(ふるさわ ともひろ)
株式会社リクルートジョブズ /データマネジメント部
コアテクノロジーグループ

データサイエンスの知識を生かして現実の課題を解くことに喜びを感じます。大学では図書館情報学を勉強していたので、図書館が大好きです。

Reports