『リクナビDMPフォロー』とは
2019年12月4日 「『リクナビDMPフォロー』の仕組み」を新規追加
『リクナビDMPフォロー』は、対象となる学生の方の選考離脱や内定辞退の「可能性」を示すサービスでした。具体的には、契約企業における前年度の「選考参加者/辞退者、または、内定承諾者/辞退者」の「『リクナビ』と当社が提携する就職情報サイトにおける業界ごとの閲覧履歴」(以下、「業界ごとの閲覧履歴」と記載)から、応募学生の方の当該契約企業に対する選考離脱や内定辞退の可能性を予測するためのアルゴリズムを作成します。
そのアルゴリズムを用いて、当該契約企業が指定する当年度の応募学生について、「業界ごとの閲覧履歴」などから当該契約企業における選考離脱や内定辞退の可能性をスコア化し、当該契約企業に対して提供していました。
『リクナビDMPフォロー』は、昨今の新卒採用における内定辞退数の増加を受けて企画されたサービスであり、企業から学生への、より最適なフォロー活動にご活用いただくこと、ひいてはこれにより学生の皆さまにより納得度の高い入社につなげていただくことを目的として開発されました。サービス提供にあたっては、『リクナビDMPフォロー』をご利用いただく契約企業には、当社から提供したスコアを、選考における合否判断の根拠には使用しないようお約束いただき、また、当社担当者が実際の活用方法を確認しておりました。
しかしながら、前述のような目的の実現に向けた視野に留まり、新規事業の研究開発としての位置づけで本サービスの開発・提供を進めてしまった結果、学生の皆さまに大きな不安を引き起こしてしまったこと、また、個人情報保護委員会や東京労働局等各所より勧告・指導いただいているとおり、法的検証等が不十分な状態でのサービス提供となっていたことを、深く反省しております。
『リクナビDMPフォロー』の仕組み
『リクナビDMPフォロー』では、サービス提供の仕組みを2019年2月以前と同年3月以降で変更しております。以下では、それぞれの仕組みについてご説明いたします。なお、契約企業からお預かりするデータやスコア算出の詳細については、後述の「スコア提供に関するデータの流れについて」でご説明いたします。
2019年2月以前の仕組み <アンケートスキーム期>
当社の委託先であるリクルートコミュニケーションズは、ウェブアンケートを通じて、「Cookie情報」と「契約企業固有の応募者管理ID」(図内では「管理ID」と記載)を直接取得していました。また、同社は、『リクナビ』のウェブサイトを通じて「Cookie情報」およびリクナビサイト上での「業界ごとの閲覧履歴」を直接取得していました。
そして、同社は「契約企業固有の応募者管理ID」とリクナビサイト上での「業界ごとの閲覧履歴」をウェブアンケートとリクナビサイトの「Cookie情報」によって紐づけ、スコアを算出していました。
なお、同社では、これらの情報だけで特定の個人を識別することはできません。
<図1> アンケートスキームにおけるデータの流れ
2019年3月以降の仕組み <プライバシーポリシースキーム(以下、「PPスキーム」と記載)期>
当社は、契約企業の委託先企業として、契約企業より、委託業務に必要な限度で氏名などの個人情報の提供を受けます。その後、当社委託先であるリクルートコミュニケーションズにおいて、提供された個人情報とリクナビに登録された個人情報を紐づけた上で、当該学生のリクナビサイト上での「業界ごとの閲覧履歴」などからスコアを算出していました。
<図2> PPスキームにおけるデータの流れ
スコア提供に関するデータの流れ
1. スコア提供に必要な学生のデータを取得する、2. アルゴリズムを作成し、スコアを算出する、3. 契約企業にスコアを提供する、という段階で、スコアを提供しておりました。
1. スコア提供に必要な学生のデータを取得する
- アンケートスキーム期
当社委託先であるリクルートコミュニケーションズにおいて、ウェブアンケートを通じて、以下の情報を直接取得していました。
●契約企業固有の応募者管理ID(契約企業が付与していた応募者の管理ID)
●Cookie情報
●選考プロセスにおける辞退・承諾情報
- PPスキーム期
契約企業から学生に関する以下の情報をお預かりしておりました。これは、当社で「リクナビ会員情報と閲覧履歴との紐づけ」、あるいは「アルゴリズム作成」「スコア算出」にあたって必要な情報として、原則、契約企業共通でお預かりしていた情報です。
● 応募者管理ID(契約企業が付与していた応募者の管理ID)
● 姓名、メールアドレス
● 大学、学部、学科
● 選考プロセスにおける辞退・承諾情報
また、契約企業によって異なる「企業独自管理情報(※1)」についてもお預かりしていた場合もございます。
※1|企業独自管理情報の種類は多岐にわたりますが、以下が一例です。
● 契約企業の説明会予約有無
● エントリーシートの記述内容
● 契約企業が利用していた適性検査の項目の値
● 応募職種
2. アルゴリズムを作成し、スコアを算出する
契約企業における前年度の「選考参加者/辞退者、または、内定承諾者/辞退者」の「業界ごとの閲覧履歴」や前述の契約企業からお預かりした情報から、応募学生の当該契約企業に対する選考離脱や内定辞退の可能性を予測するためのアルゴリズムを作成します。そのアルゴリズムを用いて、当該契約企業から提供を受けた今年度の応募学生の「業界ごとの閲覧履歴」から、当該応募学生の当該契約企業に対する選考離脱や内定辞退の可能性をスコア化していました。スコア算出において参照していた閲覧履歴は、『リクナビ』と当社が提携する就職情報サイトにおける業界ごとの閲覧履歴(ページの閲覧数など)であり、それ以外のデータ(検索エンジンでの検索履歴やサイトの利用履歴など)は参照しておりません。また、学生がどの企業に応募しているかといったエントリー情報や、志望業種など学生が自らリクナビ内に登録した情報も、スコア算出に一切利用しておりません。
※ アルゴリズムの具体的な作成方法については、後述の「『リクナビDMPフォロー』におけるアルゴリズム」でご説明いたします。
3. 契約企業にスコアを提供する
スコアの呼称は契約企業によって異なる場合があります(予測スコア、score、prediction
など)。スコアは、0.10、0.20…のような値として算出したものとし、また契約企業による指定がある場合には、下記の一例のように任意の表現にも変換したうえで、提供スコアとさせていただいておりました。なお、スコアが算出できない場合は、空白、N/A、スコアなし等の記載になります。
<図3>提供データの一例
『リクナビDMPフォロー』におけるアルゴリズム
<図4>アルゴリズム作成の流れ(2019年10月9日「利用データ」の項目に「閲覧行動」を追記)
図4のように、「選考または内定を辞退した学生」と「しなかった学生」の二つの群における、閲覧行動や契約企業からお預かりした情報の違いを分析することで、当該企業で選考または内定辞退しやすい学生の特徴が特定され、アルゴリズムが作成されます。
アルゴリズムは、契約企業ごとの前年度の応募者データにもとづいて、企業ごと、提供回ごとに異なるものが作成されます。「『リクナビ』の応募企業以外のページを見ているとスコアの値が高くなる」といった、一律の基準や尺度はございません。