【未来デザイン部】JAC 中高生予測部門 最終審査会進出決定!!【今年度全国大会3つ目】

こんにちは、未来デザイン部です。

今年度の未来デザイン部は快進撃です!

なんと、すでに全国出場を決めているJAPAN AI CUPですが、中高生DS探究部門に続き、中高生予測部門においても優秀な結果を残した部員三人が、全国出場を勝ち取りました!

また、うち一人はすでに「優秀スコア賞」を獲得しています!!

現在は、3/27に東京で行われる最終審査会の準備で大忙しです。

ただ解法を説明するだけでなく、審査員に伝わりやすく、また興味深い提案ができるようなプレゼン作成を目指しています。

「一体なんの大会なんだ」という方のために、少しだけ、今回の大会の概要を説明します。

本大会は、「与えられた4万人分の1年間(2024/2~2025/1)のスーパーでの購買データを基に、1か月(2025/2)の間に4万人が再びスーパーに来るかどうか」を予測し、その正解率を競います。

「そんなのを自動で予測するモデルなんて作れるの?」と思う方もいらっしゃると思いますが、LightGBMやCatBoostと呼ばれる、予測に特化したAI(アルゴリズム)がありまして、これらを特訓してモデルを作成するのです。

先ほど、1か月の間に4万人の再訪予測をすると話しましたが、実は既に3万人分の答え(再訪したか)はこちらに与えられています。

「4万人分の1年間の購買データ」「3万人分の再訪結果」二つのデータを使用して、「残り1万人分の再訪を予想」し、その正解率で順位決定がなされます。(以下に図を用意しました。Geminiで生成)

この大会、「予測モデルの特訓方法」で差がつきます。

AI(アルゴリズム)に、単に購買データと正解を読み込ませるだけでなく、「どの特徴に着目させるか」といった指示が重要です。

例えば、「スーパーでお米を買う人は定期的に来る可能性が高いだろうから、米を買ったかどうかをAIに注視させよう」など、この着眼点によって、各個人が作成したモデルに強く個性が表れます。

因みに、肝心のスコアですが、「1.00000を満点」とした時に、「4位0.89788」「5位0.89787」というように、百分率にして0.001%台を争う、非常にシビアな世界でした。(私も一般部門に参加しましたが、最終0.89744で90位と…スコアが伸び悩み苦労しました)

今回、最終審査会に出場を決めた三人の解法も三者三様でした。如何に個性があり、興味深い発表を出来るかが受賞のカギになります。

頑張って参ります。生徒らに応援よろしくお願いいたします。(漆谷)