データマイニング(対戦型)データ分析

データ分析

この記事はJRA-VAN「データマイニング(対戦型)」がテーマのデータ分析です。ここでいうデータマイニングとは、レース結果を予測するために出走馬を評価するJRA-VANの数値を指します。その着回数と回収率がどうなるのか、次の条件で集計してみました。

  • JRA 2014年~2019年
  • 重賞競走(平地)とリステッド競走
  • マイニング予想順位でグループ化

この条件にした理由は、重賞レースしか馬券は買わないって人のためになるデータにすることと、出走馬のレベルがある程度同じレースだけで集計したいからです。対象となったレースは824件。結果はこちら。

マイニング予想順位1着回数2着回数3着回数出現数単勝回収率馬連回収率3連複回収率
115614193835747959
2123100101818856976
39610397837636376
4868076821936349
5615856821705854
6656369835857177
7535044812706591
8274150824574750
9304245805485756
10274642787444748
11252843743555355
12302237717575562
13191524645683230
141413205961554841
15101311534563529
1639745183596
1700621000145
180221660107

同じ条件で集計した「データマイニング(走破タイム型)データ分析」より少しマシな数字になったかな?相変わらず低評価な出走馬の回収率が良いってのは指数としてどうなんだ。生のままでは良い数字が目立たないのでデータマイニングを使うなら、さらに人気薄でフィルタするなど加工が必要なようです。今回は重賞競走だけの集計結果ですが、他にデータマイニングが得意とする競走条件があるのか。馬券を買う際の参考にしてください。

「馬連回収率」とは馬連を総流しで買い続けた場合の数字です。つまり、その馬が2着以内に入れば馬券は的中っていう計算です。「3連複回収率」も馬連と同じ、総流しで買い続けてその馬が3着以内なら的中です。経験的に連勝式の回収率は、還元率を超えていれば「買い」のパターンです。JRA馬連なら77.5%以上といったように。なぜなら総流しで馬券を毎回買うことなんて現実的にありませんから。見込みのある実力馬だけに相手を絞って買いますよね?

「着回数」は、同じ条件に該当する馬が同じレースに何頭か出走する場合、あまり意味が無い数字になります。同じ条件の馬が星の潰しあいをするからです。例えば「オークスは牝馬の勝率100%」と言ってるようなもんです。なので「着回数」の数字はあくまで目安としてください。

最後に。この記事のデータ作成に使用したSQLを有料会員に公開しています。ユーザーがカスタマイズして利用することも可能ですし、SQLを学習したい方の参考にもなります。

SQLファイルのダウンロードと使い方

コンテンツの残りを閲覧するにはログインが必要です。 お願い . あなたは会員ですか ? 会員について

コメント