データマイニング(対戦型)データ分析

データ分析

この記事はJRA-VAN「データマイニング(対戦型)」がテーマのデータ分析です。ここでいうデータマイニングとは、レース結果を予測するために出走馬を評価するJRA-VANの数値を指します。その着回数と回収率がどうなるのか、次の条件で集計してみました。

  • JRA 2014年~2019年
  • 重賞競走(平地)とリステッド競走
  • マイニング予想順位でグループ化

この条件にした理由は、重賞レースしか馬券は買わないって人のためになるデータにすることと、出走馬のレベルがある程度同じレースだけで集計したいからです。対象となったレースは824件。結果はこちら。

マイニング予想順位 1着回数 2着回数 3着回数 出現数 単勝回収率 馬連回収率 3連複回収率
1 156 141 93 835 74 79 59
2 123 100 101 818 85 69 76
3 96 103 97 837 63 63 76
4 86 80 76 821 93 63 49
5 61 58 56 821 70 58 54
6 65 63 69 835 85 71 77
7 53 50 44 812 70 65 91
8 27 41 50 824 57 47 50
9 30 42 45 805 48 57 56
10 27 46 42 787 44 47 48
11 25 28 43 743 55 53 55
12 30 22 37 717 57 55 62
13 19 15 24 645 68 32 30
14 14 13 20 596 155 48 41
15 10 13 11 534 56 35 29
16 3 9 7 451 8 35 96
17 0 0 6 210 0 0 145
18 0 2 2 166 0 10 7

同じ条件で集計した「データマイニング(走破タイム型)データ分析」より少しマシな数字になったかな?相変わらず低評価な出走馬の回収率が良いってのは指数としてどうなんだ。生のままでは良い数字が目立たないのでデータマイニングを使うなら、さらに人気薄でフィルタするなど加工が必要なようです。今回は重賞競走だけの集計結果ですが、他にデータマイニングが得意とする競走条件があるのか。馬券を買う際の参考にしてください。

「馬連回収率」とは馬連を総流しで買い続けた場合の数字です。つまり、その馬が2着以内に入れば馬券は的中っていう計算です。「3連複回収率」も馬連と同じ、総流しで買い続けてその馬が3着以内なら的中です。経験的に連勝式の回収率は、還元率を超えていれば「買い」のパターンです。JRA馬連なら77.5%以上といったように。なぜなら総流しで馬券を毎回買うことなんて現実的にありませんから。見込みのある実力馬だけに相手を絞って買いますよね?

「着回数」は、同じ条件に該当する馬が同じレースに何頭か出走する場合、あまり意味が無い数字になります。同じ条件の馬が星の潰しあいをするからです。例えば「オークスは牝馬の勝率100%」と言ってるようなもんです。なので「着回数」の数字はあくまで目安としてください。

最後に。この記事のデータ作成に使用したSQLを有料会員に公開しています。ユーザーがカスタマイズして利用することも可能ですし、SQLを学習したい方の参考にもなります。

SQLファイルのダウンロードと使い方

コンテンツの残りを閲覧するにはログインが必要です。 お願い . あなたは会員ですか ? 会員について

コメント