この記事はJRA-VAN「データマイニング(対戦型)」がテーマのデータ分析です。ここでいうデータマイニングとは、レース結果を予測するために出走馬を評価するJRA-VANの数値を指します。その着回数と回収率がどうなるのか、次の条件で集計してみました。
- JRA 2014年~2019年
- 重賞競走(平地)とリステッド競走
- マイニング予想順位でグループ化
この条件にした理由は、重賞レースしか馬券は買わないって人のためになるデータにすることと、出走馬のレベルがある程度同じレースだけで集計したいからです。対象となったレースは824件。結果はこちら。
マイニング予想順位 | 1着回数 | 2着回数 | 3着回数 | 出現数 | 単勝回収率 | 馬連回収率 | 3連複回収率 |
1 | 156 | 141 | 93 | 835 | 74 | 79 | 59 |
2 | 123 | 100 | 101 | 818 | 85 | 69 | 76 |
3 | 96 | 103 | 97 | 837 | 63 | 63 | 76 |
4 | 86 | 80 | 76 | 821 | 93 | 63 | 49 |
5 | 61 | 58 | 56 | 821 | 70 | 58 | 54 |
6 | 65 | 63 | 69 | 835 | 85 | 71 | 77 |
7 | 53 | 50 | 44 | 812 | 70 | 65 | 91 |
8 | 27 | 41 | 50 | 824 | 57 | 47 | 50 |
9 | 30 | 42 | 45 | 805 | 48 | 57 | 56 |
10 | 27 | 46 | 42 | 787 | 44 | 47 | 48 |
11 | 25 | 28 | 43 | 743 | 55 | 53 | 55 |
12 | 30 | 22 | 37 | 717 | 57 | 55 | 62 |
13 | 19 | 15 | 24 | 645 | 68 | 32 | 30 |
14 | 14 | 13 | 20 | 596 | 155 | 48 | 41 |
15 | 10 | 13 | 11 | 534 | 56 | 35 | 29 |
16 | 3 | 9 | 7 | 451 | 8 | 35 | 96 |
17 | 0 | 0 | 6 | 210 | 0 | 0 | 145 |
18 | 0 | 2 | 2 | 166 | 0 | 10 | 7 |
同じ条件で集計した「データマイニング(走破タイム型)データ分析」より少しマシな数字になったかな?相変わらず低評価な出走馬の回収率が良いってのは指数としてどうなんだ。生のままでは良い数字が目立たないのでデータマイニングを使うなら、さらに人気薄でフィルタするなど加工が必要なようです。今回は重賞競走だけの集計結果ですが、他にデータマイニングが得意とする競走条件があるのか。馬券を買う際の参考にしてください。
「馬連回収率」とは馬連を総流しで買い続けた場合の数字です。つまり、その馬が2着以内に入れば馬券は的中っていう計算です。「3連複回収率」も馬連と同じ、総流しで買い続けてその馬が3着以内なら的中です。経験的に連勝式の回収率は、還元率を超えていれば「買い」のパターンです。JRA馬連なら77.5%以上といったように。なぜなら総流しで馬券を毎回買うことなんて現実的にありませんから。見込みのある実力馬だけに相手を絞って買いますよね?
勝率や単勝回収率は、同じ条件に該当する馬が複数出走するレースでは、あまり意味を持ちません。なぜなら、同じ条件の馬同士で星の潰しあいをするからです。例えば、「オークスは牝馬の勝率が100%」と言ってるようなもんです。なので、勝率や単勝回収率はあくまで目安としてください。
この記事のデータ作成に使用したSQLを有料会員に公開しています。ユーザーがカスタマイズして利用することも可能ですし、SQLを学習したい方の参考にもなります。
コメント