この記事はJRA-VAN「データマイニング(走破タイム型)」がテーマのデータ分析です。ここでいうデータマイニングとは、レース結果を予測するために出走馬を評価するJRA-VANの数値を指します。その着回数と回収率がどうなるのか、次の条件で集計してみました。
- JRA 2014年~2019年
- 重賞競走(平地)とリステッド競走
- マイニング予想順位でグループ化
この条件にした理由は、重賞レースしか馬券は買わないって人のためになるデータにすることと、出走馬のレベルがある程度同じレースだけで集計したいからです。対象となったレースは824件。結果はこちら。
マイニング予想順位 | 1着回数 | 2着回数 | 3着回数 | 出現数 | 単勝回収率 | 馬連回収率 | 3連複回収率 |
01 | 148 | 121 | 103 | 824 | 72 | 77 | 63 |
02 | 111 | 97 | 94 | 824 | 77 | 67 | 75 |
03 | 90 | 82 | 92 | 824 | 70 | 60 | 65 |
04 | 78 | 78 | 78 | 824 | 90 | 56 | 49 |
05 | 80 | 60 | 59 | 824 | 77 | 71 | 55 |
06 | 52 | 65 | 57 | 824 | 66 | 55 | 43 |
07 | 34 | 58 | 41 | 822 | 64 | 57 | 89 |
08 | 52 | 57 | 58 | 818 | 78 | 64 | 58 |
09 | 39 | 47 | 43 | 805 | 53 | 43 | 37 |
10 | 27 | 36 | 43 | 785 | 59 | 46 | 50 |
11 | 25 | 21 | 38 | 749 | 49 | 40 | 73 |
12 | 25 | 23 | 34 | 713 | 74 | 51 | 48 |
13 | 21 | 22 | 27 | 650 | 75 | 56 | 84 |
14 | 19 | 20 | 22 | 587 | 40 | 51 | 56 |
15 | 10 | 12 | 23 | 527 | 45 | 34 | 41 |
16 | 10 | 14 | 5 | 442 | 100 | 46 | 39 |
17 | 3 | 8 | 4 | 210 | 39 | 34 | 91 |
18 | 1 | 5 | 2 | 154 | 4 | 19 | 145 |
これは同じ条件で集計した「単勝人気順別データ分析」のほうが優れてるっていう残念な結果に。着回数が人気に劣るのは仕方ないとしても、回収率まで劣るようでは指数の価値が無い。最も評価が低い馬の3連複回収率の数字が最も優秀ってのが笑える。みんなが使うからなのか、重賞競走にかぎったデータなのか…。馬券を買う際の参考にしてください。
「馬連回収率」とは馬連を総流しで買い続けた場合の数字です。つまり、その馬が2着以内に入れば馬券は的中っていう計算です。「3連複回収率」も馬連と同じ、総流しで買い続けてその馬が3着以内なら的中です。経験的に連勝式の回収率は、還元率を超えていれば「買い」のパターンです。JRA馬連なら77.5%以上といったように。なぜなら総流しで馬券を毎回買うことなんて現実的にありませんから。見込みのある実力馬だけに相手を絞って買いますよね?
この記事のデータ作成に使用したSQLを有料会員に公開しています。ユーザーがカスタマイズして利用することも可能ですし、SQLを学習したい方の参考にもなります。
コメント