データマイニング(走破タイム型)データ分析

データ分析

この記事はJRA-VAN「データマイニング(走破タイム型)」がテーマのデータ分析です。ここでいうデータマイニングとは、レース結果を予測するために出走馬を評価するJRA-VANの数値を指します。その着回数と回収率がどうなるのか、次の条件で集計してみました。

  • JRA 2014年~2019年
  • 重賞競走(平地)とリステッド競走
  • マイニング予想順位でグループ化

この条件にした理由は、重賞レースしか馬券は買わないって人のためになるデータにすることと、出走馬のレベルがある程度同じレースだけで集計したいからです。対象となったレースは824件。結果はこちら。

マイニング予想順位 1着回数 2着回数 3着回数 出現数 単勝回収率 馬連回収率 3連複回収率
01 148 121 103 824 72 77 63
02 111 97 94 824 77 67 75
03 90 82 92 824 70 60 65
04 78 78 78 824 90 56 49
05 80 60 59 824 77 71 55
06 52 65 57 824 66 55 43
07 34 58 41 822 64 57 89
08 52 57 58 818 78 64 58
09 39 47 43 805 53 43 37
10 27 36 43 785 59 46 50
11 25 21 38 749 49 40 73
12 25 23 34 713 74 51 48
13 21 22 27 650 75 56 84
14 19 20 22 587 40 51 56
15 10 12 23 527 45 34 41
16 10 14 5 442 100 46 39
17 3 8 4 210 39 34 91
18 1 5 2 154 4 19 145

これは同じ条件で集計した「単勝人気順別データ分析」のほうが優れてるっていう残念な結果に。着回数が人気に劣るのは仕方ないとしても、回収率まで劣るようでは指数の価値が無い。最も評価が低い馬の3連複回収率の数字が最も優秀ってのが笑える。みんなが使うからなのか、重賞競走にかぎったデータなのか…。馬券を買う際の参考にしてください。

「馬連回収率」とは馬連を総流しで買い続けた場合の数字です。つまり、その馬が2着以内に入れば馬券は的中っていう計算です。「3連複回収率」も馬連と同じ、総流しで買い続けてその馬が3着以内なら的中です。経験的に連勝式の回収率は、還元率を超えていれば「買い」のパターンです。JRA馬連なら77.5%以上といったように。なぜなら総流しで馬券を毎回買うことなんて現実的にありませんから。見込みのある実力馬だけに相手を絞って買いますよね?

最後に。この記事のデータ作成に使用したSQLを有料会員に公開しています。ユーザーがカスタマイズして利用することも可能ですし、SQLを学習したい方の参考にもなります。

SQLファイルのダウンロードと使い方

コンテンツの残りを閲覧するにはログインが必要です。 お願い . あなたは会員ですか ? 会員について

コメント