データマイニング(走破タイム型)データ分析

データ分析

この記事はJRA-VAN「データマイニング(走破タイム型)」がテーマのデータ分析です。ここでいうデータマイニングとは、レース結果を予測するために出走馬を評価するJRA-VANの数値を指します。その着回数と回収率がどうなるのか、次の条件で集計してみました。

  • JRA 2014年~2019年
  • 重賞競走(平地)とリステッド競走
  • マイニング予想順位でグループ化

この条件にした理由は、重賞レースしか馬券は買わないって人のためになるデータにすることと、出走馬のレベルがある程度同じレースだけで集計したいからです。対象となったレースは824件。結果はこちら。

マイニング予想順位1着回数2着回数3着回数出現数単勝回収率馬連回収率3連複回収率
01148121103824727763
021119794824776775
03908292824706065
04787878824905649
05806059824777155
06526557824665543
07345841822645789
08525758818786458
09394743805534337
10273643785594650
11252138749494073
12252334713745148
13212227650755684
14192022587405156
15101223527453441
16101454421004639
17384210393491
18152154419145

これは同じ条件で集計した「単勝人気順別データ分析」のほうが優れてるっていう残念な結果に。着回数が人気に劣るのは仕方ないとしても、回収率まで劣るようでは指数の価値が無い。最も評価が低い馬の3連複回収率の数字が最も優秀ってのが笑える。みんなが使うからなのか、重賞競走にかぎったデータなのか…。馬券を買う際の参考にしてください。

「馬連回収率」とは馬連を総流しで買い続けた場合の数字です。つまり、その馬が2着以内に入れば馬券は的中っていう計算です。「3連複回収率」も馬連と同じ、総流しで買い続けてその馬が3着以内なら的中です。経験的に連勝式の回収率は、還元率を超えていれば「買い」のパターンです。JRA馬連なら77.5%以上といったように。なぜなら総流しで馬券を毎回買うことなんて現実的にありませんから。見込みのある実力馬だけに相手を絞って買いますよね?

最後に。この記事のデータ作成に使用したSQLを有料会員に公開しています。ユーザーがカスタマイズして利用することも可能ですし、SQLを学習したい方の参考にもなります。

SQLファイルのダウンロードと使い方

コンテンツの残りを閲覧するにはログインが必要です。 お願い . あなたは会員ですか ? 会員について

コメント