データマイニング(対戦型)データ分析

この記事はJRA-VAN「データマイニング(対戦型)」がテーマのデータ分析です。ここでいうデータマイニングとは、レース結果を予測するために出走馬を評価するJRA-VANの数値を指します。その着回数と回収率がどうなるのか、次の条件で集計してみました。

JRA 2014年～2019年

重賞競走(平地)とリステッド競走

マイニング予想順位でグループ化

この条件にした理由は、重賞レースしか馬券は買わないって人のためになるデータにすることと、出走馬のレベルがある程度同じレースだけで集計したいからです。対象となったレースは824件。結果はこちら。

マイニング予想順位	1着回数	2着回数	3着回数	出現数	単勝回収率	馬連回収率	3連複回収率
1	156	141	93	835	74	79	59
2	123	100	101	818	85	69	76
3	96	103	97	837	63	63	76
4	86	80	76	821	93	63	49
5	61	58	56	821	70	58	54
6	65	63	69	835	85	71	77
7	53	50	44	812	70	65	91
8	27	41	50	824	57	47	50
9	30	42	45	805	48	57	56
10	27	46	42	787	44	47	48
11	25	28	43	743	55	53	55
12	30	22	37	717	57	55	62
13	19	15	24	645	68	32	30
14	14	13	20	596	155	48	41
15	10	13	11	534	56	35	29
16	3	9	7	451	8	35	96
17	0	0	6	210	0	0	145
18	0	2	2	166	0	10	7

同じ条件で集計した「データマイニング(走破タイム型)データ分析」より少しマシな数字になったかな？相変わらず低評価な出走馬の回収率が良いってのは指数としてどうなんだ。生のままでは良い数字が目立たないのでデータマイニングを使うなら、さらに人気薄でフィルタするなど加工が必要なようです。今回は重賞競走だけの集計結果ですが、他にデータマイニングが得意とする競走条件があるのか。馬券を買う際の参考にしてください。

「馬連回収率」とは馬連を総流しで買い続けた場合の数字です。つまり、その馬が2着以内に入れば馬券は的中っていう計算です。「3連複回収率」も馬連と同じ、総流しで買い続けてその馬が3着以内なら的中です。経験的に連勝式の回収率は、還元率を超えていれば「買い」のパターンです。JRA馬連なら77.5%以上といったように。なぜなら総流しで馬券を毎回買うことなんて現実的にありませんから。見込みのある実力馬だけに相手を絞って買いますよね？

勝率や単勝回収率は、同じ条件に該当する馬が複数出走するレースでは、あまり意味を持ちません。なぜなら、同じ条件の馬同士で星の潰しあいをするからです。例えば、「オークスは牝馬の勝率が100％」と言ってるようなもんです。なので、勝率や単勝回収率はあくまで目安としてください。

この記事のデータ作成に使用したSQLを有料会員に公開しています。ユーザーがカスタマイズして利用することも可能ですし、SQLを学習したい方の参考にもなります。