トラック別距離変更データ分析

データ分析

この記事は「距離変更」がテーマのデータ分析です。今走の競走条件を知らない競走馬たちが、前走からどのような競走条件の変化によって好走するのか検証します。その着回数と回収率がどうなるのか、次の条件で集計してみました。

  • JRA 2015年~2019年
  • 前走から90日以内に出走した馬
  • 前走と今走の距離の差が2F以内の馬
  • 前走と今走のトラックが同じ馬(芝→芝、ダート→ダート)
  • 出走馬の性別でグループ化(牡・セン、牝)
  • 距離変更でグループ化(延長、短縮、同距離)
  • 今走のコンピ指数順位(1位~8位)でグループ化

この条件にした理由は、巷でやってるような「延長・短縮・同距離」のグループ化だけではあまりにも抽象的すぎて、同じレースで同じ条件の馬が星を潰しあって、実際の競馬予想では全く役に立たない数字になるからです。なので私は、まず出走馬の性別で分類、さらに「大方がある程度勝負になると見込んでる馬」、ここでは「コンピ指数8位以内の馬」に分類して集計します。コンピ指数を使う理由は、単勝人気順では投票前とレース確定後で結果が違ってしまう場合があるからです。コンピ指数の人気順が単勝人気順とほぼ一致するというのは他の記事で証明済み。

結果はこちら。先ず牡・セン馬の芝から。データが多いので見づらいですが、最後に結論をまとめてます。

性別距離変更コンピ指数順位1着回数2着回数3着回数出現数単勝回収率馬連回収率3連複回収率
延長1321179131986817060
延長21971841331019797462
延長31551491521100825866
延長41121391441068916871
延長5731061071044807261
延長65590971119595654
延長74167711054876336
延長82938531016744839
短縮1328180126990867662
短縮2183182143978786961
短縮3127139147977726154
短縮4116123105935947348
短縮57279104947756448
短縮6437380881627065
短縮7315862903515671
短縮8253658887805157
同距離17064232942311767564
同距離23594072852170676553
同距離32552852702005745959
同距離41942112421942726559
同距離51401682051859766158
同距離6911141501751755547
同距離768951191593727158
同距離85663871510754043

続いて牝馬の芝。

性別距離変更コンピ指数順位1着回数2着回数3着回数出現数単勝回収率馬連回収率3連複回収率
延長11639654519848148
延長2999980599716157
延長3989273600996154
延長4697177674825453
延長5406766696615233
延長6304555669594540
延長7243348694635294
延長8113056737472942
短縮119612098670768384
短縮211711585663837660
短縮397112786848910072
短縮4507175604705252
短縮5556159644827553
短縮6355458600757172
短縮7363748640955536
短縮8172729586754652
同距離14372732191544726563
同距離22582632011485776654
同距離31762091791453746253
同距離41271681551459705866
同距離51111291231429836265
同距離690921481384867170
同距離775711021318956372
同距離849537411611066667

次は牡・セン馬のダート。

性別距離変更コンピ指数順位1着回数2着回数3着回数出現数単勝回収率馬連回収率3連複回収率
延長1308162141962816864
延長21871911501069778185
延長3123130113999767865
延長41081091031054848967
延長57093881053687348
延長65874771122776053
延長75063861106796071
延長83251731106695248
短縮13381911501064837360
短縮21941911471056837263
短縮31181461571063737267
短縮41131301071007929480
短縮581103112998785656
短縮6556282994776758
短縮7447970976696348
短縮8314865955776451
同距離19505914533055756763
同距離25185044072754827762
同距離33293663352550816859
同距離42452722752417827363
同距離51752132402359786662
同距離61391722072232815357
同距離7811401852095645651
同距離8691161191919879677

次は牝馬のダート。

性別距離変更コンピ指数順位1着回数2着回数3着回数出現数単勝回収率馬連回収率3連複回収率
延長1976939352766551
延長2617069406668388
延長3656650460948878
延長44260564758110758
延長5383752505877888
延長6203141504554095
延長7162626516777232
延長8132022542472433
短縮11229253417827456
短縮2846460421939488
短縮3586257452756254
短縮4444653427827574
短縮5383146469693231
短縮6243942452677147
短縮7233227481819558
短縮8192626487857135
同距離14022881681374716461
同距離22162131511267738262
同距離31281561771200657057
同距離41081251391186796074
同距離5851011151112848366
同距離67368911066875956
同距離75160781076864646
同距離82550671016665043

まとめると回収率から見た「買い」のパターンは、次の3つです。

  • 牝馬の芝・距離短縮の人気上位馬
  • 牡馬のダート・距離延長の人気上位馬
  • 牝馬のダート・距離延長の人気上位馬

ダートの「距離延長」の数字の良さが目立ちます。しかし、ネットや馬券攻略本では「距離短縮」が有利だ!みたいな記事をやたら見かけますが、それはなぜか?延長と短縮を比較するとデータ数では延長のほうが圧倒的に多いから。延長と短縮の2パターンだけで抽象的に集計したら、データ数の多い「距離延長」の数字が低くなるに決まってるじゃないすか。何度も言ってるように比較する条件が抽象的すぎると、同じレースで同じ条件の馬が星の潰しあいをしてるんです。例えば、クラシック戦線に距離短縮で出走する馬が何頭いてるんや、っていう話。そもそもが集計の方法を間違ってるんです。この記事のように、それぞれのレースでユニークになるような(一意性の高い)条件で比較しないとデータとして全く意味がないんです。ただし、延長を好むか短縮を好むかは競走馬の状態によって違うから、このデータも一概に妥当であると言えないですけどね。馬券を買う際の参考にしてください。

「馬連回収率」とは馬連を総流しで買い続けた場合の数字です。つまり、その馬が2着以内に入れば馬券は的中っていう計算です。「3連複回収率」も馬連と同じ、総流しで買い続けてその馬が3着以内なら的中です。経験的に連勝式の回収率は、還元率を超えていれば「買い」のパターンです。JRA馬連なら77.5%以上といったように。なぜなら総流しで馬券を毎回買うことなんて現実的にありませんから。見込みのある実力馬だけに相手を絞って買いますよね?

最後に。この記事のデータ作成に使用したSQLを有料会員に公開しています。ユーザーがカスタマイズして利用することも可能ですし、SQLを学習したい方の参考にもなります。

SQLファイルのダウンロードと使い方

コンテンツの残りを閲覧するにはログインが必要です。 お願い . あなたは会員ですか ? 会員について

コメント