この記事は、YouTubeでもご覧いただけます。映像とナレーションで内容がよりわかりやすく解説されているので、ぜひ以下のリンクからご覧ください。
■学習データのノイズ除去と具体化・抽象化テクニック
https://youtu.be/w9k7UFWLOd8 【①距離】
https://youtu.be/6G3nFXjSCyo 【②登録頭数】
https://youtu.be/HgNGphlhHGs【③馬場状態】
学習データのノイズ除去と具体化・抽象化テクニック
学習データの精度を高めるために必要不可欠なのが、ノイズ除去とその後のデータの具体化・抽象化の技術です。ノイズとは、誤ったデータや不要な情報を指しますが、これが混在するとAIや機械学習モデルは誤ったパターンを学習してしまい、結果的に予測の精度が落ちてしまいます。ノイズをうまく除去することで、データの本質が見えてきて、モデルの性能も大幅に向上します。
例えば、競馬予想AIでは、芝・ダート・障害といったレースの分類が一般的です。しかし、新潟の芝直線コースに注目すると、3連複の払戻金に特異な傾向があることがわかります。こうした偏りを理解し、データを適切に扱うことで、より正確な予測モデルを作ることが可能になります。
トラック | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|
ダート | 28331 | 48% | 2,652 | 2 |
芝 | 27916 | 48% | 2,478 | 3 |
障害 | 2182 | 4% | 2,229 | 4 |
芝直 | 429 | 1% | 4,976 | 1 |
そこで、芝・ダート・障害に加え、新潟の芝直線コースを独立したカテゴリとしてLightGBMに学習させた結果、新潟の芝直線での的中率がコンピ指数順位別の的中率を上回ることが判明しました。
この結果を受け、他のレース条件にも同様の偏りがある可能性があると考え、2007年から2023年までのJRA全レースを対象にさらに調査を進めました。
現在、馬券の主流は3連単や3連複であるため、今回は3着以内の波乱度を調べる目的で、3連複の平均払戻金を集計しました。
3連複の払戻金は単なる平均ではなく「調和平均」を採用します。調和平均については「全国の競馬場の平均配当を比較」の記事で解説しているので参考にして下さい。
「レコード比率」はグループ内での割合を示し、「3連複降順」はグループ内での順位を指します。表示順は「レコード件数」でソートしています。
距離
距離の分類は「JV-Data 仕様書」に基づき、以下のように定義しました。
- 短距離:1600m以下
- 中距離:1601m以上2200m以下
- 長距離:2201m以上
今回のデータを見ると、芝・ダートともに短距離レースが最も多く、約50%以上を占めています。このような多くのデータを元に、短距離レースに特化した予測モデルを作成することは有効です。
距離(芝)
距離(芝)は「芝直」を除いたデータです。
トラック | 距離 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝 | 短距離 | 13918 | 50% | 2,883 | 1 |
芝 | 中距離 | 11935 | 43% | 2,160 | 3 |
芝 | 長距離 | 2063 | 7% | 2,259 | 2 |
芝では、短距離レースがデータの半数を占めつつも、3連複の払戻金が最も高く、安定した傾向がありますが、中距離レースの払戻金は他の距離と比較して低く、分析対象としては信頼性が高いと考えられます。一方、長距離はデータの7%と少なく、払戻金も中程度で、モデルの対象としてはやや不安定ですが、除外するのではなく、注意深く扱う必要があります。
距離(ダート)
トラック | 距離 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
ダート | 短距離 | 14672 | 52% | 2,802 | 2 |
ダート | 中距離 | 13291 | 47% | 2,497 | 3 |
ダート | 長距離 | 368 | 1% | 2,965 | 1 |
ダートの場合、短距離がデータの半数以上を占め、払戻金もやや高い傾向にありますが、最も高い払戻金は長距離レースで記録されています。とはいえ、長距離レースのデータ数が非常に少ないため、これを無視しても予測精度には大きな影響はないでしょう。中距離レースにおいては、レコード比率が47%と高く、こちらも予測モデルの信頼性を支える重要なデータです。
全体として、中距離のデータは芝・ダートともに安定しており、これを基にしたモデルは効果的と言えます。短距離レースのデータは豊富であるため、さらに精度の高い分析を期待できるでしょう。
登録頭数
今回のデータから、芝・ダート・障害・芝直の各トラックにおける登録頭数別の波乱度や3連複払戻金の傾向が鮮明に表れています。
登録頭数(芝)
トラック | 登録頭数 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝 | 16 | 7228 | 26% | 4,189 | 2 |
芝 | 18 | 4758 | 17% | 4,637 | 1 |
芝 | 14 | 2381 | 9% | 3,243 | 5 |
芝 | 12 | 2144 | 8% | 2,262 | 7 |
芝 | 13 | 2072 | 7% | 2,733 | 6 |
芝 | 15 | 1990 | 7% | 3,665 | 4 |
芝 | 11 | 1965 | 7% | 1,991 | 8 |
芝 | 10 | 1724 | 6% | 1,513 | 9 |
芝 | 9 | 1328 | 5% | 1,123 | 10 |
芝 | 17 | 933 | 3% | 4,000 | 3 |
芝 | 8 | 870 | 3% | 898 | 11 |
芝 | 7 | 360 | 1% | 584 | 12 |
芝 | 6 | 121 | 0% | 414 | 13 |
芝 | 5 | 42 | 0% | 368 | 14 |
まず、芝を見ると、16頭以上のレースが波乱を生む中心であり、特に18頭立てのレースで最も高い3連複払戻金が見られます。登録頭数が多いほど波乱の可能性が高まり、3連複の払戻金も上昇するため、波乱を期待する場合は16頭以上のレースに注目すべきでしょう。一方、登録頭数が少ない(特に7頭以下)レースでは、払戻金も低く、波乱は少ない傾向にあります。
登録頭数(ダート)
トラック | 登録頭数 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
ダート | 16 | 13590 | 48% | 3,374 | 1 |
ダート | 15 | 4591 | 16% | 3,240 | 2 |
ダート | 14 | 2540 | 9% | 2,721 | 3 |
ダート | 13 | 2412 | 9% | 2,546 | 4 |
ダート | 12 | 2168 | 8% | 2,053 | 5 |
ダート | 11 | 1267 | 4% | 1,708 | 6 |
ダート | 10 | 894 | 3% | 1,378 | 7 |
ダート | 9 | 532 | 2% | 1,142 | 8 |
ダート | 8 | 249 | 1% | 879 | 9 |
ダート | 7 | 64 | 0% | 593 | 10 |
ダート | 6 | 18 | 0% | 464 | 11 |
ダート | 5 | 6 | 0% | 383 | 12 |
ダートでは、16頭立てのレースが全体の48%を占め、3連複の払戻金も最も高く、データの信頼性が非常に高いことが確認できます。ダートでも、頭数が増えるほど波乱の要素が増し、払戻金も高くなる傾向にあるため、16頭立てのレースは注目に値します。一方で、10頭以下のレースでは、払戻金が低く、安定した予測が可能です。
登録頭数(障害)
トラック | 登録頭数 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
障害 | 14 | 1101 | 50% | 3,062 | 2 |
障害 | 12 | 264 | 12% | 2,330 | 4 |
障害 | 13 | 236 | 11% | 2,821 | 3 |
障害 | 11 | 198 | 9% | 1,949 | 6 |
障害 | 10 | 148 | 7% | 1,869 | 7 |
障害 | 9 | 104 | 5% | 1,238 | 8 |
障害 | 8 | 70 | 3% | 1,081 | 9 |
障害 | 7 | 27 | 1% | 750 | 10 |
障害 | 6 | 15 | 1% | 410 | 11 |
障害 | 16 | 9 | 0% | 3,706 | 1 |
障害 | 15 | 7 | 0% | 2,040 | 5 |
障害 | 5 | 3 | 0% | 211 | 12 |
障害では、登録頭数が14頭を超えると波乱が多くなり、特に16頭立てのレースで最も高い払戻金が記録されています。しかし、障害は芝・ダートに比べて登録頭数が少ないため、全体的に波乱が少ないという点も強調できます。この点は、過去の分析と一致しており、少頭数の障害は安定した予測が可能です。
登録頭数(芝直)
トラック | 登録頭数 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝直 | 18 | 212 | 49% | 6,145 | 3 |
芝直 | 16 | 131 | 31% | 6,082 | 4 |
芝直 | 17 | 20 | 5% | 7,238 | 1 |
芝直 | 15 | 20 | 5% | 5,864 | 5 |
芝直 | 12 | 13 | 3% | 1,745 | 8 |
芝直 | 14 | 10 | 2% | 6,714 | 2 |
芝直 | 13 | 9 | 2% | 1,890 | 7 |
芝直 | 11 | 7 | 2% | 2,186 | 6 |
芝直 | 9 | 3 | 1% | 1,260 | 9 |
芝直 | 10 | 3 | 1% | 800 | 11 |
芝直 | 8 | 1 | 0% | 1,030 | 10 |
最後に、芝直は、JRAの中で最も短い距離を特徴としており、波乱の要素が強いトラックです。特に17頭立てのレースでは最も高い払戻金が見られ、レコード比率も高いことから、波乱を期待する要素が強いことが分かります。芝直は登録頭数が多くなればなるほど波乱の可能性が高まるため、この要素を重視して予測を行うと効果的です。
全体的に、各トラックにおいて登録頭数が増えると波乱の可能性が高まり、3連複の払戻金も上昇する傾向が見られます。芝直や芝の多頭数レースは特に波乱が起きやすい一方で、少頭数のレースでは安定した予測が可能です。
馬場状態
今回のデータを分析すると、芝・ダート・障害・芝直の各トラックにおける馬場状態別の傾向がはっきりと見て取れます。馬場状態はレース結果に大きな影響を与える要因の一つであり、特に波乱を予測する際には重要です。
馬場状態(芝)
トラック | 馬場状態 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝 | 良 | 22283 | 80% | 2,438 | 4 |
芝 | 稍重 | 3676 | 13% | 2,532 | 3 |
芝 | 重 | 1478 | 5% | 2,767 | 2 |
芝 | 不良 | 479 | 2% | 3,399 | 1 |
芝では、「良」が全体の80%を占めていますが、3連複の払戻金は比較的低めです。一方で、「不良」では、払戻金が最も高くなっており、波乱の可能性が高まる傾向が強いことが分かります。馬場状態が悪化するほど払戻金が上昇するため、波乱を狙う予想では「重」や「不良」のレースに注目することが有効です。
馬場状態(ダート)
トラック | 馬場状態 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
ダート | 良 | 17678 | 62% | 2,631 | 3 |
ダート | 稍重 | 5350 | 19% | 2,626 | 4 |
ダート | 重 | 3254 | 11% | 2,754 | 1 |
ダート | 不良 | 2049 | 7% | 2,752 | 2 |
ダートでは、過去の例と同様に、馬場状態による3連複払戻金の差は小さく、最も高い「重」と最も低い「稍重」の差はわずか128円に過ぎません。このため、ダートに関しては馬場状態をあまり深く考慮せず、他の要因に注力する方が良い結果を得られる可能性があります。
馬場状態(障害)
トラック | 馬場状態 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
障害 | 良 | 1659 | 76% | 2,164 | 4 |
障害 | 稍重 | 335 | 15% | 2,327 | 3 |
障害 | 重 | 147 | 7% | 2,547 | 2 |
障害 | 不良 | 41 | 2% | 3,958 | 1 |
障害では、「良」が76%を占め、安定した結果が見られますが、3連複の払戻金は「不良」の状態で最も高くなっています。障害では波乱が少ない傾向にありますが、馬場状態が悪化することで払戻金が大きくなるため、「重」や「不良」のレースは波乱要素が増加しやすい点に注意が必要です。
馬場状態(芝直)
トラック | 馬場状態 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝直 | 良 | 336 | 78% | 4,998 | 3 |
芝直 | 稍重 | 62 | 14% | 4,135 | 4 |
芝直 | 重 | 27 | 6% | 7,908 | 1 |
芝直 | 不良 | 4 | 1% | 6,991 | 2 |
芝直では、「重」で最も高い3連複の払戻金が見られます。「良」でも高めの払戻金が確認できますが、「不良」や「重」のレースでは波乱が特に多く発生し、馬場状態が悪化するほど波乱の可能性が強まることが分かります。芝直では短距離の特性上、馬場状態が大きな要因となるため、馬場状態が悪い場合は特に注意が必要です。
総合的に見ると、芝や芝直では馬場状態が悪化するほど払戻金が上昇し、波乱が増える傾向が顕著です。障害でも同様の傾向が見られますが、ダートでは馬場状態が結果に与える影響が小さいため、他の要素に注力した予測が有効です。波乱を狙うなら、馬場状態が「重」や「不良」のレースに注目することが、的中率を高めるカギとなります。
競走条件
今回のデータを分析すると、芝・ダート・障害・芝直の各トラックにおける競走条件別の波乱度や3連複払戻金の傾向が明らかになります。特にクラス別の差異が払戻金にどのように反映されるかに注目すると、より精緻な予測が可能になります。
競走条件(芝)
トラック | クラス | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝 | 未勝利 | 8270 | 30% | 2,206 | 5 |
芝 | 1勝クラス | 7518 | 27% | 2,761 | 3 |
芝 | 2勝クラス | 4009 | 14% | 2,442 | 4 |
芝 | 新馬 | 3275 | 12% | 2,069 | 6 |
芝 | オープン | 3107 | 11% | 2,916 | 2 |
芝 | 3勝クラス | 1737 | 6% | 3,443 | 1 |
芝においては、「未勝利」や「新馬」のレースが全体の42%を占め、特に「未勝利」では比較的低い3連複の払戻金が確認できます。一方で、クラスが上がるにつれて払戻金が増加する傾向が見られ、特に「3勝クラス」では最も高い払戻金が記録されています。過去の分析通り、クラスが上がるほど波乱が多くなる傾向があり、「1勝クラス以上」のレースでは波乱が期待できる場面が多くなります。
競走条件(ダート)
トラック | クラス | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
ダート | 未勝利 | 11101 | 39% | 2,140 | 6 |
ダート | 1勝クラス | 9890 | 35% | 2,883 | 4 |
ダート | 2勝クラス | 3495 | 12% | 3,861 | 2 |
ダート | 新馬 | 1550 | 5% | 2,760 | 5 |
ダート | 3勝クラス | 1320 | 5% | 3,803 | 3 |
ダート | オープン | 975 | 3% | 3,897 | 1 |
ダートでは、「未勝利」が全体の39%を占め、払戻金も比較的低い傾向がありますが、クラスが上がるにつれて波乱度が増し、「オープン」や「3勝クラス」で特に高い3連複の払戻金が記録されています。特に「2勝クラス」や「オープン」では、払戻金が大きく上昇するため、このクラスのレースで波乱を想定した予測が有効です。
競走条件(障害)
トラック | クラス | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
障害 | 未勝利 | 1478 | 68% | 2,078 | 2 |
障害 | オープン | 704 | 32% | 2,630 | 1 |
障害においては、「未勝利」が68%を占め、払戻金は比較的低いものの、波乱が少ない障害の中でも「オープン」で払戻金が高くなる傾向があります。障害ではクラスが上がると波乱の可能性が少し高まるため、「オープン」では注目が必要です。
競走条件(芝直)
トラック | クラス | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝直 | 1勝クラス | 165 | 38% | 7,377 | 2 |
芝直 | 未勝利 | 140 | 33% | 3,826 | 4 |
芝直 | 2勝クラス | 55 | 13% | 7,537 | 1 |
芝直 | オープン | 36 | 8% | 5,791 | 3 |
芝直 | 3勝クラス | 27 | 6% | 2,750 | 5 |
芝直 | 新馬 | 6 | 1% | 1,531 | 6 |
芝直では、他のトラックと異なり、波乱の要素が強く反映されています。特に「2勝クラス」や「1勝クラス」で最も高い払戻金が確認され、波乱が多発していることがわかります。「未勝利」や「オープン」でも比較的高い払戻金が見られるため、芝直ではクラスにかかわらず波乱の可能性が高いレースが多く含まれていると考えられます。
全体として、クラスが上がるほど波乱が増加する傾向は共通しており、3連複の払戻金を基準に「未勝利」と「1勝クラス以上」に分類することで、波乱度の高いレースを捉えることができます。特に芝直やダートの「オープン」や「3勝クラス」、芝の「3勝クラス」など、高額な払戻金が記録されているレースに注目することで、波乱を狙った予測が可能となります。
競走種別
今回のデータを見ると、競走種別ごとの傾向がはっきりと示されており、馬齢が上がるにつれて波乱度が高くなる傾向が顕著です。3連複の払戻金を基準に、波乱が多いレースを把握するためには、馬齢による分類が有効です。
競走種別(芝)
トラック | 競走種別 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝 | サラ3歳以上 | 8229 | 29% | 2,971 | 2 |
芝 | サラ3歳 | 7738 | 28% | 2,668 | 3 |
芝 | サラ2歳 | 6770 | 24% | 1,690 | 4 |
芝 | サラ4歳以上 | 5179 | 19% | 3,253 | 1 |
芝では、「サラ4歳以上」のレースが最も波乱が多く、3連複の払戻金も3,253円と最も高い結果を示しています。対照的に、「サラ2歳」のレースは払戻金が1,690円と低く、波乱が少ないことがわかります。過去の例と同様に、馬齢が上がるほど波乱の要素が増し、特に「サラ4歳以上」のレースでは波乱の予測が有効です。
競走種別(ダート)
トラック | 競走種別 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
ダート | サラ3歳 | 10563 | 37% | 2,303 | 3 |
ダート | サラ3歳以上 | 8262 | 29% | 3,133 | 2 |
ダート | サラ4歳以上 | 6027 | 21% | 3,371 | 1 |
ダート | サラ2歳 | 3479 | 12% | 2,082 | 4 |
ダートでも、同じく「サラ4歳以上」のレースが最も高い3連複の払戻金(3,371円)を記録しており、波乱度が高くなっています。一方で、「サラ2歳」のレースは2,082円と比較的低い払戻金にとどまっています。ダートでも、馬齢が上がるほど波乱が多くなり、特に「サラ4歳以上」のレースに注目するべきです。
競走種別(障害)
トラック | 競走種別 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
障害 | サラ3歳以上 | 1274 | 58% | 2,017 | 2 |
障害 | サラ4歳以上 | 908 | 42% | 2,616 | 1 |
障害では、他の競走種別と同様に、「サラ4歳以上」のレースで払戻金が最も高く(2,616円)、波乱が発生しやすいことがわかります。「サラ3歳以上」のレースは比較的安定しており、波乱が少ないことが確認できますが、馬齢が高いレースでは波乱の可能性が高まります。
競走種別(芝直)
トラック | 競走種別 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝直 | サラ3歳以上 | 183 | 43% | 5,476 | 2 |
芝直 | サラ3歳 | 107 | 25% | 4,948 | 3 |
芝直 | サラ4歳以上 | 83 | 19% | 7,867 | 1 |
芝直 | サラ2歳 | 56 | 13% | 2,717 | 4 |
芝直では、「サラ4歳以上」のレースで最も高い払戻金(7,867円)が記録されています。芝直は元々波乱が多いトラックですが、馬齢が高くなるほどその傾向が強まることがわかります。特に「サラ4歳以上」のレースは波乱が頻発し、高額な払戻金が期待されます。
全体として、芝・ダート・障害・芝直の各トラックで共通して、馬齢が上がるほど波乱度が高くなる傾向が確認でき、過去の分析と一致しています。これに基づき、「サラ3歳以上・サラ4歳以上」と「サラ2歳・サラ3歳」の2つのグループに分類し、波乱の要素を踏まえた予測を行うことが有効です。特に「サラ4歳以上」のレースでは高額な払戻金が期待でき、波乱を狙う予測が功を奏する可能性が高いでしょう。
重量種別
今回のデータを分析すると、芝・ダート・障害・芝直の各トラックにおける重量種別の傾向が明確に示されています。特に「馬齢」「定量」といったデータが大半を占める一方で、「ハンデ」が波乱の要素を持つ点に注目できます。
重量種別(芝)
トラック | 重量種別 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝 | 馬齢 | 13781 | 49% | 2,123 | 4 |
芝 | 定量 | 10253 | 37% | 2,898 | 2 |
芝 | ハンデ | 2320 | 8% | 4,087 | 1 |
芝 | 別定 | 1562 | 6% | 2,332 | 3 |
芝を見ると、最も多いのは「馬齢」で、49%を占めていますが、3連複の払戻金は2,123円と比較的安定しています。「定量」も37%と多く、払戻金は2,898円と波乱度がやや高めです。最も波乱が多いのは「ハンデ」で、3連複の払戻金が4,087円と最も高く、波乱が期待できるレースであることがわかります。「別定」はデータ数が少なく、払戻金も中程度であるため、あまり波乱を想定する必要はないでしょう。
重量種別(ダート)
トラック | 重量種別 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
ダート | 馬齢 | 13929 | 49% | 2,242 | 4 |
ダート | 定量 | 12697 | 45% | 3,119 | 3 |
ダート | ハンデ | 1083 | 4% | 4,747 | 1 |
ダート | 別定 | 622 | 2% | 3,610 | 2 |
ダートにおいても、「馬齢」が49%を占め、払戻金は2,242円と安定していますが、「定量」では3,119円と高くなり、波乱の要素が含まれます。特に「ハンデ」では4,747円と最も高い払戻金が確認されており、波乱の可能性が非常に高いことが示されています。「別定」は3,610円と波乱の要素が少し含まれますが、データ数が少ないため、注意が必要です。
重量種別(障害)
トラック | 重量種別 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
障害 | 定量 | 1512 | 69% | 2,073 | 3 |
障害 | 別定 | 662 | 30% | 2,684 | 2 |
障害 | ハンデ | 8 | 0% | 3,103 | 1 |
障害では、「定量」が69%を占め、払戻金は2,073円と安定しています。一方で、「別定」の払戻金が2,684円とやや高く、「ハンデ」では3,103円と最も高い結果が示されていますが、「ハンデ」のデータ数は非常に少ないため、慎重に扱う必要があります。障害全体で見ると、「定量」レースで波乱が少ないことが特徴的です。
重量種別(芝直)
トラック | 重量種別 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝直 | 定量 | 203 | 47% | 5,943 | 2 |
芝直 | 馬齢 | 163 | 38% | 3,859 | 4 |
芝直 | ハンデ | 41 | 10% | 7,406 | 1 |
芝直 | 別定 | 22 | 5% | 5,147 | 3 |
芝直では、「定量」が47%と最多ですが、払戻金は5,943円と波乱が多いことが示されています。特に「ハンデ」のレースでは7,406円という非常に高い払戻金が記録されており、波乱が多発する傾向があります。「馬齢」は安定していますが、芝直全体で見ると、波乱の要素が強く反映されています。
総括すると、各トラックにおいて「馬齢」と「定量」がデータの大半を占め、特に「馬齢」は安定した払戻金が見られますが、「ハンデ」レースでは波乱が多発し、払戻金も非常に高くなることが確認できます。このため、波乱を狙う予測では「ハンデ」のデータを重視する一方で、安定した予測を求める場合は「馬齢」や「定量」に絞り込むことが有効です。また、「ハンデ」レースに関しては、専用のモデルを構築することで、より的確な予測が期待できるでしょう。
競馬場
今回のデータを見ると、芝・ダート・障害それぞれの競馬場別に3連複の払戻金に特徴的な傾向が見られます。過去の例を踏まえつつ、競馬場ごとの波乱度を意識した分析が重要です。
競馬場(芝)
「新潟」は「芝直」を除いたデータです。
トラック | 競馬場 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
芝 | 東京 | 4255 | 15% | 2,124 | 9 |
芝 | 阪神 | 3867 | 14% | 2,126 | 8 |
芝 | 京都 | 3528 | 13% | 2,165 | 7 |
芝 | 中山 | 3451 | 12% | 2,694 | 5 |
芝 | 小倉 | 2821 | 10% | 2,855 | 3 |
芝 | 新潟 | 2509 | 9% | 3,205 | 2 |
芝 | 中京 | 2365 | 8% | 2,782 | 4 |
芝 | 福島 | 2163 | 8% | 3,647 | 1 |
芝 | 札幌 | 1513 | 5% | 2,114 | 10 |
芝 | 函館 | 1444 | 5% | 2,390 | 6 |
芝では、「福島」が最も高い3連複の払戻金(3,647円)を記録しており、波乱が起きやすいことがわかります。次いで「新潟」(3,205円)、「小倉」(2,855円)と続き、これらの競馬場では波乱が多発する傾向にあります。一方で、「東京」「阪神」「京都」は払戻金が安定しており、波乱が少ない傾向が確認できます。これに基づき、波乱を狙う場合は「福島」や「新潟」のレースに注目することが有効です。
競馬場(ダート)
トラック | 競馬場 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
ダート | 阪神 | 4589 | 16% | 2,373 | 9 |
ダート | 中山 | 4460 | 16% | 2,664 | 6 |
ダート | 東京 | 4371 | 15% | 2,907 | 3 |
ダート | 京都 | 3959 | 14% | 2,509 | 7 |
ダート | 中京 | 2692 | 10% | 2,841 | 4 |
ダート | 新潟 | 2340 | 8% | 2,722 | 5 |
ダート | 小倉 | 1801 | 6% | 3,077 | 2 |
ダート | 福島 | 1662 | 6% | 3,213 | 1 |
ダート | 札幌 | 1255 | 4% | 2,422 | 8 |
ダート | 函館 | 1202 | 4% | 2,128 | 10 |
ダートにおいては、「福島」(3,213円)と「小倉」(3,077円)が特に高い3連複の払戻金を示しており、波乱の可能性が高いレースが多いことがわかります。「東京」「中京」も高めの払戻金を記録していますが、「阪神」「中山」「京都」などは比較的安定しているため、波乱度が低いと考えられます。ダートでも「福島」や「小倉」のレースは波乱が起きやすい競馬場として注目できます。
競馬場(障害)
トラック | 競馬場 | レコード数 | レコード比率 | 3連複払戻 | 3連複降順 |
---|---|---|---|---|---|
障害 | 阪神 | 347 | 16% | 1,711 | 7 |
障害 | 新潟 | 325 | 15% | 2,788 | 1 |
障害 | 中山 | 314 | 14% | 2,265 | 5 |
障害 | 京都 | 283 | 13% | 2,234 | 6 |
障害 | 東京 | 265 | 12% | 2,648 | 3 |
障害 | 福島 | 238 | 11% | 2,525 | 4 |
障害 | 小倉 | 208 | 10% | 1,656 | 8 |
障害 | 中京 | 202 | 9% | 2,724 | 2 |
障害では、「新潟」が2,788円で最も高い3連複の払戻金を記録しており、波乱が多発していることがわかります。また、「中京」(2,724円)や「東京」(2,648円)も波乱度が高く、これらの競馬場での障害は予測が難しい可能性があります。「阪神」や「小倉」は払戻金が低く、安定したレースが多いと予想されます。
全体として、「福島」「新潟」は芝・ダート・障害のすべてのトラックにおいて波乱が多く、払戻金も高い競馬場であることがわかります。波乱を狙う予測ではこれらの競馬場に注目するのが効果的です。一方、「阪神」「京都」などは払戻金が安定しており、安定した予測が可能です。過去の分析を踏まえると、各競馬場の特徴を活かした予測モデルを構築することが重要であり、波乱を期待するレースと安定を狙うレースをうまく分けることで、的中率を向上させることができるでしょう。