この記事は「勝率」がテーマのデータ分析です。競馬ソフト作者「高橋正視」さんのインタビュー記事、
競馬ソフト作者インタビュー
第3回 複勝・3連複連動理論
にある「単勝の支持率と、馬の勝率はほとんど同じなんです」という話を確かめるために、1986年から現在分(2021年8月)までのJRA全レースを使って調べました。
1つのSQLでも集計可能な仕事ですが、1986年からというのはデータ量があまりにも凄すぎて、SQLの実行にメチャクチャ時間がかかるので、っていうかたぶん終わらないので無理(笑)
なので、直前に公開した同じタイトルのプログラミング記事「単勝の支持率と勝率はほぼ同じ」のプロシージャで作成したデータを使います。
結果はこちら。
単勝オッズ | 支持率 | 勝率 | レコード数 |
1.2 | 67% | 67% | 1271 |
1.5 | 53% | 52% | 4208 |
2 | 40% | 37% | 5385 |
2.5 | 32% | 32% | 6466 |
3 | 27% | 27% | 6913 |
4 | 20% | 21% | 6924 |
5 | 16% | 16% | 6348 |
6 | 13% | 14% | 5787 |
7 | 11% | 11% | 5472 |
8 | 10% | 10% | 4886 |
9 | 9% | 8% | 4290 |
10 | 8% | 8% | 3851 |
15 | 5% | 5% | 2767 |
20 | 4% | 4% | 2126 |
30 | 3% | 2% | 1078 |
50 | 2% | 1% | 725 |
150 | 1% | 1% | 149 |
200 | 0% | 0% | 101 |
ここではページの都合でザックリとキリの良い数字のオッズしか載せてませんが、SQLで全てのオッズを10円単位で表示すると面白いほど支持率と勝率がキレイに並びます。
次は表計算ソフトで折れ線グラフにしてみました。横軸が1.0~10.0までの「オッズ」、縦軸が「支持率・勝率」の率です。

これは素晴らしすぎるゥゥーーーッ!!「高橋の法則」と名付けたいです!!(笑)これを期待値の計算などに上手く使えば、予想にかなり役立つデータになります。
最後に。この記事のデータ作成に使用したSQLを有料会員に公開しています。ユーザーがカスタマイズして利用することも可能ですし、SQLを学習したい方の参考にもなります。
コメント