回収期待値理論


競馬@Wikiへ戻る

回収期待値理論とは?

回収期待値理論を知らない方々に説明すると、回収期待値と言うのは

 回収期待値=的中率×平均オッズ

で表されるものです。
ところで、通常馬券の回収期待値と言うのものは、控除率(JRAが馬券から差し引く利益。テラ銭。)を考え合わせると単勝・複勝でおよそ80%、その他の式別では75%と言われています。つまり、無作為に馬券を購入しても回収期待値が100%を超えないので競馬では原理的にはお金を儲けられないのです。
ところが、色々データを条件別で見ていくと、場合によっては回収期待値が100%を超えている買い目が存在します(逆に言うと、回収期待値がバカみたいに低い馬券も存在するワケです)。つまり、こう言う、データ上「回収期待値が100%を超えている」馬券だけに投資していけば自然に儲かるだろう、と言うのが回収期待値理論の内容なのです。

回収期待値理論の弱点

ところで、以上の回収期待値理論は非常に魅力的であり、「予想しなくてもデータさ えあれば馬券で簡単に利益を生み出せるんだ!」と結構な支持者を生み出しました。特に検索ソフト、TARGET frontier JVの普及と相まって、競馬書籍出版界を席捲して、今や各データブック、競馬情報誌共に「回収期待値100%を超える買い目」を目にしない日はありません。
ところが回収期待値理論通りに結果が付いて来て、みんなハッピーになったのか、と言うとそうは問屋が卸しません。様々な批判が回収期待値理論に対して湧き上がってきました。主な批判内容は、

「回収期待値理論は買い目を公開した途端に当たらなくなる(儲からなくなる)」

と言ったモノです。回収期待値理論信者はこれに対して主に、

「過去のデータ上では確かに回収期待値は100%超えていたんだよ。
でも、データを公開してからは、多分同じ買い目の馬券購入者が増加して、オッズが下がっちゃったんだよね。」

と言った言い訳に終始しています。しかしながら、批判者の中には、「そもそも統計母数が足りないんじゃないのか?」と言った指摘をする方々もいます。

「そもそも有効ケース数が足りないのに(確たる証拠もないのに)回収期待値が100%を超えてる、と断定する方がおかしい。」

果たしてどっちの意見が正しいのでしょうか?

回収期待値理論への見解

僕個人の意見で言うと、最後の意見に賛成です。確かに同じ買い目を購入する馬券購入者が増えればオッズが下がる、と言うのは事実です。ただし、みんながみんなそれに群がっているのか、と言うと疑問に感じざるを得ません。疑問点を2つ挙げます。
第1に、大体回収期待値100%以上の買い目が1番人気に祭り上げられた、なんて例は聞いた事がありません。大体いつも通り、各競馬新聞の◎が1番人気になってる例が多数なのです。それが大多数の馬券購入者の行動なんです。
第2に、馬券術には流行り廃りがあります。大多数の馬券購入者は基本的にスノッブな人達です。回収期待値理論にしても、一時的にある特定の買い目に群がるでしょうが、ある程度経ったら新しい買い目に飛び移るでしょう。という事は

「新しい買い目を発見した!」よりも「かなり古い買い目を穿り出す」

方が実は“不特定多数の馬券購入者に飽きられていて有効”な筈なんです。何でそう言う議論にならないのでしょうか?回収期待値理論での買い目が有効であるならば、以上の論点になってもおかしくは無い筈なんですが、これも

「古いデータは現在には生かされない」

と至極単純な結論に終始しています。
さて、そうなると、状況証拠的に考えると、そもそも過去のデータ上「回収期待値100%超えだった」って話自体が、嘘ではないにせよ、断定する方がおかしいのではないか、と言った結論になります。要はこれは「買い目の信頼度」の話になるのです。

統計的仮説検定への誘い

さて、議論の叩き台として、競馬最強の法則3月号上の記事、無敵の勝ちネタ”法則30本!の中から2番の

阪神ダート1,800MのBT産駒

を取り上げたいと思います。*1
では、まず、データをご覧下さい。

■ブライアンズタイム産駒(6歳以下現役馬)の阪神ダート1800成績(03.1.5〜05.12.25)
1着2着3着出走数勝率連対率複勝率単回値複回値
25161714717.027.939.511498

確かに単勝の回収期待値は114%と優秀です。ところで、

回収期待値=的中率×平均オッズ

に拠ると、

回収期待値(114%)=的中率(17.0%)×平均オッズ(6.7倍)

だという事が分かります。つまり、この期間の阪神ダート1800M戦におけるBT産駒の単勝平均オッズは約6.7倍だ、という事ですね。
ところで、上の式から次の2つの事が言えるのです。

  1. 単勝馬券の的中率が17.0%だとしたら、的中した単勝馬券の平均オッズが安定して5.9倍より大きかったら充分儲かるデータとして安心してイイ。
  2. 的中した単勝馬券の平均オッズが6.7倍だとして、馬券の的中率が最低でも15%あれば充分儲かるデータとして安心してイイ。

この2つの観点は上のブライアンズタイム産駒のデータから導き出した結論です。つまり、回収率が114%も無いにせよ、上の2つのいずれかの条件を満たせば自然と回収率は最低でも100%以上は行く、と言うのは分かるでしょう。要は、「的中率を固定して考えるか?」それとも「平均オッズを固定して考えるか?」が違うだけで、両者共に回収率100%超えの為の条件なのです。
ここでは、1の論点で話を進めて行きたいと思います。と言うのも、数学的な詳細はヤヤコシイので端折りますが、点推定と言われる手法で、

単勝的中率=1着数÷出走数

とするのは、どんなにデータ数が少なくても数学的には悪い推定的中率にはならないんです。よって、25÷147≒17%は「まずまず信頼できる勝率である」として構わない。そこで、「平均オッズ」の方を疑ってみましょう。 ここで実際、ブライアンズタイム産駒(6歳以下現役馬)の阪神ダート1800M戦(03.1.5〜05.12.25)での的中した単勝的中オッズの分布をご覧に入れたいと思います。

56c9b2e0.jpg

もう何も言えませんね(苦笑)。なんせ該当件数がたったの25件しかないので当然かもしれません。
ところが、ムリヤリ次の仮定を設定します。それは、

阪神ダート1800M戦に於いて、現役のブライアンズタイム産駒が勝ったと言う条件での
単勝的中オッズはサンプル数を無限大とした場合正規分布する。

(正規分布については統計解析についてを参照)
この仮定を受け入れられるか、受け入れられないか、が分かれ道です。しかもいきなり「無限大」とか言われて面食らってると思います。ここは確かに仮想的な話なんですが、詳しくは後述します。
僕自身は上の仮定は悪くない仮定だと思っています。と言うのも、条件は違えど、サンプル確保数が最大の「単勝人気順別による的中オッズの分布」が正規分布に近似できそうだからです。
次に単勝人気順別(1〜9番人気)の的中オッズのヒストグラムを掲げます。データはJRA過去3年('03〜'05末)の全施行レースを対象と致しました。

26106a38-s.jpg
01d3ae4c-s.jpg
b7911161-s.jpg
2ab75c26-s.jpg
327b1bad-s.jpg
06e632e6-s.jpg
075a2c18-s.jpg
c0538aa3-s.jpg
649e9c4b-s.jpg

単勝人気順別オッズなんかはとてもじゃないけど、競馬予想に役立つ情報だとは思えませんが、こう言った「的中オッズの分布の性質を考える場合」大変有力な手掛かりになるとは思います。
中には、

「でも単勝人気順別区分けでの、って事でしょ?その性質が他の条件区分けにも通用する、って思うのは少々楽観的なんじゃないの?」

と思う人もいるでしょう。その通りだと思います。が、通常、どんな条件分けにせよ、単勝人気順別程の母体数は稼げません。ハッキリ言うと、正規分布で近似できると肯定も否定も出来ないのです。取りあえずここでは大胆に「条件を任意に区分けして、その中のサンプル数が無限大に近づけば単勝的中オッズの分布は正規分布に近づく」と仮定したいと思います。*2

以上を整理しなおして、数理統計学的には次のような論法を設定します。

  1. まずはモデルとして、母体数が無限大の阪神ダート1800M戦でのBT産駒が勝った場合の単勝的中オッズの分布が仮想的でさえ存在している、と考える。このモデルは母平均はμ、母標準偏差はσの正規分布であるが、これら母数(パラメータ)の具体的な値はまるで分からない。
  2. 上の例では'03.1.5〜'05.12.25までの25回分の標本を1の正規分布からたまたま無作為に一気に抽出されたと考える。
  3. 実際の標本抽出は'03.1.5〜'05.12.25までの1回のみだが、この情報(平均と標準偏差)を記録した後また母体に戻してまた無作為に25個をまとめて抽出する事を考える。そしてまたその平均と標準偏差を記録する。以上の作業を何回(無限大)も繰り返す。いわばこれはシミュレーション(仮想実験)で、具体的には大量の番号クジが入った箱から25枚のクジを一気に引いて、その結果(情報)を記録してはまた箱に戻して良くかき混ぜ、また取り出す、と言ったイメージである。
  4. 3の作業の結果、母平均μの値が何となく分かっては来るだろう(クジの例で言うと大体書いてる番号の平均値がいくらくらいか、とか)。また、母平均μとその標準誤差らしき数も分かってくる反面、ある程度の確率で母平均らしき数からかなりかけ離れた結果も ランダムに抽出されてくるのも分かってくる。その全ての結果の頻度(分布)が分かりさえすれば、1回目の実験で出た値の“信頼性”も確率論的に言及できる。

これが統計的仮説検定のカラクリです。
なお、上の例で言うと、実際僕らは母平均μの値を知りたいワケではありません。そして確定したμの値は知りようがないのです。
ただし、僕らが本当に期待しているのは、

「母平均μの値が何なのかは別に興味はないんだけど、その値がもしも5.9より大きかったらラッキー [heart]

って事です。何故なら、

「阪神ダート1,800M戦に於いての現役BT産駒が勝った場合の単勝オッズの正規分布モデ
ルの母平均μが5.9より大きい」のなら、その仮想的な分布モデルから取り出した単勝
的中オッズも大体5.9より大きいある点を中心にして分布する

ので、結果、安定して単勝回収率が100%を超える事が期待されるからです(少なくとも、的中率が安定していて、かつ、他の馬券購入者に悟られなければ、って意味ですが)。この事実を安定した回収率を保持する為に是非とも確率論的に証明したいのです。
この本当に証明したい事柄を統計的仮説検定では特に対立仮説と呼びます。 そして、統計的仮説検定では、高校の時に習った背理法の構造を用いて対立仮説を証明する為、敢えてその否定形の仮説を証明しようとする形式をとります(つまり、その証明が失敗すれば自動的に対立仮説が確率論的に証明された事になります)。この否定形の仮説を帰無仮説(またはゼロ仮説)と呼びます。
具体的に上の例では次のようになります。

帰無仮説:母平均μは5.9以下である。
対立仮説:母平均μは5.9より大きい。

もうちょっと数学的に書き直せば、次のようになります。

帰無仮説:μ=5.9*3
対立仮説:μ>5.9

そして手順3のシミュレーション(仮想実験)を行うんですが、実際は行わなくってイイです(笑)。「どっちやねん?」と言ったツッコミはさておき(笑)、実はこのテの実験を行った場合の頻度の分布は既に理論的に証明されています。それがt分布*4(統計解析について参照)で、そう言った実験を実際に行った場合どう言った分布になるのか、に言及したものです。これで僕たちは「無限回に渡って実験し続ける」苦痛から解放されるのですね(笑)。数学ってあり難いですね(笑)。
ここでt分布に絡んだ次の定理を紹介しておきます。

t分布に関する定理

個々のデータ

X_1,~X_2,~\dots,~X_n

が互いに独立で、かつ同じ正規分布

N(\mu~\text{,}~\sigma)

に従うならば、それらの標本平均を

\bar{X}=\frac{1}{n}~\sum_{k=1}^n~X_k

標本不偏分散を

U^2=\frac{1}{n-1}\sum_{k=1}^n~(X_k-\bar{X})^2

とする時、統計量

T_{n-1}=\frac{\bar{X}-\mu}{\frac{U}{\sqrt{n}}}\\~n~\ge~2

は自由度n−1のt分布に従う。

つまり、阪神ダート1,800M戦に於ける現役のブライアンズタイムス産駒が勝った場合の単勝オッズの平均値(これが標本平均です)は上のデータによると、03.1.5〜05.12.25の期間での25個のデータ数で見る限り、6.7倍。またそのデータ上の標準偏差uは、TARGET frontier JVを使って調べてみるとu=7.516854395。帰無仮説より、母平均μは5.9倍(帰無仮説上は以下。本当に証明したい事はそれより大きい)。この3つを懸案すると、単勝的中オッズ分布の検定統計量tは

t=\frac{6.7-5.9}{7.516854395/\sqrt{25}}~\\~=0.532137

となって、これが自由度(t分布ではデータ数−1の事)24のt分布の横軸上の数値になるワケです。

c4e99bd2.jpg

上が、自由度をデータ数−1=24としたt分布のグラフです。
つまり、無限大の規模を持つ正規分布モデルから標本を25個取り出して、その性質(平均値と標準偏差を使った検定統計量)を記録した後、また母体に戻して、また25個取り出して記録する。その作業を延々と繰り返した場合、理論的には上の曲線(自由度24のt分布)の様に分布するのです。
ちなみに、上の図をよく見てもらえば分かりますが、赤く色塗られた部分は、境界線が先程計算したt=0.532137で、それよりもtの値が大きい部分です。
実はこの赤く塗られた部分は当然面積なんですが、確率密度関数に於いて面積は確率を意味します。つまり言い換えると、赤い面積はtの値が0.532137以上の値をとる確率と言う意味です。
では何故tが0.532137以上になる確率を求めるのでしょうか?
今、阪神ダート1,800Mでの現役BT産駒が勝った場合の平均オッズは有効ケース数25で6.7倍でした。一方、帰無仮説の要請はオッズのモデル分布の母平均μが最大で5.9倍という事です。母平均μはハッキリとは分からない値でしたが、5.9倍以下の値だったら何でもイイわけです。
ところで、検定統計量tは基本的には標本平均と想定された母平均μとの差に比例するので、母平均μが小さくなればなるほど検定統計量tの値は大きくなります。その境界線以上のtになる確率を全て足し合わせたモノが小さければ小さいほど、帰無仮説は確率的に見てあり得ない仮定である⇒対立仮説が確率的に見て正しい、と言った論法を展開できるワケです(つまり、帰無仮説が正しい、と言った前提で、1回目に取られた標本以上のtが得られる事が極めて稀な現象であると証明したいのです)。
以上の論法を踏まえて、赤い面積の確率を、統計的仮説検定では特に有意確率(またはP値P-value確率値等)と呼びます。
では有意確率がどれ程小さければ帰無仮説が確率的に間違ってる⇒対立仮説が確率的には正しい、と言えるのでしょうか?残念ながら統計学的な基準はありません。ただし、本当だったら、仮説を立てる一番最初の段階で主観的にこの「小ささ」を適当に決めておかなければならないんですが、ここでは一般的に良く使われる5%を用います。*5つまり、有意確率が5%より小さかったら、帰無仮説を

「確率的には間違ってる(可能性が高い)」

とし(これを専門的には帰無仮説を棄却すると言います)、対立仮説を

確率的(正確には95%)に正しい

とします(これを専門的には対立仮説を採択すると言います)。
ちなみに個人主観で決めたこの「小ささ」(閾値)を有意水準(または危険率棄却域等)と呼びます。一回この有意水準を視覚的に確認してみましょう。

59ace187.jpg

赤い面積(有意確率)と青い面積(有意水準)を比べてみたら明らかに有意確率の方がデカそうですね(笑)。何か悪い予感がしますが(笑)、有意確率と有意水準を重ね合わせてみましょう。

c47c73f5.jpg

これで明らかに有意確率は有意水準より大きい事が分かります。
(ちなみにこの例での有意確率は計算上、29%程です)
これでは帰無仮説(母平均μは5.9以下である)は棄却出来ません。つまり、対立仮説の正当性を証明する事には失敗したワケです。
故に結論としてはこうなります。

阪神ダート1,800M戦でのBT産駒が勝った時の単勝オッズのモデル分布の母平均μは
5.9より大きいとは言えない

専門的には、「統計的に有意ではない」等と言った言い方をするんですが、要するに帰無仮説を棄却できる根拠は見つけられなかった、と言った意味になります(決して帰無仮説が正しい、と言った意味ではありません)。*6
もっと砕けた言い方をすると、次のようになります。

03.1.5〜05.12.25の範囲の阪神ダート1,800M戦に於いて、現役のブライアンズタイム
産駒の単勝馬券を買い続けて、的中率が17.0%だとしたら、回収率が100%を超えた
のは”たまたま”偶然である可能性が高い

大変残念な結果なんですが、これが統計的仮説検定に拠る結論です。よってこのデータを信用して、今後、阪神ダート1,800M戦で現役のブライアンズタイム産駒の単勝馬券に賭け続けるのはリスキーである、と言った判断をした方が賢明でしょう。何故なら、その的中馬券の単勝オッズの母平均が、過去のデータを見ても回収率が100%を超えるような分布のモノであるのかどうか全く分からないからです。

以上が統計的仮説検定の基本的な考え方です。ちょっとややこしく感じるかもしれませんが、統計的仮説検定の考え方を説明するにあたり、なるべく分かり易く、また馬券購入者が一番興味がありそうな話題に限定して論を展開したつもりです。


コメント

  • 昔、大学の学生時代に習ったような難しい統計の話を思い出しました。卒業してからも、実験データが有意差ありなしと検定したことを懐かしく思い出しました。ただ、あのころも統計ソフトにデータを入力するだけで理論はそっちのけだったような…。 -- むーてん? 2006-06-29 (木) 16:55:01

>統計ソフトにデータを入力するだけで理論はそっちのけだったような…。

僕は基本的にはそれでいいと思ってるんですよね(笑)。
統計のメンド臭いトコは、

  1. 計算式がメンド臭い
  2. 計算式がメンド臭い上に大量のデータを扱うと死にそうな思いをする(笑)
  3. そのワリには日常生活上ある程度のまとまったデータを手にする事が(競馬以外は)殆どあり得ない

この3つが理論と実践の間のギャップなんです。よってマニアック化してしまう。
その点競馬はイイですよ(笑)。望まなくても10万単位のデータが手に入りますし(笑)。
Excelで見よう見まねでやってるうちに、自然と身に付く技術なんじゃないかなあ、とワリとその辺りは楽観的に考えているんですよね(笑)。-- 亀田? 2006-06-30 (金) 23:08:33


競馬@Wikiへ戻る


*1 なお、一応注釈しておきますが、検定がどんな結果になったにせよ、ここで競馬・最強の法則誌を批判するのは本意ではないです。それを一応断っておきます。実は今回この記事を書くにあたって、「阪神ダート1,800MのBT産駒」のデータをTARGET frontier JVから条件を同様にして落としてみたのですが、最強誌上のデータとの喰い違いが発覚。その原因を最強の法則編集部に電話で尋ねたのですが、非常に親切・丁寧な応対で好感が持てました。他の様々な業種の会社の電話応対と比べても、極めて良心的で礼儀正しく素晴らしいものだと思います。確かに批判も多い競馬・最強の法則誌ですが、少なくともKKベストセラーズと言う出版社は社員教育に関しては徹底している立派な出版社だと感じました。編集部の方が早速その喰い違いの原因を探し出して来てくれて、検索の追加条件を快く教えていただきました。今回この記事が書けるのは競馬最強の法則・編集部のお陰だと思います。この場を借りて厚くお礼を申し上げます。本当にありがとうございました。
*2 正規分布の仮定が認められない場合、次の2つの方策が考えられます。一つ目は、別の分布を仮定してパラメトリック・ブートストラップ法と呼ばれる検定手法に持ち込む手です。これは単純に言うと、別の分布を設定して「仮想実験」を実際に行う事です。具体的には、乱数を用いてコンピュータ上で何万回も実験してみた結果と照合する、と言ったやり方です。二つ目はノン・パラメトリック検定と言われる手法に持ち込む手です。ちなみに、単勝人気順で的中オッズのヒストグラムを作った場合正規分布に見える、と言うのはあながちおかしくはないと思います。と言うのも、オッズは馬券購入者自身が作り出すもので、その値は総馬券購入額の内の何%が投入されたのか、いわゆる占有率と呼ばれるモノに反比例します。しかしながら、この占有率と言うのは当然固定されたものではないので、総体的にはランダムと言える動きをします。その効果が正規分布に似た形の分布を作り出すのでしょう。全ては全部の馬券購入者が一体何を買おうとするのか、一体いくら投入するのか、単純な視点では全く予測が付かない、と言う理由に拠ります。かつ、統計的に言うと、それぞれの競馬新聞がどんな馬に重く印を付けるか、と言うのも全く分からないし、どの意見を誰が重要視するのかも分からない。統計学的にはこれら全ての効果は総体的には無作為に見えるのでしょう。この視点で言うと、例え単勝人気順から離れ、例えば阪神ダ1,800MのBT産駒に注ぎ込まれるお金も、とても法則性に則ったモノとも言えず、結果サンプル数が無限大になった場合、正規分布するだろう、と言った視点で特に構わないと思います。別の条件分けにしても同じ。
*3 本来だったらμ≦5.9が帰無仮説ですが、分布の形を確定させる為敢えて条件範囲での最大値、5.9を採用します。まあ、これはお約束と考えておけばイイです。
*4 この「小標本」の問題に付いて言及したのが、W.S.ゴセットです。例えばビール会社がビールの品質改善の問題を考える場合、一番確実な方法論は「全部のビールを調べる」事です。しかしながら、現実の問題として、全てのビールを調べてしまったら、商売が成り立ちません。我々ビール愛飲者は調べ終わった気の抜けたビールしか飲めなくなってしまう。これはヒドイしやって欲しくないです(笑)。そこで少数のサンプルを抜き出し、出荷された全体のビールに関して言及する方策を探すのが一番得策、と言う事になります。この実験を実際にやってみて、t分布を発見したのがギネスビール社の醸造技術者、W.S.ゴセットだったのです。なお、t分布の名前の由来はW.S.ゴセットの論文のペンネームに由来すると言われています。ギネスビール社に本名での論文発表を禁じられたゴセットはStudentと言ったペンネームで論文を発表します。ゴセットは自身が発見した確率密度関数をs分布と呼んでたらしいですが、推測統計学の父、R.A.フィッシャーがsは標準偏差を指す事にも良く使われるので紛らわしい、と判断。代わりに発見者ゴセットのペンネームStudentの第2文字目、tを分布の名前とした、と言った逸話が残っています。
*5 他には1%や0,1%が良く使われるが、この例でそこまで検定をガチガチにしてもしょうがないので、一般的な5%にしました。なお、有意水準は原理的には50%より小さければ本当に何でも良いです。ただし、仮に有意水準49%で検定して帰無仮説を棄却した結論で他人を十二分に説得できるかどうかはまた別の話。それは帰無仮説がいまだ正しい確率が49%存在する、と言う意味なので、49%は“危険な”結論と言う事です。それが“危険率”と言う言葉の由来。取りあえず有意水準は誰が見ても“まあまあ小さいよね”と言える類の値にしておいた方が無難です。
*6 この辺り、本当に勘違いしている人が多いです。この概念に付いて、岩波書店の確率・統計入門の著者、故・小針氏は借金を例(!)にして、とても上手い例を挙げています。曰く、「二重否定は肯定だと信じて疑わない読者は、よく味わっていただきたい。‘返さないとは言わない’は‘返します’と同義ではないのである。帰無仮説を肯定的に使ってはならない、ということをくり返し強調しておこう。」