増額投資よもやま話に戻る
統計解析についてに戻る
競馬@Wikiに戻る
昔、追い上げをシミュレーション(といってもエクセルでの単純なやり方ですが)した ときに思ったのは、たとえば単勝2番人気なら2番人気が集中して出現するタイミングを 捉えることができないかな、ということです。 母集団が大きくなればその出現頻度はほぼ一定に収束するのでしょうが、その出現の 仕方はまちまちですよね。 たとえば2番人気が一日12Rのうちに6レースくらい出ることもあれば、2日間で1回しか でないこともある。 投資競馬協会のゴールドラッシュ法、1日前に1回も2番人気が出なければ次の日には 出る率は高いから狙え、とかいったものがあります。 こういう出現頻度のゆらぎみたいなものをかなりの確率で予見できれば、追い上げも 少しはリスクが少なくなるのではと思いますが、いかがでしょう?。 -- むーてん?
ゴールドラッシュ法ですが本の通りやっててはダメですね。揺り返しが来る といったって1日出ないのを待ってるくらいでは出る日もあるが出ない日もある。。。 次の日出る確率が普通より若干増えるだけです。。。 -- ヒロ?
このページでは日本競馬投資協会が主張している前日以前のターゲット馬券の出現動向による馬券選定法を取りあえずは全てカウント法*1としてその数学的議論の妥当性を理論的に検証して行くページです。
なお、この手の理論は日本競馬投資協会の十八番ではなく、他の有名どころではITR投資技術研究会等も主張している方法論です。
分割コロガシのページでも書きましたが、一番最初に何をしなければならないか、と言うと仮定の設定です。何に付いての仮定*2なのか、と言うと、果たしてある条件下での馬の勝率は独立事象なのか?と言った部分です。
例えば日本競馬投資協会は様々なカウント法を提唱していますが、多分殆どの理論は馬券の的中は独立事象であると言った仮定を用いていると思います*3。
そこでここでもなるべくシンプルな議論を目指して、
「ある条件下での馬券の的中率は独立事象である」
としましょう。
最初に日本競馬投資協会が行った議論を丁寧に追って行きたいと思います。
日本競馬投資協会が一番最初に前日の馬券の出現動向から当日の馬券の出現動向が分かると言い出したのは、一番最初の出版物、&amazon(4901880012);でのゴールドラッシュ法でした。
数学的厳密性はともかくとして、例えば前日に一回も単勝1番人気が出なかったら次の日は反動で出そうだと言った気持ちは分からなくもありません。
ところが、実際問題、1日中単勝1番人気等の上位人気馬券が出ないこと等ほぼあり得ません。つまり、ゴールドラッシュ法と言うのは使う機会が殆ど無い(一競馬ファンとしては、ケンだらけの日々が続いてしまう)投資法だったのです。
そこで、次に日本競馬投資協会が打ち出したのは出現期待値と言う考え方です。これはある観察期間を設けて、特殊な計算式を用いてある日の単勝人気の出現期待度を割り出そうと言った考え方です。その計算式は以下の様なものです。
ここでp-hatは近日のある単勝人気の出現頻度、そして、pは長期間に渡っての出現頻度(まあ、母比率と考えていいでしょう)を表しています*4。そしてこの数値が一番低い馬券を狙う、と言うようなものです。
さて、ここで僕は敢えて特殊な、そして期待度と言いましたが、それは統計学で言うところの期待値とは丸っきり意味が違うので、敢えて言い方を変えたのです。まずはそれを説明していきます。
日本競馬投資協会が上の式で表現した出現期待値なんですが、実はこんな計算式は統計学では存在しません。統計学で言う期待値E(X)の定義とは、
で計算される定数*5です。
大事なのは、統計学では期待値とは加重平均の事であると言う事です。これは数学的には重心の事であり、そして期待できる値と言う意味は全く持っていない事に注意して下さい。これが統計学用語の難しさと言うか、ハッキリ言うとかなりデタラメなトコロなんですが*6、取りあえず期待値は期待できる値、と言う意味ではなく、単なる平均と言う意味であると覚えておけばいいでしょう。
一方、日本競馬投資協会が言ってるのはそれこそ期待できる値であって、しかもそれは統計学の文脈では存在しません。良く、日本競馬投資協会は
「××は絶対の統計学的な真実である」
等と書いてますが、こうやって全く統計学と関係無い数式を自作してたりするので、「どこが統計の話でどこが統計じゃない話なのか?」かなり注意して読むべきだとは思います。
つまり、ホントの話とウソが入り混じっているので、見分けが難しいところなのです*7。
しかしながら、本当の事を言うと、自作した式は全てダメな式であると言うつもりは丸っきりありませんし、それは本題では無いです。大事なのは統計学での文脈とそうでない文脈は分けて考えるべきである、と言った事です。そして日本競馬投資協会の自作式の検証がここの主眼でもないです。それは実際実験してなければ何も言いようがないですし、恐らく多くの人々が既に試されているでしょう。ですから、ここでは上の出現期待値の数式の是非を問うのは止めて、別に統計学的文脈ならどう言った予測が可能なのか?と言った話に焦点を絞りたいと思います。
>たとえば1000個のボールに1の番号(1着)をある数、たとえば300個混ぜておき、無作為に12個とりだしてそのうち何個が1の書かれたボールであるか。1回終わったらまた元に戻して同じことを繰り返す。
はい。原理的にはその考え方で間違いないです。
>混ぜる番号つきのボールの数が勝率(あるいは1番人気の勝つ頻度)になるのかどうかは別として。
直接勝率ではないですけど、考え方の筋道としては正しいと思います。そして、
1の書かれたボールが取り出した12個のうち1個以上ある確率
に焦点を絞りたいと思います。 -- 亀田? 2006-07-21 (金) 13:10:59
では、最初に単勝1番人気(出現確率約35%)をトピックとして取り上げたいと思います。
なお、以下の議論は別に単勝人気順別勝率だけでなく、データさえあれば日刊コンピだろうとなんだろうと筋道は変わりありません。
しかし、ここではデータの取りやすさ、と言った利便性を重視して敢えて単勝1番人気を議題として取り上げます。
ところで、また別のサイトの話で恐縮なんですが、以下のような議論をしているサイトがありました。
投資競馬を行う日の出現回数がある程度予測できたらいいと思いませんか?
いいと思いますね(笑)。果たしてこれは出来るのでしょうか?
そのサイトに上げられていた方法論はさておき、統計学的には出来ますと答えましょう。前日の出現動向もクソも関係なく、どれくらいの確率で1日辺り何回出現するのかを統計学では答える事は可能なんです。
このある確率をもってどんな出現回数になるのか?を司る確率構造を二項分布と呼びます。⇒統計解析について参照
その二項分布の数式、そして考え方に付いて詳しくは統計解析についてのページに譲りますが、例えば今、勝率35%の馬の馬券が1日(12レース)で何レース出現するのかは厳密にその確率を計算できるのです。
12回の試行で的中率35%の馬券がx回出現する確率 | |
出現回数 | 確率 |
0 | 0.5688% |
1 | 3.6753% |
2 | 10.8846% |
3 | 19.5365% |
4 | 23.6692% |
5 | 20.3920% |
6 | 12.8103% |
7 | 5.9125% |
8 | 1.9898% |
9 | 0.4762% |
10 | 0.0769% |
11 | 0.0075% |
12 | 0.0003% |
当然、この確率を全て足し合わせたら1=100%になります。
ところで、例えば単勝1番人気は平均で1日3〜4回は出現する馬券ではありますが、実際のトコ、3回出現する確率は19.5%程で4回出現する確率は23.7%程です。
具体的にこの意味は、例えばTARGET frontier JVなんかで、無作為に1日12レース単位で取り出す、戻すを100回くらい繰り返すと、そのうち単勝1番人気が3レース出現している日は100日中19〜20日くらいで、4レース出現しているのは24日程だという事です。
さて、例えばここで、単勝1番人気を追い上げたいとするとしましょう。そうすると、一番困るのは、
単勝1番人気が1日で一回も出ない
と言った事象です。つまり、出現回数が0回、と言った事ですね。
前述の計算によるとその確率は
との事でした。
という事は、逆に言うと、ある適当な一日を選ぶと、少なくとも単勝1番人気が1回以上出現する確率は、
である、と言う事です。つまり、理論的には、無作為に単勝1番人気を追い上げる戦略をとったとしても100日中99日は1日以内で決着が付いてしまうんです。前日の動向を利用して予測する必要性も無いんですね。
ちなみに、この
のような計算を行って出す確率を累積確率または累積分布と呼びます。
図示すると以下のようになります。
赤の部分の確率が単勝1番人気が1日で全く出現しない確率です。それ以外の部分が少なくとも単勝1番人気が1日で1回以上出現する確率ですね。
では2日間での単勝1番人気の動向を考えてみましょう。
議論は今までの議論の流れと丸っきり同じです。例えばTARGET frontier JVなんかで2日(24レース)単位で無作為に100回取り出した場合に、単勝1番人気が少なくとも1回以上含まれている確率を考えます。
24回の試行で的中率35%の馬券がx回出現する確率 | |
出現回数 | 確率 |
0 | 0.003% |
1 | 0.042% |
2 | 0.259% |
3 | 1.022% |
4 | 2.890% |
5 | 6.225% |
6 | 10.614% |
7 | 14.696% |
8 | 16.816% |
9 | 16.097% |
10 | 13.002% |
11 | 8.910% |
12 | 5.198% |
13 | 2.583% |
14 | 1.093% |
15 | 0.392% |
16 | 0.119% |
17 | 0.030% |
18 | 0.006% |
19 | 0.001% |
20 | 0.000% |
21 | 0.000% |
22 | 0.000% |
23 | 0.000% |
24 | 0.000% |
今度は2日間で少なくとも単勝1番人気が1回以上出現する確率は
である事が分かります。理論的には2日(24レース)単位で10万回取り出してもそのうち99997回は単勝1番人気が含まれてるんですね。なかなかこれは恐るべき結果だとは思います。
さて、ここでちょっと前提をもう一回確認してみましょう。
この4つを前提としましょう。
まずは1番目に関しては、古典的な区分けですと、予想競馬派と投資競馬派との論争の焦点になっていたものです。例えば、予想競馬派から言うと、
「確率で馬券が取れるか!」
と言った批判が出てましたし、投資競馬派からですと、
「レースは確率事象である。予想するから儲からないのだ。」
と言った反論が出ていました。
しかし、本当の事を言うと、この議論は全く意味の無いナンセンスなものです。正確に言うと、「競馬は確率事象」なのではなくって、あくまで「確率事象として捉える」なのです。つまりこれは「ものの見方」の話であって、これも単なる「仮定の導入」なんです。
例えば、レース結果の蓋然性に対して「血統を導入して説明を試みる」のも当然可ですし、もしくは「騎手間の政治力」なんて仮定を導入しても構わないのです。そしてこれらと並列に「競馬を確率事象として捉える」があるだけなんです。
予想理論と言うのは原理的には「説明能力の体系を作る」試みですし、これで結果を予測しようと試みるのは別段悪い話ではありません。どの道、レース結果が何に左右されるのか、なんてのは馬券購入者の預かり知らぬ話なんです。ひょっとしたらJRAの圧力でレース結果が既に決まってるのかもしれませんし、真実はどうあれ、単に「分からない話は分からない」だけです。
いずれにせよ、「武豊が才能ある騎手」だとしたって、結果は彼が100%勝ってるワケではないから競馬は不思議なんですよね。この結果から何を読むか、と言うのは個人の自由ですし、「単に偶然の産物ですよ」と言う言い方もアリなだけです。取りあえずここでは「競馬のレース結果はサイコロ/ルーレット等と同じ無作為/無機質なモノとして捉えましょう」と言う事です。それが真実かどうかに付いては言及しません。
2番目に関しては既出です。よってこれに付いては省きましょう。
3番目に関しては次のような事です。事実上中央競馬はある確率で無限回にわたって1の番号がふられた玉を吐き出している確率装置のようなものです。参加者はいつからでもこの確率装置に於いての賭けにも参加できるし、また、止める事が出来ます。故に、特定の観察期間をどう置くかに付いては、その参加者が主観によって決定できる自由があります。つまり、観察期間=暫定的な試行回数の設定、またはその区間をどこに設定できるかに対しては何ら制限は付かないもの、とします。
4番目はまとめのようなもので、仮に過去のレースをどう言った分析法により見るにしても、確率事象として、今後も傾向は変わらない、とします。つまり例えば、過去のレース結果から2日(24レース)無作為に抽出しようと、来週の2日間(24レース)を観察しようと結果は変わらない。来週のレースでさえ、ある母体から無作為に抽出されたものが提示されたとして、何らかの意図で結果が操られると事が無いと言った要請です。
さて、ここで、むーてんさんが示唆した例題が面白いんで、それに従って次のような問題設定を考えます。
今、ある箱のなかに100,000個玉が入っています。 その玉は100個中35個の割合で1と番号がふられています。 そしてこの箱はある暗い部屋の中に置かれています。 今、この部屋にむーてんくんとヒロくんの二人の男性がいます。 むーてんくんは箱から無作為に24個玉を取り出しました。部屋は暗いので、玉に 何が書かれているのかは分かりません。 そして、取り出した玉の中から、無作為に12個をヒロ君に手渡しました。 二人はその暗い部屋から外へ出ました。外は明るかったです。 むーてんくんは自分の持ち玉12個を確認しました。なんと1の番号がふられた玉は一つ もありませんでした。 さて、ヒロくんが持ってる12個の玉の中で1と番号のふられた玉が少なくとも一つ以上 ある確率はいくらでしょう?
ちょっと長くなってきたので、投資競馬の話あれこれと言う新規ページを立てました。そちらへどうぞ。
さて、確率の問題ですが、色々な考え方が出ましたね。
ちなみに答えは
95.7746925%
となります。
考え方は次のようになります。
まずは、無作為に24個取り出した、と言った状況で、玉に1がふられている個数の可能性は0個〜24個のどれか、だという事です。そしてその確率は試行回数24回、的中率35%の二項分布に従うのです。
さて、ここでむーてんさんが自分の手持ちである12個の玉を確認して、そこに1がふられていないのが分かった時点で、ヒロさんが持っている12個の玉の中で1がふられている個数の可能性は0個〜12個のどれか、と言う事になります。すなわち、試行回数24回、的中率p=35%の二項分布で次の式が答えを求める式となるのです。
となります(筆算では大変なので当然コンピュータ使用で計算するのをお薦めします。)。下に上の解を図示してみます。
図で言うと、赤い部分の面積がヒロさんが1とふられた玉を持っている確率です(x=0は含まれていない事に注意しましょう)。 では、次に類題をやってみましょう。
今、ある箱のなかに100,000個玉が入っています。 その玉は100個中35個の割合で1と番号がふられています。 そしてこの箱はやっぱりある暗い部屋の中に置かれています。 またもや、この部屋にむーてんくんとヒロくんの二人の男性がいます。 むーてんくんは箱から無作為に24個玉を取り出しました。部屋は暗いので、玉に 何が書かれているのかは分かりません。 そして、取り出した玉の中から、無作為に12個をヒロ君に手渡しました。 二人はその暗い部屋から外へ出ました。外は明るかったです。 むーてんくんは自分の持ち玉12個を確認しました。なんと1の番号がふられた玉は 今度は6個もありました。 さて、ヒロくんが持ってる12個の玉の中で1と番号のふられた玉が少なくとも一つ以上 ある確率はいくらでしょう?
これらの問題の場合は、直接的にはモンティホール問題は適用できないと思います。
この手の情報開示の問題に於けるパラドキシカルに見える問題として・・・・例えば「3囚人の問題」とかありますが、原則的にこれらの確率議論は、「順列・組み合わせの問題」の延長線上にあり、もう一つは単純な「理由不充分の原理」の適用の例だと思います。
元々「確率設定」として、「明日単勝1番人気が少なくとも1回は出る」確率と「明日単勝1番人気が全く出ない」と言った2つの可能性は5分5分だから、両者共に50%の確率である、と言った設定は仮想議論として可能かもしれません(特に否定もしません)。が・・・・・現時点の議論の延長線上には無いんですね。と、同時に、JRAが「全てを知っている司会者」として認知していいのかどうか・・・・・・?これは謎ですし(笑)、またこの議論は「陰謀説」での予想理論に介入の隙を与えます(笑)。(もっとも隙を与えても構わないんですが・笑)
もっとも別の視点だったらモンティ・ホール問題は適用できるかもしれませんね。例えば。
仮にここで16頭出走馬がいるとしましょう。ここで予想購入者が単勝を1点選ぶとする。そこで、主催者であるJRAが残り15頭のうち、14頭を消してくれる。さて、貴方が選んだ単勝とJRAが残した単勝、果たしてどっちが的中率が高いのか・・・・・・?どっかで聞いた話ですね(笑)。
全く情報が無い状態ですと、JRAが宣伝に力を入れている馬の勝率が常に高い、と言う数学的根拠とはなるかもしれません(笑)。別にどの馬がそうなのか、ここでは敢えて名前をバラす気もないですが(笑)。皆が知ってるあの馬ですよ(笑)。 -- 亀田? 2006-07-25 (火) 03:16:49
数値演算言語OCTAVEによるプログラム入門のページにモンティ・ホールの問題のモンテカルロ・シミュレータのプログラムをあげました。 -- 亀田? 2006-07-25 (火) 21:10:48
>1番人気の複勝(66.4%)がカウント法によってここで教えてもらった乱数を使って確率上がるか検証してみました。
実験お疲れ様でした。モンテカルロ法便利でしょ?単純な設定だったら、わざわざJRA-VANのデータをひっくり返さなくても理論的な事だったら検証が出来ます。
これは一つ武器を手に入れたに等しい、と言う事ですからね。軍事技術なだけあって(笑)、競馬とも闘えます(笑)。
> 前日の12レースの複勝の数を数えて次の12レースの確率は?ということだったのですがまったく変化なしでした。
出来ればロジック上げれますか?追試検証できると便利ですし、直接予想理論ではないので、コードをチェックしあうのも面白いと思います。-- 亀田? 2006-07-28 (金) 06:07:57
Private Sub main() Dim i As Long, j As Long Dim mystr As Long j = 1 Sheet2.Select For j = 1 To 12 Cells(1, j) = j Cells(1, 13) = "的中数" Next j For j = 1 To 12 Cells(1, j + 14) = j Cells(1, 13 + 14) = "的中数" Next j Cells(1, 29) = "2日間の的中数" For i = 1 To 10000 For j = 1 To 12 mystr = Int((1000 - 1 + 1) * Rnd + 1) If mystr <= 664 Then Cells(i + 1, j) = 1 Else Cells(i + 1, j) = 0 End If Next j For j = 1 To 12 mystr = Int((1000 - 1 + 1) * Rnd + 1) If mystr <= 664 Then Cells(i + 1, j + 14) = 1 Else Cells(i + 1, j + 14) = 0 End If Next j Next i For i = 1 To 10000 For j = 1 To 12 Cells(i + 1, 13) = Cells(i + 1, 13) + Cells(i + 1, j) Next j Next i For i = 1 To 10000 For j = 1 To 12 Cells(i + 1, 13 + 14) = Cells(i + 1, 13 + 14) + Cells(i + 1, j + 14) Next j Next i For i = 1 To 10000 Cells(i + 1, 29) = Cells(i + 1, 13) + Cells(i + 1, 27) Next i End Sub
増額投資よもやま話に戻る
統計解析についてに戻る
競馬@Wikiに戻る