2017年 5月 の投稿一覧

【ルーレット攻略】おそまつな確率計算~98.48法~

オンラインカジノのルーレット攻略法に、98.48%法というものがある。

これは、配当が3倍の箇所(以下の9つ)のどれかに3回連続で目が出た場合、次の目は98.48%の確率で他の2か所に出る、というものである。

配当が3倍の箇所
・1~12(ダズン)
・13~24(ダズン)
・25~36(ダズン)
・1,4,7,…(コラム)
・2,5,8,…(コラム)
・3,6,9,…(コラム)

計算してみよう。

まず、13~36の目が「出ない」確率について。
つまり、1~12および0が出る確率について。
この確率は、目が0~36までの37個の場合、13/37となる。

13/37は35.14%である。
2回連続で13~36のいずれの目も出ない確率は、(35.14%)×(35.14%)で12.34%、3回連続では(35.14%)×(12.34%)で4.34%である。

4回連続で出る確率は1.52%となり、4回目で13~24、25~36のどちらかのダズンに出る確率は1-1.52%で98.48%だというのである。

そのため、3回連続で特定のダズン、もしくはコラムに出るまで「待ち」、3回連続で偏ったら4回目の時「だけ」に賭ける、という戦法である・・・

はっきり言って、バッカじゃね~の?

こんなのが成り立ってたら、だれでも億万長者になれるじゃねーか
3回連続で同じダズン、もしくはコラムに出た時、98.48%の確率で他の2つのダズンもしくはコラムに出ると思ってる奴は、全財産突っ込んでみろよ。
絶対破産するから。

ルーレットの確率っていうのは、直前に何の目が出たかは関係ないんだよ!
特定のダズンとかコラムに3回連続で出ても、次もそのダズンかコラムに出る確率は12/37なんだって。もうね、アホかと。

じゃあ上の98.48%はなんなのかって言ったら、4回

    連続で

特定のダズン、もしくはコラムと0の13箇所に賭けた時に、「4連勝じゃない場合」の確率である。

1回勝つ確率・・・ 35.14% ( 13/37 )
2回連続で勝つ確率・・・ 35.14% × 35.14%
3回連続で勝つ確率・・・ 35.14% × 35.14% × 35.14%
4回連続で勝つ確率・・・ 35.14% × 35.14% × 35.14% × 35.14%
4回中、少なくとも1回以上負ける確率・・・ 1 – ( 35.14% × 35.14% × 35.14% × 35.14% )
こういうことである。

つまり、

    連続で賭けた時に

初めて成り立つ確率であり、また途中で1~4回負ける確率も含んでいる。
ただそれけを示す確率である。

4連勝だとイメージしにくいので、2回連続の場合で考えてみる。

2回連続で特定のダズン、もしくはコラム2か所に目が出ない確率は、その24個の出目以外の13箇所なので 13/37 * 13/37 で12.34%。
この98.48%法に則って考えるなら、24箇所のうちいづれかに出る確率は87.66%である。

では、この24箇所に賭ける方法で2回連続の全ての事象を確率で計算してみる。

パターン1 1回目出ない、2回目出ない
13/37 * 13/37 = 12.34%

パターン2 1回目出る、2回目出ない
24/37 * 13/37 = 22.79%

パターン3 1回目出ない、2回目出る
13/37 * 24/37 = 22.79%

パターン4 1回目出る、2回目出る
24/37 * 24/37 = 42.07%

全ての事象の確率を合計すると、1となるので、計算は間違っていないはず。
ここで重要なのが、98.48%法と同じ要領で3回目に出ない確率を 1 – 12.34% (=87.66%) として導いた値には、2回目に出るという(98.48%法でいうところの4回目で出る)パターン3の他に、パターン2、4も含まれているということである。22.79% + 22.79% + 42.07% の値と一致する。(四捨五入すると100分の1%は違うが)
これは、1回目も2回目も

    連続で賭けた時に

賭けないとありえない。

ちなみに、ダズン、もしくはコラムの任意の2か所に1ドルずつ賭けるとしたら上の4パターンは以下の収支になる。
(勝てば3ドルの配当。ただし、2箇所にかけているので1ドルの利益。負ければ1箇所につき-1ドルであり、2箇所に賭けているので-2ドルとなる)

パターン1 1回目出ない、2回目出ない
(1 * -2) + (1 * -2) = -4

パターン2 1回目出る、2回目出ない
((1 * 3) – (1 * 2)) + (1 * -2) = -1

パターン3 1回目出ない、2回目出る
(1 * -2)) + ((1 * 3) – (1 * 2)) = -1

パターン4 1回目出る、2回目出る
((1 * 3) – (1 * 2)) + ((1 * 3) – (1 * 2)) = 2

98.48%法をシンプルに2回連続の場合に当てはめ直した時点で、2回連続で勝たなければ黒字にならないことがわかるだろう。

期待値的にも
-4 * 12.34% + -1 * 22.79% + -1 * 22.79% + 2 * 42.07% = -0.11
となる。

98.48%法の98.48%には、1回目だけ出るとか、2回目3回目連続で出る確率とかも含まれている。そして、その事象が発生するには、4回連続で賭けなければならない。

もし、98.48%法が確率的に成り立つなら、期待値は
-2 * 1.52% + 1 * 98.48% = +0.95
となり、期待値的にもプラスとなる。

98.48%法が確率的に成り立っていると思ってる奴!
もし、成り立っているなら期待値的に大きくプラスなんだから、ぜひ全財産を突っ込んで億万長者になってから反論しに来い!

文学作品は言葉の壁を越えられるだろうか

日本人の多くは、海外の文学作品を読もうとしたら、翻訳されたものを読むのではないだろうか。
逆に、海外の方も日本の作品を読む時は各国の言語に翻訳されたものを読むだろう。

一部、原著を読む方もいるだろうが、おおむね翻訳を読むはずである。

映画に関しても同じことが言える。字幕や吹き替えによって、海外の作品を楽しむのではないだろうか。

批判するつもりは全くないし、自分自身も本、映画ともに翻訳されたもので楽しむ。

世間一般の人が楽しむ分にはそれでいいのだろうが、はたしてこれが世界的な賞にもあてはまり、公平な審査が行われるだろうか、と前々から思っていた。

例えばノーベル賞。
ノーベル賞には文学賞があり、次こそは村上春樹か!と言われ続けている。
しかし、ノーベル賞の審査員の多くはおそらく日本語を読めないだろうし、村上作品を審査するとなれば、当然翻訳されたものを読むことになるだろう。
この翻訳によって、日本語の表現を完璧に再現できているだろうか。
翻訳者のさじ加減や主観が入っていないだろうか。
村上さんが英語を読めるかどうかわかりませんが(例に出してすみません)、これが英語を読めない日本人作家の場合、仮に翻訳された本の内容が自分の世界観と相違があったとしても、翻訳された本に自分の意図を伝えることすらできないのではないだろうか。

英語ならまだいい。中学から学んでいるのだから。例えばフランス語に翻訳された日本の本は?ドイツ語は?中国語は?
本当に作者の意図を伝えきれているだろうか。

何も日本語が崇高だと言っているのではなく、海外の作品も日本語訳される過程で作者の世界観をどれだけ再現できているか、わからない。

ヘミングウェイの老人と海なんかは、日本ではすごく有名な海外作品だが、どれだけ正確に翻訳されているだろうか。
名作と言われるものを、原著の言語で味わえないのは大変残念である。
しかし、味わえないのはまぁ自分のいたらないところではあるが、その再現率が怪しい分野に関して、世界的な賞(ノーベル賞とか)にはどれだけ価値があるだろうか。

あの審査員たちは、審査対象である各本の原著の言語で審査しているか。
いや、していないだろう。

そういった点から、ノーベル文学賞にはそれほど意味はないのではないだろうか。

同じことが映画にも言えるだろうが、映画は文学作品と違って物語の内容以外の要素(音響やカメラワーク、BGM等)が多いし、審査対象のほとんどがもとから英語の作品だろう。

しかし、文学作品は物語を構成する文章が審査対象のほぼ全てである。
そのため、日本人作家も海外の作家も言葉による表現に細心の注意を払って世に出しているのだろうし、それを原著の言葉ではなく翻訳で審査しているのだから、各本の表現の真髄を審査しきれていないのではないだろうか。

ノーベル賞で言えば他の物理学賞や化学賞なんかは、理系分野ということもあるが再現率が全てである。再現できなければ成果としての価値がない世界である。
もちろん研究する上での過程としては、再現できなくても十分価値はある。
しかし、賞として審査されるのは成果が全てである。

文学賞はどうだ?作家の意図や表現を再現しきれているか?
特に英訳なんて、多くの文章に「主語」が来る。文脈依存の日本語的表現との違いは大きい。

自分が高校生の時、大学受験のための国語の模試で、この翻訳について述べられた評論文が出題された。
いわく、川端康成の雪国の冒頭にある
「国境の長いトンネルを抜けると雪国であった。」
は、海外の「Snow Country」だと
「The train came out of the long tunnel into the snow country.」
となる。
日本語だと、雪国の景色が汽車に乗っている自分の主観として述べられるが、英語だと第三者として汽車を見た表現となっている、というのである。
たしかに、検索して冒頭の内容を読んでみたが、そうなっている。

長くなったが、自分の考えとしては、世界中の作家による文学作品の真髄(表現や間、スピード、世界観、登場人物の心情等々・・・)は言葉の壁を越えられない、と思っている。
そして、翻訳に基づく審査に価値はない、とも思っている。

最後に注意を述べておくが、世界的な文学の賞としてノーベル賞を挙げているが、ノーベル賞に恨みがあるわけではない。

興津川にイワナはいるか

興津川でイワナの釣果が書かれたブログをいくつか拝見したので、ここ最近興津川のイワナの実績があるところにかよっているのですが、4回通ってまだ見ていません。

けっこう上流まで行ってるのでが、まだ上流に行かなければならないのでしょうか。
まだアマゴしか見ていません。

自分の腕が悪いっちゃそれまでなんですが、静岡に来る前まで、地元の渓流ではヤマメよりもイワナを釣る方が得意でした。
線の釣りより点の釣りの方が得意なんですよね。

また、ヤマメやアマゴよりイワナの方が細い糸を求められない気もしますし・・・
いつか興津でイワナを釣りたいけど、いつになるやら・・・
でも、興津でイワナを釣ったっていう情報がそれほど昔の内容でもないため、まだいる気がするんですよねー
ネイティブではいない魚なので、誰かが放流したと思うんですけど、そんなに簡単に絶滅しない気がしますけど。

tesseract-OCRを使わずにPythonで画像から文字を認識させるソフトを作ってみた – 2

前回の記事<<

tesseract-OCRを使わずに文字を識別する方法の続きです。

ImageGrabを使ってデスクトップのスクリーンショットを撮ったところからです。
スクリーンショットの撮り方は、
img = ImageGrab.grab((X1 , Y1 , X2 , Y2)).save(“ファイル名.png”)
でいけるかと思います。

以降の流れとしては、
・画像のグレースケール化
・画像の2階調化
・画像内の座標を取得し、文字を識別する
という流れです。

・画像のグレースケール化
文字を識別するために、画像上の特定の色の座標位置が使えるのではないかと思いました。
しかし、私が識別したい文字の色は数種類あるので、特定の色を何色にしようかと考えた結果、OpenCV2ならグレースケール化や2階調化が簡単ということで白にすることにしました。

グレースケールは、さっき保存した画像を一度読み込んでから行います。
img = cv2.imread(“ファイル名.png”)
img2 = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

・2階調化
2階調化します。閾値はどれくらいがいいかは、JTrimというソフトであらかじめ何度か試してみて、決めました。
→ JTrim

_ ,img3 = cv2.threshold(img2,128,255,cv2.THRESH_BINARY)

これで、変数img3に2階調化されたデータが入りました。
なぜimg3の前に ”_ ,” を入れるのかはわかりませんが、入れないとうまくいかず、検索した結果アンダーバーとカンマを入て解決する方法を見つけました。

続きます。

次回はこちら