Выявление умных денег в спортивном беттинге
#81 OFFLINE
Добавлено 12 June 2018 - 21:40
Наши спортивные исходы рапределены по биномиальному ЗАКОНу (надеюсь, вам это доказывать не нужно)
Для определения самого закона в дифференциальном виде используют формулу
вероятность (m,n)=(количество сочетаний по m из n) *Р^m *(1-Р)^(n-m)
Если хотим определить как распределена реально наша случайная величина, то разбивают все результаты на группы по n элементов.
Подсчитывают в каждой группе количество сбывшихся результатов (то есть "1").
Находят среднее (МО) из всех групп.
Подсчитывают частоты
0 раз из n
1 раз из n
2 раз из n
.......
n раз из n
Находят дисперсию, беря значения в каждой группе относительно найденного среднего
А по найденным частотам строят ГИСТОГРАММУ распределения и сравнивают ее с теоретическим ЗАКОНОМ распределения
Если это вам не понятно, то сперва надо освоить...
У меня режим - пью и сплю по расписанию...
Если будет необходимость, продолжим в другой раз....
#82 OFFLINE
Добавлено 12 June 2018 - 21:59
Дипломат, on 12 June 2018 - 21:40, сказал:
Наши спортивные исходы рапределены по биномиальному ЗАКОНу (надеюсь, вам это доказывать не нужно)
Для определения самого закона в дифференциальном виде используют формулу
вероятность (m,n)=(количество сочетаний по m из n) *Р^m *(1-Р)^(n-m)
Если хотим определить как распределена реально наша случайная величина, то разбивают все результаты на группы по n элементов.
Подсчитывают в каждой группе количество сбывшихся результатов (то есть "1").
Находят среднее (МО) из всех групп.
Подсчитывают частоты
0 раз из n
1 раз из n
2 раз из n
.......
n раз из n
Находят дисперсию, беря значения в каждой группе относительно найденного среднего
А по найденным частотам строят ГИСТОГРАММУ распределения и сравнивают ее с теоретическим ЗАКОНОМ распределения
Если это вам не понятно, то сперва надо освоить...
У меня режим - пью и сплю по расписанию...
Если будет необходимость, продолжим в другой раз....
СВ составлена совокупность а раздербанить её при условии что в качестве свидетельства дан тока кефф . Ну вы ж сами понимаете что это невозможно... а то что вы предлагаете мы уже обсуждали тут на форуме...что надо брать окна там чего-то считать потом плясать с бубном итд итп....
Это всё сделать не проблема...а что потом-то? ну вот допустим я даже вам сказал что да там смесь и что далее? даже если я знаю с какой частотой я генерил то я один хрен не могу сказать не подсмотрев в формулу для ячейки из чего что произросло...а тогда как мы будем решение принимать по взятию сих и отвержению этих?
Вот как, с вашей точки зрения, должен игрок действовать(что берём-с а что в мусорную корзину)?
Отредактировано Bambuk, 12 June 2018 - 22:01.
#83 OFFLINE
Добавлено 12 June 2018 - 22:18
Правда на коленке сварганил и может чего-то намудрил...
Там ниже ещё 999 моделирований изменения финпотоков, вер-ти и столбец с движением линии фиксированы. Справа в углу под П1 и П2 убыток игроков (значит прибыль БК).
вер-ть + фин. потоки.png 48.04K 2 Количество загрузок
#84 OFFLINE
Добавлено 13 June 2018 - 06:01
Bambuk, on 12 June 2018 - 21:59, сказал:
СВ составлена совокупность а раздербанить её при условии что в качестве свидетельства дан тока кефф . Ну вы ж сами понимаете что это невозможно... а то что вы предлагаете мы уже обсуждали тут на форуме...что надо брать окна там чего-то считать потом плясать с бубном итд итп....
Это всё сделать не проблема...а что потом-то? ну вот допустим я даже вам сказал что да там смесь и что далее? даже если я знаю с какой частотой я генерил то я один хрен не могу сказать не подсмотрев в формулу для ячейки из чего что произросло...а тогда как мы будем решение принимать по взятию сих и отвержению этих?
Вот как, с вашей точки зрения, должен игрок действовать(что берём-с а что в мусорную корзину)?
Мы только что обсуждали МО и дисперсию. От вас так ничего и не сказано по поводу того, согласны вы или нет, что нужно ориентироваться на биномиальное распределение и вычислять МО и дисперсию соответствующим образом - или нет. Это - принципиально, так как только последовательно принимая верность того или иного положения мы можем продвигаться вперед, а не топтаться на месте.
Ну, предположим, что вы согласились с биномиальным законом со всеми вытекающими.
Следующее, что нужно четко уяснить - мы имеем дело с ПОСЛЕДОВАТЕЛЬНОСТЬЮ независимых испытаний. Это означает, что кучу нужно рассматривать последовательно, и начально взятую последовательность не перетасовывать (нельзя вместо 101010 брать например 111000 - это разные последовательности, подчиняющиеся разным законам).
Далее. Есть определенные различия между реальной кучей и сгенерированной. Это очень большой и тонкий вопрос. Скажу только, что сгенерировать кучу из двух распределений (например с вероятностями 0.3 и 0.7) - задача не такая простая, как может показаться.
Следующее. Свойства статистического анализа таковы, что далеко не всегда можно однозначно давать точные ответы на конкретные вопросы. Даже скорее - никогда. Любой ответ здесь имеет вероятностный характер. Применительно к последнему вашему вопросу (что в дело, а что в мусорную корзину?) это означает, что взяв когкретный исход, мы с определенной вероятностью можем сказать, в дело или в корзину.
Ну и теперь о самой схеме разделения. Сперва замечание. 1) как я уже говорил - я не верю в то, что вы сможете найти кучу (достаточно большую), которая бы состояла из двух разных (мы это обсуждали, когда речь шла о нахождении каких-то критериев для такого разделения). И моя вера базируется на множесте анализов гистограмм распределений вероятностей для самых разных интервалов коэффициентов. Тем не менее - моя вера или не вера - это не постулат.
Схема разделения кучи достаточно проста. Но она применима только в том случае, если мы точно убедились в том, что это неоднородная куча (неоднородная выборка).
Простейший способ определения однородности выборки - сравнение гистограммы с теоретическим распределением (так вот, для любого кэфа - мы получим однозначный результат сравнения - выборка однородна, на этом и базируется моя вера).
Дальше - лучше на примере.
Имеем выборку из N исходов.
ПОСЛЕДОВАТЕЛЬНО разбиваем ее на интервалы по n значений и определяем частоты, среднее, дисперсию так , как я написал в предыдущем посте. Допусти, таких интервалов оказалось m. (для ваших 1000 значений взяли интервалы по 25 значений, всего 40 интервалов)
Строим гистограмму. Назовем эту гистограмму БАЗОВАЯ - она не будет никак меняться для заданных n и N.
Допустим, что определили - выборка неоднородная. И положим (для примера!!!), что состоит она из двух куч одинаковой величины (500 штук и 500 штук)
Тогда берем все возможные сочетания интервалов по m/2 штук из n штук, в пример - по 20 из 40 (вот и вычислительная проблема!!! потому, что 1000 элементов - это на самом деле мало).
Для каждого сочетания строим отдельно две гистограммы - для тех, кого перевели в 1-ю кучу и для тех, кого во 2-ю. Затем эти диаграммы складываем и сравниваем с БАЗОВОй. Когда попадется наилучшее совпадение (в смысле критерия кси-квадрат) - то оно и будет для НАИЛУЧШЕГО разделения куч.
Тем самым мы определим пока не какой исход в какой куче, а КАКОЙ ИНТЕРВАЛ ИСХОДОВ (в примере - какой из каждых 40 интервалов значений в какой куче).
Определить же какой не интервал, а конкретный исход в какой куче - можно только с некоторой вероятностью.
Где-то так...
И все же, хотелось бы периодически фиксировать те моменты согласия, к которым мы приходим, что бы не толочься на месте (я о среднем и дисперсии в частности)
#85 OFFLINE
Добавлено 13 June 2018 - 06:34
sergei-777, on 12 June 2018 - 22:18, сказал:
Ну так:
Дипломат, on 12 June 2018 - 19:06, сказал:
#86 OFFLINE
Добавлено 13 June 2018 - 07:48
допустим для примера
выборка большого объёма 11010100011010001101011001
шоб много не писать возьмём 6 окно
тогда поехали его двигать
110101
..101010
....101000
у нас генерация исходов независима поэтому какая нам хрен разница ставим мы окна степ-бай-степ или тупо двигаем? С оной стороны может показаться что между средними в соседних окнах будет корреляция (ибо допустим понятно что если выпало 0001... то окна 000 и 001 завязаны на кусок последовательности в окне 00...)
но дело в том что чем дальше мы от зафиксированного окна тем меньше влияние.... тогда можно рассуждать и так---6 человек начали свой анализ с разных
начальных точек (пример в начале) первый берёт окна 1,7,13 ...итд второй чел 2, 8,14 и так далее эти окна стоят степ бай степ. а потом они просто данный сливают вместе вот и всё...
тогда просто делать ни чё ни надо так как я могу посмотреть распределения от окна =1 до 50 кусок можно взять около 1200 (ну просто у меня там уже вбито
под такой примерно размер "колбасы"..)
теперь вот я вам показываю для окна 12 частоты (умноженные на размер окна) по генерации с Р1=0.7 и Р2=0.3 Р=0.5
0,038834951 0,067961165 0,242718447 0,601941748 1,650485437 2,126213592 2,631067961 2,223300971 1,485436893 0,718446602 0,194174757 0,019417476 0
это бином расп с Р=0.5
0,002929688 0,03515625 0,193359375 0,64453125 1,450195313 2,3203125 2,70703125 2,3203125 1,450195313 0,64453125 0,193359375 0,03515625 0,002929688
это бином расп с Р=0.4
0,026121388 0,208971104 0,766227382 1,702727516 2,554091274 2,724364026 2,118949798 1,210828456 0,504511857 0,149484995 0,029896999 0,003623879 0,000201327
при этом принимаются и гипотеза для Р=0.5 и для Р=0.4 по критерию кси_квадрат ( в екселе правда там есть проблема связанная с тем что функция считает для другого числа степеней свободы и поэтому появляется вероятность большая принять нулевую гипотезу при её несостоятельности--т.е допустить ошибку 2-го рода)
разумеется что значение критерия для Р=0.5 выше чем для Р=0.4
Отредактировано Bambuk, 13 June 2018 - 07:51.
#87 OFFLINE
Добавлено 13 June 2018 - 07:52
Attached File(s)
#88 OFFLINE
Добавлено 13 June 2018 - 08:00
Bambuk, on 13 June 2018 - 07:48, сказал:
допустим для примера
выборка большого объёма 11010100011010001101011001
шоб много не писать возьмём 6 окно
тогда поехали его двигать
110101
..101010
....101000
у нас генерация исходов независима поэтому какая нам хрен разница ставим мы окна степ-бай-степ или тупо двигаем? С оной стороны может показаться что между средними в соседних окнах будет корреляция (ибо допустим понятно что если выпало 0001... то окна 000 и 001 завязаны на кусок последовательности в окне 00...)
но дело в том что чем дальше мы от зафиксированного окна тем меньше влияние.... тогда можно рассуждать и так---6 человек начали свой анализ с разных
начальных точек (пример в начале) первый берёт окна 1,7,13 ...итд второй чел 2, 8,14 и так далее эти окна стоят степ бай степ. а потом они просто данный сливают вместе вот и всё...
тогда просто делать ни чё ни надо так как я могу посмотреть распределения от окна =1 до 50 кусок можно взять около 1200 (ну просто у меня там уже вбито
под такой примерно размер "колбасы"..)
теперь вот я вам показываю для окна 12 частоты (умноженные на размер окна) по генерации с Р1=0.7 и Р2=0.3 Р=0.5
0,038834951 0,067961165 0,242718447 0,601941748 1,650485437 2,126213592 2,631067961 2,223300971 1,485436893 0,718446602 0,194174757 0,019417476 0
это бином расп с Р=0.5
0,002929688 0,03515625 0,193359375 0,64453125 1,450195313 2,3203125 2,70703125 2,3203125 1,450195313 0,64453125 0,193359375 0,03515625 0,002929688
это бином расп с Р=0.4
0,026121388 0,208971104 0,766227382 1,702727516 2,554091274 2,724364026 2,118949798 1,210828456 0,504511857 0,149484995 0,029896999 0,003623879 0,000201327
при этом принимаются и гипотеза для Р=0.5 и для Р=0.4 по критерию кси_квадрат ( в екселе правда там есть проблема связанная с тем что функция считает для другого числа степеней свободы и поэтому появляется вероятность большая принять нулевую гипотезу при её несостоятельности--т.е допустить ошибку 2-го рода)
разумеется что значение критерия для Р=0.5 выше чем для Р=0.4
Но, в принципе, если сильно хочется.... Но я не знаю, на сколько в этом случае можно доверять результату.
#89 OFFLINE
Добавлено 13 June 2018 - 08:17
Дипломат, on 13 June 2018 - 08:00, сказал:
Но, в принципе, если сильно хочется.... Но я не знаю, на сколько в этом случае можно доверять результату.
которая на порядок больше исходной 1239
При этом вот эта последовательность начальная под которую я делал всё она была на кефы около 1.54 и была взята из БД ...это всё частично обсуждалось в теме про Мазаньеллу и там я пояснял что при отрицательном МО на дист. маза может дать положительный эффект только если распределение в окнах (вот по этим 0..1..)
отличается от биномиального---тогда будут размеры окон и число винов для мазы когда на дистанции будет +++ ибо там частота выше чем по бином расп
и вычислитель делался именно для поиска этих параметров окон (размер, минимум винов).... проблема состоит не в этом а в том что нет гарантии что у последовательности в будущем будут точно такие же свойства (и как следствие я рекомендовал мазу без наличия хоть небольшого перевеса над БК не использовать бездумно и повсеместно...)
#90 OFFLINE
Добавлено 13 June 2018 - 08:44
1) Можно вывалить кэфы 1.9/1.9, получить на них по 100р и спокойно поиметь 10р прибыли.
Но тут найдется сказочный инсайдер и вольет на к1 1000р. Контора вправе срочно подкорректироваь кэфы, пусть так: 1.3/3.0 - и считать, что теперь кэфы пропорциональны потокам (что естественно не так!!)
Но тут опять таки найдется некий совсем не инсайдер, а вероятнощник - и вольет 1000р на к2. Контора конечно же вправе выровнять кэфы по потокам и сделать 1.9/1.9. Только жопа уже реальная...
2) Можно вывалить 100, 1000 ... позиций в линии и плевать на финпотоки (если это позволяет запас финансов и если деньги этой самой БК нужны не сегодня, а нужны в принципе)
Я бы менял кэфы независимо ни от чего.... Просто от балды... Не сильно, конечно... Любое движение кэфов возбуждает попанов и увеличивает финпотоки, а значит - и прибыль....
Движение - это жизнь!
Bambuk, on 13 June 2018 - 08:17, сказал:
которая на порядок больше исходной 1239
При этом вот эта последовательность начальная под которую я делал всё она была на кефы около 1.54 и была взята из БД ...это всё частично обсуждалось в теме про Мазаньеллу и там я пояснял что при отрицательном МО на дист. маза может дать положительный эффект только если распределение в окнах (вот по этим 0..1..)
отличается от биномиального---тогда будут размеры окон и число винов для мазы когда на дистанции будет +++ ибо там частота выше чем по бином расп
и вычислитель делался именно для поиска этих параметров окон (размер, минимум винов).... проблема состоит не в этом а в том что нет гарантии что у последовательности в будущем будут точно такие же свойства (и как следствие я рекомендовал мазу без наличия хоть небольшого перевеса над БК не использовать бездумно и повсеместно...)
Ну так количество данных (0 и 1, или окон) непосредственно связано (определяет ее) с надежностью выводов...
Вероятность того, что будет нужная последовательность, зависит от объема данных - как исходных, так и прогнозируемых.
Здесь ничего не понятного нет.
Всё же может, как-то системнее давайте... Только что говорили о МО и дисперсии, потом о разбивке кучи, теперь - новый базар....
Так - не эффективно. Нужно фиксировать выясненные обстоятельства. (например, если вы по прежнему собираетесь вычислять так дисперсию, как делали, то мой текущий пост просто бессмыслен...)
#91 OFFLINE
Добавлено 13 June 2018 - 09:30
Дипломат, on 13 June 2018 - 08:44, сказал:
1) Можно вывалить кэфы 1.9/1.9, получить на них по 100р и спокойно поиметь 10р прибыли.
Но тут найдется сказочный инсайдер и вольет на к1 1000р. Контора вправе срочно подкорректироваь кэфы, пусть так: 1.3/3.0 - и считать, что теперь кэфы пропорциональны потокам (что естественно не так!!)
Но тут опять таки найдется некий совсем не инсайдер, а вероятнощник - и вольет 1000р на к2. Контора конечно же вправе выровнять кэфы по потокам и сделать 1.9/1.9. Только жопа уже реальная...
2) Можно вывалить 100, 1000 ... позиций в линии и плевать на финпотоки (если это позволяет запас финансов и если деньги этой самой БК нужны не сегодня, а нужны в принципе)
Я бы менял кэфы независимо ни от чего.... Просто от балды... Не сильно, конечно... Любое движение кэфов возбуждает попанов и увеличивает финпотоки, а значит - и прибыль....
Движение - это жизнь!
Не совсем понимаю, к чему вы это...
Ну так количество данных (0 и 1, или окон) непосредственно связано (определяет ее) с надежностью выводов...
Вероятность того, что будет нужная последовательность, зависит от объема данных - как исходных, так и прогнозируемых.
Здесь ничего не понятного нет.
Всё же может, как-то системнее давайте... Только что говорили о МО и дисперсии, потом о разбивке кучи, теперь - новый базар....
Так - не эффективно. Нужно фиксировать выясненные обстоятельства. (например, если вы по прежнему собираетесь вычислять так дисперсию, как делали, то мой текущий пост просто бессмыслен...)
на значение случайной величины и суммируем по всем частотам. у нас Бином расп при Р=0.5 и при числе испытаний 12 мо будет 12*0.5=6
а в сгенерированном Мо=5.9539 (в силу малого объёма данных). Я тут не вижу нестыковок тем более что гипотеза принята по критерию..чё тут обсуждать?
Мне разделение смеси абсолютно по колено... нам же для ставок надо просто принять решение--ставим или не ставим на данный кефф а коли кефы одинаковые то я уже в 3-ий раз спрашиваю---по каким свидетельствам вы собираетесь принимать решение (их же нет)? Из сказанного следует---надо искать другие свидетельства вот и всё и не заниматься выяснением того что всем очевидно---бк не определяет точно Р а в полосе кефоф например таких 1.48...1.52 там есть игры где реально можно для модели закладывать Р и более 1.52 и менее 1.48 (и считать что это истинная Р.
тогда способ принятия решения по взятию и отвержению ставки создаст подкучу общей начальной кучи и там должны доминировать перевесы (тогда в выборке мы увидим+++) при этом это совершенно не значит что там все пары и исходы с перевесом (там просто доминируют исходы где БК чаще ошибается в нужную нам сторону и мы оказались точнее.) Всё остальное это умственный онанизьм с моей точки зрения... оценка Р это по сути измерение а измерения даже если они очень точные всё равно имеют погрешности!!!! У меня есть допустим пара измерительных приборов...если мы мерить будем напряжение то цифровой бедет точнее а стрелочныеприборы имеют свои классы точности...чего тут обсуждать? Можно модель делать для оценок ВНП частот пары по ВНП данным а можно по голам, потом можно взять нейросетевую модель и подать туда кучу всякого разного и так далее. При этом может оказаться так что при выделении полос по Р в своей модели вы увидите отклонение от реальных частот экспериментальных данных не более 0.5% однако это не позволит вам переиграть БК.... (именно по той причине что мы тут исследуем--там могут быть смеси с разной реальной частотой и модель просто не различает эти пары и события).
#92 OFFLINE
Добавлено 13 June 2018 - 09:47
andre48, on 13 June 2018 - 07:52, сказал:
Что касается перевеса по payout больше 100% в начальных кофах или каких других, то в Пинке не бывает таких перекосов ...
Кофы в Пинке приводил примеры, часто ставят даже на глазок...так сказать на пробу (как правило, на форах и только потом расширяют роспись)
Как ставят кофы в Пинке, хорошо расписал Expari - все в точности так и происходит...(на смоллмаркетах или сомнительных для Пинки матчах....крупные рынки отшлифованны и не вызывают, видимо, уже проблем давным давно)....
Но это в Пинке, как формируют кофы в других конторах не представляю и не имею желания представлять...
Отредактировано opus, 13 June 2018 - 09:57.
#93 OFFLINE
Добавлено 13 June 2018 - 09:52
Bambuk, on 13 June 2018 - 09:30, сказал:
на значение случайной величины и суммируем по всем частотам. у нас Бином расп при Р=0.5 и при числе испытаний 12 мо будет 12*0.5=6
а в сгенерированном Мо=5.9539 (в силу малого объёма данных). Я тут не вижу нестыковок тем более что гипотеза принята по критерию..чё тут обсуждать?
А как быть с этим?
Дипломат, on 12 June 2018 - 21:17, сказал:
111000
и
101010
Каковы среднее и дисперсия в них?
Bambuk, on 12 June 2018 - 21:24, сказал:
По ссылке там про бином.расп. она тут с какого краю?
С чем мы имеем дело - давайте определимся. С биномиальным распределением или каким-то другим?
==============================================================
Bambuk, on 13 June 2018 - 09:30, сказал:
тогда способ принятия решения по взятию и отвержению ставки создаст подкучу общей начальной кучи и там должны доминировать перевесы (тогда в выборке мы увидим+++) при этом это совершенно не значит что там все пары и исходы с перевесом (там просто доминируют исходы где БК чаще ошибается в нужную нам сторону и мы оказались точнее.) Всё остальное это умственный онанизьм с моей точки зрения... оценка Р это по сути измерение а измерения даже если они очень точные всё равно имеют погрешности!!!! У меня есть допустим пара измерительных приборов...если мы мерить будем напряжение то цифровой бедет точнее а стрелочныеприборы имеют свои классы точности...чего тут обсуждать? Можно модель делать для оценок ВНП частот пары по ВНП данным а можно по голам, потом можно взять нейросетевую модель и подать туда кучу всякого разного и так далее. При этом может оказаться так что при выделении полос по Р в своей модели вы увидите отклонение от реальных частот экспериментальных данных не более 0.5% однако это не позволит вам переиграть БК.... (именно по той причине что мы тут исследуем--там могут быть смеси с разной реальной частотой и модель просто не различает эти пары и события).
Напомню, с чего все началось.
Началось с того, что нужно найти критерии, по которым можно относить исход в кучу А или кучу Б
Вы даже некое уравнение регрессии приводили, предлагали кластеризацию....
А я утверждаю, что БК уже все учло, значимых критериев не осталось.
Подтверждением этого является однородность распределения, БИНОМИАЛЬНОГО распределения.
Если бы такие критерии еще остались - тогда распределения на отдельные кэфы (лиги, виды спорта....) были бы неоднородными.
А неоднородные можно разделить тупо математически.
Тут вы начали много говорить о том, что разделить неоднородные математически неовозможно, провели некое моделирование.
Я вам в ответ привел схему разделения. Простую, но трудо- и времяемкую.
В ответ, ничего не говоря о предложенной схеме, вы поднимаете вопрос о том (не как разделить уже сбывшиеся исходы) как разделить будущие исходы.
Ну нормально это?
Давайте вы сперва:
1) четко скажете о вычислении дисперсии, среднего, о применимости биномиального распределения
2) о возможности математически разделить неоднородной выборки
3) попробуете корректно сгенерировать неоднородную выборку.
А потом я выскажусь о том, как разделять БУДУЩИЕ исходы, если удалось разделить ПРОШЛЫЕ исходы.
Отредактировано Дипломат, 13 June 2018 - 09:53.
#94 OFFLINE
Добавлено 13 June 2018 - 10:15
Надеюсь понятно, что МО одинаковые, а дисперсии разные.
И надеючь понятно станет как именно можно разделить первую выборку.
(Гистограммы - теоретические, получены для биномиальных законов)
(зы. в подписЯх ошибки-опечатки, увы... Но они ясны)
Attached File(s)
#95 OFFLINE
Добавлено 13 June 2018 - 10:28
Цитата
А я утверждаю, что БК уже все учло, значимых критериев не осталось.
Подтверждением этого является однородность распределения, БИНОМИАЛЬНОГО распределения.
Если бы такие критерии еще остались - тогда распределения на отдельные кэфы (лиги, виды спорта....) были бы неоднородными.
А неоднородные можно разделить тупо математически.
Тут вы начали много говорить о том, что разделить неоднородные математически неовозможно, провели некое моделирование.
Я вам в ответ привел схему разделения. Простую, но трудо- и времяемкую.
В ответ, ничего не говоря о предложенной схеме, вы поднимаете вопрос о том (не как разделить уже сбывшиеся исходы) как разделить будущие исходы.
Ну нормально это?
Давайте вы сперва:
1) четко скажете о вычислении дисперсии, среднего, о применимости биномиального распределения
2) о возможности математически разделить неоднородной выборки
3) попробуете корректно сгенерировать неоднородную выборку.
выборку можно разделить по разному--например выдвигая гипотезы о том или сём. можно допустим выдвинуть гипотезу что там смесь двух распределений а можно выдвинуть что трёх............... или одного и так далее. Потом вы просто фактически относите то или сё к определённому распределению с таким-то параметром а параметры в распределения можно подбирать допустим по максимуму правдоподобия и так далеее...да нах это нам надо я понять не могу ни как.
СМЕСЬ СГЕНЕРИРОВАНА КОРРЕКТНО с точки зрения метода Моте-Карло (и абсолютно случайно что приблизило её к реальному положению дел...как она сформирована уже писал...генерим три столбца с Р1 с Р2 и с Р потом по формуле формируем рез "1" или "0" получим смесь с пропорциями определяемыми Р)
Что бы показать вам на реалове что вы имеете свойство--заблуждаться приведу некоторые данные.
берём БД, выделяем узкую полосу (пусть в ущерб объёму но для близости к фиксированному кефу)
1.68...1.72 смотрим какова средняя оценка конторы по частоте (делаем через 1/Кбк --находим там среднее=частоте БК и смотрим обратную величину этой средней Р --это и есть средний кефф конторы на полосу.)
это по конторе данные
0,587602344
1,701831196
теперь смотрим реально по экспериментальным данным частоту(кефф)
0,582089552
1,717948718
на сами данные--то что расход внимание не обращаем сильно так как там объём выборки не очень большой (335 пар..ну просто если шире полосу сделаем там конечно ближе будет к частоте эксперимента но потеряем факт что кефф фиксированный у нас по идее надо).
далее...у меня в этой базе есть маленькая нейросеть для экспериментов и для этой полосы она обучена для П1 (кефы вообще на П1 по бет365)
обучена она для диапазона 1.6...1.8 ну в целом около 1.7...
там данные по вероятности такие (сеть даёт оценку Р на исход П1)
0,5759341
-1,057475206 % --это отклонение в % от реальной экспериментальной частоты
1,736309763
теперь если вы говорите что контора всё учла до что бы мы не делали с нашими оценками они не должны изменять состав выборки и следовательно мы не можем выделить подкучи с другими свойствами (частоты, мо чего-то там итд) и переиграть БК не сможем!!!!
я делаю элементарную вещь---- накладываю ограничение на свою оценку Р и беру выше 0.57 например
тогда имеем
по модели
0,610147 -0,36126
1,638948
Экспериментальная
0,612359551
1,633027523
конторы (по 1/К)
0,587582 1,70189
НЕТ ИЗМЕНЕНИЯ А В РЕАЛОВЕ ЕСТЬ!!!
ВАША ТЕОРИЯ НЕ ПОДТВЕРЖДАЕТСЯ ЭКСПЕРИМЕНТАЛЬНЫМИ ДАННЫМИ
Дипломат, on 13 June 2018 - 10:15, сказал:
Надеюсь понятно, что МО одинаковые, а дисперсии разные.
И надеючь понятно станет как именно можно разделить первую выборку.
(Гистограммы - теоретические, получены для биномиальных законов)
(зы. в подписЯх ошибки-опечатки, увы... Но они ясны)
#96 OFFLINE
Добавлено 13 June 2018 - 10:50
andre48, on 13 June 2018 - 07:52, сказал:
Всё чётко расписано. Видно, что человек делает реальные ставки, в отличие от словоблудов. Дальнейшие споры теоретиков можно выпилить, от них пользы на копейку
#97 OFFLINE
Добавлено 13 June 2018 - 10:53
что допустим 40 испытаний в теории если по отдельности брать у Р=0.7 и у Р=0.3 может выпасть 35 винов и 15 винов а в сумме это не 40 ка вы понимаете
там другое распределение нужно для последовательности 1010011...итд что мы обсуждаем.
#98 OFFLINE
Добавлено 13 June 2018 - 10:59
Bambuk, on 13 June 2018 - 10:28, сказал:
выборку можно разделить по разному--например выдвигая гипотезы о том или сём. можно допустим выдвинуть гипотезу что там смесь двух распределений а можно выдвинуть что трёх............... или одного и так далее. Потом вы просто фактически относите то или сё к определённому распределению с таким-то параметром а параметры в распределения можно подбирать допустим по максимуму правдоподобия и так далеее...да нах это нам надо я понять не могу ни как.
СМЕСЬ СГЕНЕРИРОВАНА КОРРЕКТНО с точки зрения метода Моте-Карло (и абсолютно случайно что приблизило её к реальному положению дел...как она сформирована уже писал...генерим три столбца с Р1 с Р2 и с Р потом по формуле формируем рез "1" или "0" получим смесь с пропорциями определяемыми Р)
Так я и не отрицаю, что именно так и нужно делать (через выдвижение гипотез о - равестве В ТОМ ЧИСЛЕ ДИСПЕРСИЙ).
О корректности я говорил именно: надо проверять корректность. То, что с точки зрения Монте-Карло - это замечательно.
Но, если вы не получите соответствующий вид распределения (например в виде гистограмм) - то это будет говорить о некорректности.
Если получите - значит можно говорить о корректности.
Bambuk, on 13 June 2018 - 10:28, сказал:
Какая теория? Я никакой теории не выдвигал. Я лишь утверждаю, что выборки однородны и основные значимые факторы буки учли.
Что вы сделали со своим Р - не понял совершенно.
Если опровергли мое утверждение, то совсем не обязательно кричать об этом крупным красным тексом. Я ведь тоже так могу озвучить (например ваш способ расчета дисперсии)
Bambuk, on 13 June 2018 - 10:28, сказал:
А вы знаете как я смешал????
Пипец! Это даже не смесь!!!!! Это теоретические гистограммы - вы читайте внимательно!!!!
Не, Бамбук, так не пойдет....
Пока вы не примете условие пошагового движения к истине, а будете расписывать огромные посты сомнительного содержания, у нас ничего не получится....
Bambuk, on 13 June 2018 - 10:53, сказал:
что допустим 40 испытаний в теории если по отдельности брать у Р=0.7 и у Р=0.3 может выпасть 35 винов и 15 винов а в сумме это не 40 ка вы понимаете
там другое распределение нужно для последовательности 1010011...итд что мы обсуждаем.
#99 OFFLINE
Добавлено 13 June 2018 - 11:11
Bambuk, on 13 June 2018 - 10:28, сказал:
И в каждой книжке написано: любая случайная величина определяется законом распределения вероятностей ее значений.
Сам закон может быть представлен по разному:
- в виде полного перечисления всех значений СВ и соответствующих вероятностей
- в виде ряда распределения
- в виде гистограмм распределения
- в виде графиков (дифференциального или интегрального)
- в виде формул
.........
Если речь идет не о теории, а о вычислениях (анализе данных, то есть не о тервере, а о матстатистике), то все перечисленные способы возможны, кроме "в виде формул".
Пожалуйста, покажите в виде графиков или в виде ряда распределения - что вы получили,
#100 OFFLINE
Добавлено 13 June 2018 - 11:21
0,4932-мо
0,249978758--дисп.
Р1=0.7 Р2=0.3 Р=0.5
0,4953
0,25000291
поменям Р=0.3 (генерим с другими пропорциями)
для Р*=0.42
0,4264
0,244607501
Р1=0.7 Р2=0.3 р=0.3
0,4216
0,243877828
распределения по МО и дисп неразличимы. (для генерации брал 10000 точек лучше 50000 конечно для монте-карло но можно считать --всё совпадает)
Отредактировано Bambuk, 13 June 2018 - 11:22.