Теперь в общих чертах суть самой идеи.
Предметом обсуждения будет не форма лошади в комплексе а лишь компонента---в виде циферек последних забегов лошади
типа 99911 или 222-21 итд. Совершенно очевидно что адекватно трансформировать в мозгах наборы которые могут быть весьма разнообразны и число их достаточно велико в какую-то одну внятную цифру которую можно было бы присовокупить к прочим показателям достаточно сложно особенно начинающим.
пока сырой начальный алгоритм состоит в следующем---берём и разделяем номер на компоненты и рассматриваем каждую как некую переменную
Х1 Х2 Х3 .....(при этом последние забеги у нас правее...и формально идём как китайцы...)
так как в коде (будем его так условно называть) могут быть прочерк и косая черта и буквы то надо тогда их заменить на более менее адекватные в смысле разумности такой замены (чисто интуитивно) цифры. Так как представление данных на таймфоре и например расингпост разное то рациональнее выбрать универсальный механизм и остановиться на 5-значном коде, тогда если данные с таймфора то просто первую цифру слева можно убрать).
добавим к 5-тизначному коду одну клетку слева (формально последний самый забег).
тогда если пробел 999-11 то на его место пишем среднее (9+9+9+1+1)/5 если черта то пишем среднее +1 если нет ни чего то среднее пишем в дополнительную клетку.
Теперь с буквами---можно например писать среднее+1 (или ещё больше это надо обсудить можно и +1.5 писать тут это пофигу лишь бы интуитивно адекватно)
теперь у нас получается такая фигня ---если не парится особо а допустим закодировать OUT Y вхождение в призовые 1 а не вхождение 0
то можно построить (попробовать сначала построить) множественную регрессию вида Y=c1*X1+c2*X2+.....+c6X6
тогда мы получим возможно некие цифры которые можно использовать дальше.
Предполагаем что будем разделять лошадей на три группы например так по классам 1-2 3-4 5-6 и в каждой группе строить свою зависимость.
Отредактировано Bambuk, 14 June 2015 - 13:21.