Цитата(pruss @ 30.06.2022 - 14:01)
Собственно, цель была простая...
Мдаа…
Полагаю, судебной медицине и физической антропологии, кроме систематик Бунака и Галанта, предложить Вам нечего. СМЭ (и антропология) анализирует совершившийся ФАКТ, а Вам приходится анализировать динамический ПРОЦЕСС. Процесс (походка) всегда пролонгирован во времени и подвержен влиянию множества случайных факторов, которые трудно учесть. Поясню. Походка «злодея», крадущегося к месту преступления, скорее всего, будет отличаться от походки того же самого «злодея», скрывающегося с места преступления. Или. Походка добропорядочного семьянина будет существенно отличаться от походки этого же самого добропорядочного семьянина «принявшего» бутылку коньяка. И т.п. Тут Вам без собственных исследований не обойтись.
Я, так, грешным делом, попытался представить, как бы поступил в Вашем положении. Получилось вот что. Сначала разделил бы всю популяцию на классы по шкалам Бунака и Галанта. Потом каждый класс разделил бы на подклассы по динамике процесса (шаг - прогулочный, нормальный, ускоренный, быстрый, бег). Потом каждый подкласс разделил бы на подподклассы по ракурсу съёмки (ракурс - спереди, ¾, сзади). Потом в каждом подподклассе, создал бы наборы ключевых (наиболее характерных) кинематических схем с узлами в шейном, поясничном, тазобедренном, коленном, голеностопном отделах (могут помочь спортивные медики). Потом… я вздрогнул и подумал: «Какое счастье, что я этим не занимаюсь!».
Пожалуйста, не рассматривайте сказанное как «совет», это просто частное мнение.
Цитата(pruss @ 30.06.2022 - 14:01)
Скажите, вероятность р = 0.ХХ откуда берется?
Исхожу из того, что Вам известен принцип работы нейросетей, поэтому, далее – «на пальцах»:
Наша методология кранио-портретной идентификации основана на двух математических моделях пары объектов «голова/череп». Мат. модели разной степени сложности. Каждая мат. модель содержит не одну (как обычно), а 100 многослойных нейронных сетей прямого распространения (в простонародье именуемых Multilayer Perceptron). Каждая сеть в наборе уникальна: отличается от всех прочих количеством входов и/или количеством слоёв. Каждый нейрон в каждой сети отличается от прочих весовыми коэффициентами синапсов и/или передаточной функцией аксона и/или функцией активации нейрона, др. Вероятность того, что в наборе окажутся 2 сети с одинаковыми характеристиками менее 1 * 10 ^ –32 степени. Каждая сеть обучена классификации пар объектов по выборкам большого объёма (200 случаев в классе заведомо и точно идентичных пар; 600 случаев в классе заведомо и точно неидентичных пар). Реакция сетей на параметры мат. модели пары объектов из генеральной совокупности (никогда не входивших в обучающую выборку) бинарна: «Пара идентична» / «Пара неидентична». Как видим из сказанного, «мнения» сетей квалифицированы (сети специально обучены), индивидуальны (сети уникальны по характеристикам), не коррелированны (между собой сети не взаимодействуют). Поэтому, для оценки вероятности правильной классификации пары объектов применим коэффициент конкордации (согласия) Кендалла. В нашем случае (2 класса, 100 независимых оценок) коэффициент вырождается в простейшую формулу: p = Nmax / 100, где Nmax – максимальное количество отнесений пары объектов к соответствующему классу. Другими словами: если 98 сетей «решили», что пара идентична, а 2 сети «сочли», что пара неидентична, то пара идентична, p = 98/100 = 0.98. Или, наоборот, если 92 сети «решили», что пара неидентична, а 8 сетей «сочли», что пара идентична, то пара неидентична, p = 92/100 = 0.92.
Простите многословие: вопрос не простой, хотелось быть предельно понятным. Надеюсь, удалось.
С уважением, ws_K.