Нужно ли высчитывать коэфициент Стьюдента



Форум судебных медиков России > Судебная медицина и судебно-медицинская экспертиза > Судебно-медицинская криминалистика
RektoR85
Ранее написал тему расчет роста по программам просчитывающие рост по постям. Благодарен за с сылки всем кто их дал. Но Я написал свою прогу по этой теме и хотел узнать мнение нужно ли проводить расчет коэфициента Стьюдента в конце, т.е. на практике он нужен.


ws_K
Цитата(RektoR85 @ 25.04.2012 - 19:29)
Ранее написал тему расчет роста по программам просчитывающие рост по постям. Благодарен за с сылки всем кто их дал. Но Я написал свою прогу по этой теме и хотел узнать мнение нужно ли проводить расчет коэфициента Стьюдента в конце, т.е. на практике он нужен.


Та, ну, не нужно высчитывать. В конце концов, этот коэффициент даже самому Стьюденту, на практике, не нужен.

С уважением, ws_K.


эдвард
Цитата(ws_K @ 27.04.2012 - 20:52)
Та, ну, не нужно высчитывать. В конце концов, этот коэффициент даже самому Стьюденту, на практике, не нужен.

Самое смешное, что как раз сам автор данного критерия (Госсет) был сотрудником пивоваренной компании и придумал свой t-критерий именно для практического использования в целях повышения качества пива. Начальник Госсета заставил его опубликовать свои данные под псевдонимом Стьюдент. Именно это имя и вошло в историю.


FILIN
эдвард
Знание истории науки, разумеется, необходимо.
Но это все же форум практиков.
И первоначально следует высказаться по теме, а потом высказывайтесь о чем угодно.

( Извиняюсь за невольную реминисценцию из Дали:"Сначала докажите, что умеете хорошо рисовать, а потом уже рисуйте как угодно").


ws_K


alx71
Цитата(ws_K @ 29.04.2012 - 05:57)
знание выборочного коэффициента корреляции r

Применительно к данному случаю - между какими выборками должен быть известен коэффициент корреляции?


FILIN
ws_K
Если обстоятельства, тзложенные Вами ( о вычислении роста по нескольким методикам) верны, то действует старое правило - берется интервал между наименьшей и наибольшей длиной, вычисленными по всем методикам. Т.е. нижней границей длины считается наименьшая величина из всех методик, а верхней - наибольшая.

Что касается постинга эдварда, думается, это реакция на Ваше выражение: "На практике он вообще не нужен". К обсуждаемому вопросу отношеия не имеет.


ws_K
Цитата(alx71 @ 29.04.2012 - 06:15)
Применительно к данному случаю - между какими выборками должен быть известен коэффициент корреляции?


Уважаемый alx71.
Речь идет о корреляции между целевой функцией (S - ростом) и параметрами (размерами кости), по которым рост вычисляется.
Например, Найнис использует в качестве параметра F - наибольшую длину бедренной кости, и вычисляет рост мужчин с помощью линейного уравнения:
S = 2.297 * F + 64.63
Численные коэффициенты Найнис получил средствами корреляционного анализа из измерений наибольшей длины нескольких десятков бедренных костей. Кроме наиболее вероятной величины роста (S), Найнис нашел и границы доверительного интервала, в котором S может находиться при использовании его формулы:
±8.85
Наверняка он нашел и еще один коэффициент, который непосредственного отношения к вычисленному значению S не имеет, но характеризует методику в целом:
выборочный коэффициент корреляции R, определяющий СИЛУ СВЯЗИ (зависимости) между F в его (Найниса) выборке бедренных костей и целевой функцией – ростом S.

Точно так же поступил и Пирсон задолго до Найниса. Но, поскольку и кости он измерял другие, и объем его выборки был другим – численные коэффициенты в его уравнении, также другие, и при том же значении F, рост может несколько отличаться от роста, вычисленного по формуле Найниса. Пирсон не определил (или не опубликовал) границы доверительного интервала для своего уравнения. Оба автора методик не опубликовали значения своих коэффициентов R, полученные по их выборкам.

Если бы они опубликовали свои значения R, мы с Вами имели бы возможность усреднить вычисленные значения роста, полученные по разным (двум или более) методикам, применив формулу:

Ss = (Sн * Rн + Sп * Rп) / (Rн + Rп)

Здесь: н – значения S и R методики Найниса
п – значения S и R методики Пирсона.
Такое усреднение, корректное с точки зрения математической статистики, никого бы не вводило в заблуждения, поскольку учитывало бы особенности каждой методики.

Несколько сложнее вычислить границы доверительного интервала при усреднении по нескольким методикам. Однако, для этого необходимы сведения о распределении значений параметров в каждой выборке. Эти данные авторы методик, обычно, вообще никогда не публикуют. А жаль. Беда медиков-криминалистов в том, что они не владеют полной информацией о методиках, которые используют на практике.

С уважением, ws_K.


Цитата(FILIN @ 29.04.2012 - 11:24)
...действует старое правило - берется интервал между наименьшей и наибольшей длиной, вычисленными по всем методикам.

Уважаемый FILIN.

Да, это самое разумное, но "лобовое" решение. На практике, эксперты, стремящиеся к категоричности, применяют "эвристику" - попросту исключают из рассмотрения результаты по тем методикам, которые дают наибольший "разлет" (т.е., не ссылаются на них в тексте Заключения). В конце концов, никто не обязывает эксперта применять ВСЕ известные методики.

Лично мне представляется более логичным другой подход: раз уж мы не имеем возможности вычислить среднее по нескольким методикам (недостаточно данных), давайте вычислим другую статистику – моду. Среднее характеризует наиболее вероятное значение, мода – наиболее часто встречающееся значение.
Чтобы лучше понять, как это можно сделать, обратимся к данным RectoR85:

S1 = 153.492
S2 = 153.6
S3 = 156
S4 = 154
S5 = 156
S6 = 157.104
S7 = 158.725

По этим данным, руководствуясь "старым" правилом, мы должны были бы указать, что рост лежит в диапазоне 153.5 – 158.73 см.

Разобьем этот диапазон на пять интервалов, и посмотрим, к какому из интервалов относит рост наибольшее количество рассматриваемых методик:

153.492 - 154.538 : 1, 2, 4
154.539 - 155.585 : -
155.586 - 156.632 : 3, 5
156.633 - 157.678 : 6
157.679 - 158.725 : 7

Три (из семи) методик отнесли рост к первому интервалу и, следовательно, мода лежит именно в этом диапазоне (точное значение моды совпадает с центром интервала, но нам знать его не обязательно). Теперь, применяя "старое" правило к 1, 2 и 4 методикам, мы могли бы сформулировать результирующую фразу, например, так:
"Длина тела, определенная по методикам Пирсона, Мануврие и Ролле, лежит в диапазоне от 153.5 до 154.0 см".

С уважением, ws_K.




FILIN
ws_K.
Цитата
"Длина тела, определенная по методикам Пирсона, Мануврие и Ролле, лежит в диапазоне от 153.5 до 154.0 см".

Да за такой ответ угрозыск эксперту пластиковый мешок на голову наденет.
И в суде их оправдают.


ws_K
Цитата(FILIN @ 30.04.2012 - 16:02)
Да за такой ответ угрозыск эксперту пластиковый мешок на голову наденет. И в суде их оправдают.


Уважаемый FILIN.

Ничего. Зато эксперт помрет с осознанием того, что "пострадал за правду". Это будет не первым случаем в Мировой истории – первопроходцем был, как известно, Джордано Бруно и, как это не смешно, он оказался прав в своих "экспертных выводах".

Все-таки Ваш оптимизм мне представляется чрезмерным: времена Великой инквизиции, вроде бы, закончились (правда, и эпоха Просвещения в подразделениях Минюста, пока еще, не наступила). Ерничаю, конечно.

И все же (простите любопытство): как бы Вы проинтерпретировали результаты, представленные RectoR85, в своем собственном Заключении эксперта, опираясь на собственное чувство самосохранения?

С уважением, ws_K.


alx71
Цитата(ws_K @ 30.04.2012 - 15:05)
Речь идет о корреляции между целевой функцией (S - ростом) и параметрами (размерами кости), по которым рост вычисляется.
Например, Найнис использует в качестве параметра F - наибольшую длину бедренной кости, и вычисляет рост мужчин с помощью линейного уравнения:
S = 2.297 * F + 64.63

Уважаемый ws_K, коэффициент корреляции между S и F равен 1.


Evik
Цитата(ws_K @ 30.04.2012 - 22:44)
...первопроходцем был, как известно, Джордано Бруно и, как это не смешно, он оказался прав в своих "экспертных выводах"...

Очень не люблю, когда говорят (или делают), то, чего не ведают. Первопроходцем чего был Ваш Дж.Бруно? Какие такие "выводы" он сделал, в которых "оказался прав"? Прежде чем писать, поинтересуйтесь, как оно на самом деле было.


ws_K
Цитата(alx71 @ 1.05.2012 - 08:26)
...коэффициент корреляции между S и F равен 1.

Уважаемый alx71.

Ах, если бы…
Коэффициент корреляции между S и F СТРЕМИТСЯ к 1, но практически никогда 1 не достигает. Чем ближе он к единице, тем сильнее зависимость целевой функции от измеряемых параметров и тем линейнее сама зависимость. Если r = ±1, это означает, что связь жесткая, никакого разброса в значениях F нет, а доверительного интервала для S просто не существует.

Чтобы не быть голословным, приведу фрагмент из методички В. И. Прозоровского от 25.12.1958 г. "Об определении роста по костям скелета взрослого человека". Методичка содержит, в числе прочего, ИСХОДНЫЕ данные Мануврие (редчайший случай в СМ-науке!), вполне пригодные для обработки методами математической статистики. Что мы и сделали.

В прикрепленном файле содержится и сама таблица Мануврие, и результаты нашей математической обработки. Так что, Вы вполне можете перепроверить наши выводы.

Нажмите для просмотра прикрепленного файла

Дабы избежать возможных недоразумений, поясню: на диаграммах приведен не сам коэффициент r, а его квадрат. Дело в том, что r изменяется в диапазоне от -1 до +1, а это неудобно. Возведение в квадрат переводит его в область положительных чисел от 0 до +1.
Тогда его нулевое значение означает полное отсутствие зависимости целевой функции от параметров, 1 – очень жесткую связь. Суть коэффициента корреляции от возведения его в квадрат не меняется.

С уважением, ws_K.



ws_K
Цитата(Evik @ 1.05.2012 - 09:46)
Очень не люблю, когда говорят (или делают), то, чего не ведают. Первопроходцем чего был Ваш Дж.Бруно? Какие такие "выводы" он сделал, в которых "оказался прав"?


Уважаемый(ая) Evik.

Любовь и Ненависть, очень сильные чувства, особенно в условиях полной атрофии чувства юмора. Может быть, нам с Вами следовало бы поговорить об этих чувствах где-нибудь в "Курилке"? Или вообще интимно – в личной переписке?

Но, коль уж вопрос задан: Дж.Бруно был первопроходцем костра. Выводы, которые он сделал из учения Коперника, изменили представление человечества об устройстве Мира. Впрочем, возможно Вы придерживаетесь Геоцентрической теории, полагая, что Солнце и звезды вращаются вокруг Земли? В таком случае Дж.Бруно, безусловно, неправ.

С уважением, ws_K.



FILIN
ws_K
1. Выводы, которые я бы сделал, я уже озвучил. Не только "сделал бы", а неоднократно делал.

2. Моё отношение к широкому использованию математической статистике в биологии (медицина - частный случай биологии) довольно подозрительное. Это на уровне интуиции, никаких веских аргументов привести не могу.

3. О Дж.Бруно - осужден он был не за признание гелиоцентрической теории, а за создание пантеистической теории. Согласно христианской теологии Бог отсутствует в Мире, согласно пантеистической теории - Бог присутствует в каждой частице Мира. Это ересь с точки зрения церковного права ( в отличии от гелиоцентрической теории, которая ересью не является). Как не раскаявшийся еретик, он и был предан смерти.
Никакого нового видения мира он не предложил, и мир ознакомившись с его учением, не изменился.
(Это был второй "мученик философии" по слову Карла Ясперса).


alx71
Цитата(ws_K @ 30.04.2012 - 15:05)

S = 2.297 * F + 64.63

Откуда?


Evik
Цитата(ws_K @ 1.05.2012 - 11:31)
...Дж.Бруно был первопроходцем костра...

До него тоже сжигали. Не был он первопроходцем костра. И сожгли его не за теории Коперника, а за ересь, которую он распространял в своих писаниях, так как по профессии был журналистом. Психически ненормальный человек, весьма поверхностных знаний. Мне он напоминает другую "истерическую личность" - лейтенанта П.Шмидта. Еще один "герой" истории.


FILIN
Цитата
так как по профессии был журналистом

Дорогая, ты не путаешь?
Может быть рекламным дизайнером?


ws_K
Цитата(alx71 @ 1.05.2012 - 14:54)
Откуда?


Уважаемый alx71.
В.И.Пашкова, Б.Д.Резников. Судебно-медицинское отождествление личности по костным останкам. Изд. Саратовского университета. 1978, Стр. 247, второе уравнение сверху.

С уважением, ws_K.


ws_K
Цитата(FILIN @ 1.05.2012 - 14:40)

1. Выводы, которые я бы сделал, я уже озвучил....
2. Моё отношение к широкому использованию математической статистике в биологии...
3. О Дж.Бруно...


Уважаемый FILIN.

3. Ну, если интересно:
Горфункель А. Джордано Бруно перед судом инквизиции (краткое изложение следственного дела Джордано Бруно) // Вопросы истории религии и атеизма. Т. 6. М. 1958.
http://krotov.info/acts/16/3/bruno_1.htm
В сущности, для нашего обсуждения интерес представляют только пп. 82 – 97 и 101 – 109. Но и остальное забавно…

2. Мое отношение к медицине (в большей ее части), также довольно подозрительное. Вероятно, наша с Вами взаимная подозрительность объясняется профессиональной деформацией.

Может быть, создать отдельную ветку, типа "Философия СМЭ"? Уж две страницы нашлепали, а консолидированного ответа на ключевой вопрос о необходимости "высчитывать коэффициент Стьюдента" все нет и нет...

1. Простите въедливость – работа такая – правильно ли я понял, что в своих Выводах Вы обходитесь простой констатацией результатов, полученных по различным методикам, из числа тех, которые Вам довелось использовать в конкретной экспертизе?

С уважением, ws_K.



FILIN
Я что, похож на человека, который читает "Вопросы истории религии и атеизма"?
Да еще 1958г. - разгар хрущевской антирелигиозной пропаганды с откровенным шельмованием и религии и верующих, созданием откровенно кгбешной Патриархии ( последние могли фальсифицировать что прикажут - даже рождение собственной матери).

Наше "подозрительное отношение", думается, имеет совершенно разное происхождение.
Я рассматриваю Мир как контрукцию из осознанной Культуры и Природы, которая познается только через Культуру.

На вопрос ответ - "да".


ws_K
Уважаемый FILIN.

Вы не похож на человека, который читает "Вопросы истории религии и атеизма" периода 1958 г. Вероятно, Вы, к 1958 году, уже имели полное представление и о сути антирелигиозной пропаганды, и о связях Патриархии с КГБ. И, все-таки, если найдете время, взгляните на документ, опубликованный по этой ссылке. Редакционный исторический "экскурс" можно и не читать (хотя и он достаточно объективен). Подлинность документа (с учетом трудностей перевода), лично у меня сомнений не вызывает. Косвенно подлинность документа подтверждается и отсутствием отрицательной реакции со стороны источника – Ватикана. Но документ, право же, любопытен.

СОВЕРШЕННО разное происхождение наших с Вами разногласий, мне кажется, не столь уж и совершенно.

Ваше мировоззрение, безусловно, вызывает уважение (заявляю об этом без тени сарказма). При всей лаконичности изложения, концепция, в общем, понятна. Но есть сомнение: Природа-то, у нас одна на всех, а вот Культур много: артКультура, попКультура, мироваяКультура, советскаяКультура, национальнаяКультура, КультураЧаепития… при желании список можно продолжить. Подозреваю, что Мир, познанный через призмы попКультуры и КультурыЧаепития, будет выглядеть по-разному.

Как далеко, все-таки, может завести людей обсуждение t-критерия Стьюдента! Пора, пора открывать философский топик на sudmed.ru.

При всех обстоятельствах, спасибо за прямой и категоричный ответ.

С уважением, ws_K.


FILIN
Дорогой ws_K.
С обсуждением заявленной темы вроде, уже закончили.
НО и ответвление от темы представляет не малый интере ( на мой взшляд, по крайней мере).
Так вот в продолжение этого ответвления.

Сначала определимся с дефиницией.
Их для термина "культура" много.
Я предпочитаю следующую:"Культура это все созданное человеком, а так же его мысли".
Не надо ставить рядом культуру и художественное творчество (которое так же содержит это слово в различных вариациях). Художественное творчество, безусловно, часть культуры, но не самая важная и определяющая.

Говорить о всемирной культуре так же сложно, как и о всемирной истории ( о последней Ясперс вообще сказал, что до тех пор пока во всём мире не установится единообразный тип организации общества, можно говорить лишь об истории страны, племени, этноса, но никак не о всемирной истории.

Совершенно не верно утверждение, что Природа для всех и весьде едина. Мы не можем даже увидеть ПРироду не выстроив специальный "природный" конструкт. Т.е. мы видим и познаём Природу через придания ей культурных форм. И в зависимости от степени многообразия и особенностей культурных форм, наше видение Природы так же особно и многообразно.

Есть целые науки, которых не существует в природе и которые являются проявлением культуры т.с. в чистом виде. Например - математика.


ws_K
Цитата(FILIN @ 2.05.2012 - 10:56)
...в продолжение этого ответвления.


Уважаемый FILIN.

Тема-то интересная, да уж очень объемная. И наговорено по этому поводу много всякого.

Но если, все-таки продолжать обсуждение, следовало бы договориться по принципиальным позициям, например: идеологическая платформа - материализм или что-то иное? Лично я придерживаюсь материалистических взглядов, и существование Бога для меня лишь гипотеза, в которой я, для объяснения картины Мира, не нуждаюсь. (Не уравниваю себя с Лапласом, но более точной формулировки своего отношения к Богу не представляю.)
Вместе с тем, я не являюсь "воинствующим атеистом", и признаю существование великого множества людей, для которых вера в Бога необходима как воздух. Что поделаешь? – каждому свое.

Есть и другие позиции, по которым следовало бы предварительно договориться. Иначе, вместо обсуждения, получится перепалка, а время тратить на это не хотелось бы.

С уважением, ws_K.



FILIN
Религия - это то же социокультурный феномен, который так же изучается культурологией, социологией, антропологией. Вот вера в трансценденцию - феномен чисто психологический, включенный в индивидуальное сознание. Так что веру затрагивать вообще не имеет смысла в контексте темы.
А религия - часть культуры. Но мы-то обсуждаем общие вопросы культурологии, а не частности.

Да и тема расположена не в Курилке, а в значительно более серьезном разделе, где "шаг в сторону считаю побегом; прыжок вверх - провокацией. В обоих случаях стреляю на поражение".

Так что перепалки не будет.

Обсуждение "принципиальных позиций" излишне. Материальную природу мира и мышления никто не отрицает. Ярых спиритуалистов как-то не встречал.


Gerat
Не совсем понял а каким боком антропология изучает религию ? Можно ли пояснить если не затруднит?
или имелась ввиду Философская антропология ?


FILIN
Ровно так же как и изучает национальные костюмы в историческом измерении.
(Этнография здесь не срабатывает).


Gerat
Ну антропология это совокупность дисциплин изучающих человека а различных средах (естественных и искусственных ) , в т.ч и религиозной. И что вы имеете ввиду под Культурой в своем понимании мира ? Не совсем понятен сей аспект


FILIN
Я уже привел краткую дефиницию, с которой полностью согласен.
Сонительно, что бы антропология изучала человека в "религиозной среде" - это задача психологии и, в какой-то мере, социологии.
Вот решение вопроса о верованиях (наличие/отсутсвие), например, у кроманьонца - это задача чисто антрополоическая.


Evik
Цитата(FILIN @ 1.05.2012 - 18:12)
Дорогая, ты не путаешь?
Может быть рекламным дизайнером?

Не путаю. Он был оккультным журналистом, совершенно справедливо сожженным за гнусную ересь. Кстати, математику он вообще не знал, а когда его спросили в Оксфорде, где расположено солнце, он показал на карте дырку от циркуля. Еще один миф советской эпохи.


FILIN
Evik
Перестань флудить.
Написал же - "стреляю на поражение".


ws_K
Цитата(FILIN @ 3.05.2012 - 14:31)
Так что перепалки не будет.

Уважаемый FILIN.

Ну вот, а Вы утверждали, что перепалки не будет. Будет. Она, в рамках темы, неизбежна. Знаете, в Украине говорят: "Два украинца – три гетьмана". Это идиома, но, если вдуматься, вполне переводима на великое множество языков. Страшна не перепалка. Страшны ее граничные формы. Нижняя, определенная одним из русских поэтов: "…Счастье не в том, что один за всех, А в том, что все как один…", и верхняя, пока не нашедшая отражения в поэзии, но в простонародье определяемая как "плюрализм мнений в одной, отдельно взятой голове". Все, что лежит внутри этих границ, мне кажется, можно считать нормой.

По существу: правильно ли я понял, что наряду с более или менее точно определенными понятиями, Мир и Культура, Вы вводите третье – Природа? Если это так, то хорошо бы это понятие определить и показать, в чем состоят его отличия от понятия "Мир". Иначе, складывается впечатление, что мы множим сущности без необходимости, нарушая, тем самым, принцип Оккама.

С уважением, ws_K.


alx71
Уважаемый ws_K.

В одном месте Вы пишете, что S = 2.297 * F + 64.63. Вам прекрасно известно, что для величин, связанный линейной зависимостью, коэффициент корреляции равен 1.
В другом месте Вы пишете, что коэффициент корреляции между S и F отличен от 1.

Как Вас понимать?

Не, ну все понятно, но что конкретно...


эдвард
Цитата(ws_K @ 29.04.2012 - 03:57)
Уважаемый эдвард.
Все, более или менее значимые открытия в естественных науках совершались невзначай.
Упало яблоко на голову Ньютона, и был открыт Закон всемирного тяготения; выпил Госсет лишнюю кружку пива, и придумал коэффициент Стьюдента; о грешном Эйнштейне и говорить не приходится.
С уважением, ws_K.

Не могу согласиться с данным утверждением. Результат, как правило, приходит к тому, кто его упорно ищет. Открытия Ньютона и Эйнштейна вовсе не были случайными. Они были подготовлены другими исследователями (Галилеем, Кеплером и Гуком в случае Ньютона и Майкельсоном-Морли-Лоренцем в случае Эйнштейна). Более того, если бы Ньютон и Эйнштейн не сделали свои открытия, это буквально в течение нескольких ближайших лет сделали бы другие. Кстати, некоторые ученые впоследствии даже судились с Ньютоном, оспаривая у последнего приоритет в области некоторых законов механики (могли бы судиться и многие другие, но они к тому времени умерли). История насчет ньютонова яблока - красивая легенда. Госсету идея пришла после долгих размышлений, а не после выпитой кружки пива. И сам t-критерий поначалу имел иной вид, привычный интерфейс и название этого критерия разработали впоследствии другие ученые и на трезвую голову.


эдвард
Цитата(FILIN @ 29.04.2012 - 11:24)
ws_K
действует старое правило - берется интервал между наименьшей и наибольшей длиной, вычисленными по всем методикам. Т.е. нижней границей длины считается наименьшая величина из всех методик, а верхней - наибольшая.


Лучше поступить наоборот: за нижнюю границу взять наибольшую длину из множества нижних интервальных оценок роста, полученных по всем методикам, а за верхнюю - наименьшую длину из множества верхних интервальных оценок. Только брать их нужно с той статистической надежностью, какую дает данная конкретная методика для данной интервальной оценки.

Например, 95% доверительный интервал по одной методике составляет 150-160 см, а аналогичный интервал по другой методике - 155-165 см. Тогда увеличить точность прогноза путем учета результатов обеих методик можно, используя приведенное выше правило: 95% ДИ по обеим методикам - 155-160 см.

Усреднять результаты тоже можно. Можно даже вычислить стандартную ошибку итоговой средней. Только для этого нужно использовать доверительные интервалы для линий регрессии (а не для прогнозируемых значений).

Все это можно делать, если не известны выборки, послужившие основой для создания регрессионных уравнений. Если имеются сами выборки, то их надо попросту объединить и рассчитать уравнение регрессии для объединенной выборки со своими доверительными интервалами. По идее, последние должны быть точнее интервалов, определенных по первому способу.


FILIN
ws_K
Мир=Культура+Природа
Природа - все, что не создано человеком.
Культура - все, что создано человеком+его мысли.


ws_K
Цитата(alx71 @ 4.05.2012 - 07:53)
Уважаемый ws_K.

В одном месте Вы пишете, что S = 2.297 * F + 64.63. Вам прекрасно известно, что для величин, связанный линейной зависимостью, коэффициент корреляции равен 1.
В другом месте Вы пишете, что коэффициент корреляции между S и F отличен от 1.

Как Вас понимать?

Не, ну все понятно, но что конкретно...


Уважаемый alx71.
Коэффициент корреляции будет равен 1, если ВСЕ точки на диаграмме рассеяния в экспериментальной выборке будут принадлежать линии регресса. В любом другом случае он будет меньше 1. И чем больше разброс точек, относительно линии регресса (а именно она описана регрессионным уравнением), тем меньше будет значение коэффициента корреляции. В экспериментальной выборке разброс неизбежен, со всеми вытекающими для коэффициента корреляции последствиями.

К сожалению, не могу ответить уважаемому эдвард на последнее сообщение - через два часа поезд.

Коротко, на предпоследнее: неужели же, если бы я заявил о том, что Эйнштейн создал теорию относительности нюхнув кокаина, Вы и это восприняли бы всерьез? Знаете, человеку иногда свойственно шутить...

С уважением, ws_K.


alx71
Уважаемый ws_K, я Вам про Фому, Вы мне про Ерему.
Вы можете внимательно прочитать мой вопрос и ответить на него (именно на него)?


ws_K
Цитата(alx71 @ 4.05.2012 - 13:46)
Уважаемый ws_K, я Вам про Фому, Вы мне про Ерему.
Вы можете внимательно прочитать мой вопрос и ответить на него (именно на него)?


Уважаемый alx71.

Какое счастье, что Вы НЕ занимаетесь остеометрией или чем-нибудь подобным. Иначе пришлось бы сделать вывод о том, что положение дел с математической статистикой в судебной медицине не просто плохое, а катастрофически плохое.
Я постарался сделать все возможное, чтобы стало понятно, почему квадрат выборочного коэффициента корреляции в методиках, построенных на основе обработки выборочных данных ПРАКТИЧЕСКИ ВСЕГДА меньше 1, притом, что сама зависимость выражается линейным уравнением. С этой целью мною были опубликованы данные Мануврие по методичке Прозоровского и, как иллюстрация, результаты их обработки методом корреляционного анализа.

Должен признаться, что на этом мои "преподавательские" возможности исчерпаны.

Между тем, математическая статистика, как универсальный инструмент познания Мира, проникла, в том числе, и юриспруденцию. Поэтому, отсылаю Вас к источнику, который, возможно, окажется для Вас, с учетом специфики Вашей деятельности, более авторитетным: Лунев В.В. Юридическая статистика. М.: Юристъ, 2007 г. Разумеется, всю книжку можно и не читать (чтение книг отнимает слишком много времени и требует, иногда, чрезмерного напряжения ума). Уточню: заинтересовавшая Вас проблема рассматривается в Главе 11 (стр. 292), а смысл выборочного коэффициента корреляции R, раскрывается в Параграфе 3 (стр. 306 – 315) этой же главы.

Заверяю Вас: материал изложен в столь доступной форме, что у ученика 9 класса общеобразовательной средней школы, для его понимания, препятствий не возникло (проверено на практике). Надеюсь, у Специалиста, тем более, таких проблем не возникнет вовсе.
И не понадобится, авось, на манер "блогеров" из "социальных сетей", поминать всуе ни Фому, ни Ерему.

Указанная книжка размещена по этому адресу, и доступна для скачиванмя в течение месяца:

http://files.mail.ru/R76O48

С уважением, ws_K.


alx71
Цитата(ws_K @ 7.05.2012 - 23:11)
квадрат выборочного коэффициента корреляции в методиках, построенных на основе обработки выборочных данных ПРАКТИЧЕСКИ ВСЕГДА меньше 1, притом, что сама зависимость выражается линейным уравнением.

Это взаимоисключающие условия.


ws_K
Уважаемый alx71.

Если Вы, даже после прочтения книжки, продолжаете утверждать, что "Это взаимоисключающие условия" – значит для Вас это категория Веры. Приводить верующему человеку какие-либо доводы, противоречащие его вере, совершенно бессмысленно. Равно как невозможно опровергнуть знаменитое ленинское "Этого не может быть, потому что не может быть никогда".

Давайте останемся, каждый при своей "Вере".

Успехов, ws_K.


FILIN
alx71
Что бы правильно понимать и правильно оценивать Ваши постинги в этой теме приходится обращаться с просьбой - каков уровень Вашего знания мат.стат.? Любительский (самообразование), полу-профессиональное ( курс МС преподавался среди прочего в не математическом ВУЗе), процессиональное?


Пастух
А мне интересен интерес (извиняюсь за каламбур) alx71, по заявленной теме, вернее какое практическое значение к правоприменительной практике может иметь "коэффициент Стьюдента"?


alx71
Цитата(FILIN @ 8.05.2012 - 12:13)
alx71
Что бы правильно понимать и правильно оценивать Ваши постинги в этой теме приходится обращаться с просьбой - каков уровень Вашего знания мат.стат.? Любительский (самообразование), полу-профессиональное ( курс МС преподавался среди прочего в не математическом ВУЗе), процессиональное?

У меня высшее образование по специальности "Радиоэлектронные системы и комплексы управления подвижными объектами".
Коэффициент корреляции между двумя линейно зависимыми случайными величинами равен 1 независимо от уровня моего (и даже Вашего) образования.
Хотя, с другой стороны, в военное время значение синуса может достигать и четырех...


FILIN
alx71
На вопрос не обижайтесь и иронизировать не надо.
эндард, например, самостоятель изучил курс матстата и широко применяет её в своих работах.
У меня так же самообразование по этой теме.


ws_K


alx71
Уважаемый ws_K, я могу лишь рекомендовать Вам изучить основы теории вероятости (с особым упором на правильное употребление терминологии). Сила связи - это сильно...

Также будет целесообразным, если участники обсуждения будут обосновывать свою позицию без ссылок на образование/Веру/длину пиписьки/etc.

Цитата
формула S = 2.297 * F + 64.63 выведена по эмпирическим данным методом наименьших квадратов

Теперь Ваша мысль понятна.


alx71
Да, и этта...
Цитата
Причем соотношение между стохастической и случайными компонентами определяет т.н. силу связи (для функциональной зависимости такого понятия не существует). Это соотношение выражается через коэффициент корреляции.

Коэффициент корреляции говорит только о линейной зависимости. О квадратичной, логарифмической etc он ничего не говорит.


alx71
Посмотрел рисунки к первому посту и вот что мне подумалось.
Т.к. все семь авторов регрессионных формул безусловно сделали все правильно (использовали однородные выборки), то различие в коэффициентах в регрессионных формулах обусловлено только конечным объемом выборки. Т.е. при увеличении объема выборки все одинаковые коэффициенты у разных исследователей должны сходиться по вероятности к одной и той же величине.
Тогда мы вправе свести все семь регрессионных формул к одной, просто усреднив соответствующие коэффициенты.
Возражения?


эдвард
Цитата(alx71 @ 9.05.2012 - 17:45)
Посмотрел рисунки к первому посту и вот что мне подумалось.
Т.к. все семь авторов регрессионных формул безусловно сделали все правильно (использовали однородные выборки), то различие в коэффициентах в регрессионных формулах обусловлено только конечным объемом выборки. Т.е. при увеличении объема выборки все одинаковые коэффициенты у разных исследователей должны сходиться по вероятности к одной и той же величине.
Тогда мы вправе свести все семь регрессионных формул к одной, просто усреднив соответствующие коэффициенты.
Возражения?

Так делать нельзя. Строгое обоснование этого тезиса приводится в специальной математической литературе. Здесь никуда не денешься, - придется искать сами выборки, объединять их и высчитывать по новой.

Точно также нельзя коэффициенты корреляции, полученные по разным выборкам, усреднять. Правда, искать выисходные выборки здесь не нужно, поскольку разработаны специальные формулы расчета т.н. объединенного коэффициента корреляции.

Также нужно заметить, что формулы Мануврие, Пирсона и подобные им были созданы на заре развития регрессионного анализа, теория которого впоследствии была значительна расширена и дополнена (нелинейная регрессия, кусочная регрессия, гребневая регрессия и т.д.). Скорее всего, располагая исходными выборками, можно создать заново новые нелинейные регрессионные уравнения, более точно отражающие имеющиеся стохастические зависимости.


alx71
Цитата(эдвард @ 10.05.2012 - 10:03)
Так делать нельзя. Строгое обоснование этого тезиса приводится в специальной математической литературе.

Да, Вы правы, коэффициенты не усредняются таким образом.


ws_K
Цитата(alx71 @ 9.05.2012 - 05:59)
...я могу лишь рекомендовать Вам изучить основы теории вероятости (с особым упором на правильное употребление терминологии). Сила связи - это сильно...

Уважаемый alx71.

Я с удовольствием последовал бы Вашему совету, но Вы упорно не называете источников, из которых черпаете столь удивительные сведения, например:

Цитата(alx71 @ 9.05.2012 - 05:59)
Коэффициент корреляции говорит только о линейной зависимости. О квадратичной, логарифмической etc он ничего не говорит.

Это утверждение не соответствует истине. Если есть основания подозревать, что функция нелинейна (а это сразу видно на диаграмме рассеяния), ее линеаризуют путем несложных преобразований. Например, чтобы линеаризовать логарифмическую зависимость
y = a* lg(x) + b достаточно вычислить x' = lg(x) и, затем, для уже линейной функции y' = a * x' + b вычислить, как обычно, коэффициент корреляции r'. Его значение укажет, насколько хорошо логарифмическая функция аппроксимирует эмпирические данные.

Рекомендации относительно изучения основ и терминологии теории вероятности Вы могли бы адресовать не только мне, но, скажем, и В.Ю. Урбаху, который в своей книжке "Биометрические методы", на странице 278, осмелился утверждать: "Важной задачей теории корреляции является построение численного параметра, который давал бы количественное выражение степени или СИЛЫ корреляции (СВЯЗИ) между признаками".
В употреблении этого термина Вы можете упрекнуть также Е.И. Пустыльник, Е.С. Венцель (если Вы приобрели свою специальность в МИИТ, то могли бы ее лично немного подучить) и многих других уважаемых людей. Этот термин имеет два синонима: "ТЕСНОТА связи" (например, Т.М. Сизова) и "сгруппированность точек относительно линии регрессии". При всем многообразии термина, речь идет об одном и том же:
Нажмите для просмотра прикрепленного файла
(Численная оценка моя, сделана "на глазок", визуально).

Цитата(alx71 @ 9.05.2012 - 05:59)
Теперь Ваша мысль понятна.

Да, и этта...

Это не мысли, это констатации.

Цитата(alx71 @ 9.05.2012 - 05:59)
Посмотрел рисунки к первому посту и вот что мне подумалось.
Т.к. все семь авторов регрессионных формул безусловно сделали все правильно (использовали однородные выборки), то различие в коэффициентах в регрессионных формулах обусловлено только конечным объемом выборки. Т.е. при увеличении объема выборки все одинаковые коэффициенты у разных исследователей должны сходиться по вероятности к одной и той же величине.
Тогда мы вправе свести все семь регрессионных формул к одной, просто усреднив соответствующие коэффициенты.
Возражения?

Слава Богу, от абсурдной идеи усреднения регрессоров различных формул Вы, кажется, отказались. Но вот отказались ли Вы от мысли, что "различие в коэффициентах в регрессионных формулах обусловлено только конечным объемом выборки" – не ясно. Если "нет" – откажитесь. Собственно объем выборки не столь уж и важен: вычислением необходимого и достаточного количества наблюдений, кроме прочего, занимается другой раздел математической статистики, называемый "Планирование эксперимента". Гораздо существеннее репрезентативность выборки, а также ее распределение. Так, методика Мануврие предназначена для лиц среднего и НИЖЕ среднего роста, а методика Тельккя - для лиц среднего и ВЫШЕ среднего роста. Именно по этой причине (уважаемый эдвард) никаких "усреднений" по этим методикам делать нельзя – абсурдный вывод неизбежен: методики-то имеют разное назначение.

С уважением, ws_K.




alx71
Ну и каша же у Вас в голове...
Цитата
методика Мануврие предназначена для лиц среднего и НИЖЕ среднего роста, а методика Тельккя - для лиц среднего и ВЫШЕ среднего роста

Тогда для среднего роста использовать их одновременно можно.
Цитата
Именно по этой причине (уважаемый эдвард) никаких "усреднений" по этим методикам делать нельзя

Не по этой. Средний коэффициент по двум выборкам действительно не равен коэффициенту по объединенной выборке - в этом легко убедиться, расписав формулы, я вчера не поленился, потратил время.


alx71
Цитата(alx71 @ 9.05.2012 - 06:59)
Уважаемый ws_K, я могу лишь рекомендовать Вам изучить основы теории вероятости (с особым упором на правильное употребление терминологии).

Наверное, начать лучше с того, чтобы научиться выражать свои мысли кратко...


эдвард
Цитата(ws_K @ 11.05.2012 - 03:23)
Так, методика Мануврие предназначена для лиц среднего и НИЖЕ среднего роста, а методика Тельккя - для лиц среднего и ВЫШЕ среднего роста. Именно по этой причине (уважаемый эдвард) никаких "усреднений" по этим методикам делать нельзя – абсурдный вывод неизбежен: методики-то имеют разное назначение.

Даже если бы обе названные методики были основаны на выборках одинакового объема и были предназначены для одних и тех же целей, регрессионные коэффициенты этих уравнений все равно нельзя было бы усреднять. Именно эту мысль пытается донести донести до Вас alx71.

Кроме того, получается, что существуют методики определения роста (неизвестного параметра), которые работают только для людей высокого или невысокого роста. Откуда мне знать, какую методику выбирать, если этот самый рост мне неизвестен и именно его-то и нужно определить? Если это так, то место этим методикам в мусорной корзине.


alx71
Цитата(эдвард @ 11.05.2012 - 10:19)
Кроме того, получается, что существуют методики определения роста (неизвестного параметра), которые работают только для людей высокого или невысокого роста. Откуда мне знать, какую методику выбирать, если этот самый рост мне неизвестен и именно его-то и нужно определить? Если это так, то место этим методикам в мусорной корзине.

Ну, можно вначале определить, а уж потом решить...


ws_K
Уважаемый alx71.
Цитата(alx71 @ 11.05.2012 - 05:33)
Наверное, начать лучше с того, чтобы научиться выражать свои мысли кратко...

Я предпочитаю излагать свои мысли ТОЧНО. Потому что, вот в таком, например, высказывании нет ничего, кроме краткости – ни знания предмета обсуждения, ни логики, ни здравого смысла: "…то различие в коэффициентах в регрессионных формулах обусловлено только конечным объемом выборки. Т.е. при увеличении объема выборки все одинаковые коэффициенты у разных исследователей должны сходиться по вероятности к одной и той же величине. Тогда мы вправе свести все семь регрессионных формул к одной, просто усреднив соответствующие коэффициенты". Может быть, поясните (разумеется, кратко), по какой такой вероятности эти странности должны произойти?

Уважаемый эдвард.
Цитата(эдвард @ 11.05.2012 - 09:19)
Даже если бы обе названные методики были основаны на выборках одинакового объема и были предназначены для одних и тех же целей, регрессионные коэффициенты этих уравнений все равно нельзя было бы усреднять. Именно эту мысль пытается донести донести до Вас alx71.

В своем сообщении #52 я назвал идею усреднения регрессоров различных формул АБСУРДНОЙ. Зачем же пытаться "доносить" до меня то, что мне и так хорошо известно?
Цитата(эдвард @ 11.05.2012 - 09:19)
Кроме того, получается, что существуют методики определения роста (неизвестного параметра), которые работают только для людей высокого или невысокого роста. Откуда мне знать, какую методику выбирать, если этот самый рост мне неизвестен и именно его-то и нужно определить? Если это так, то место этим методикам в мусорной корзине.

Простите нескромность, Вы медик-криминалист? Если – "да", то Вам должен быть известен прием, широко используемый в судебно-медицинской криминалистике (и не только в криминалистике): вначале устанавливается группа (роста или возраста), к которой принадлежит объект. Затем, с помощью регрессионных уравнений, выведенных для соответствующей группы, определяется наиболее вероятное значение роста (или возраста) и доверительный интервал при соответствующей доверительной вероятности. Судебно-медицинская наука устанавливает четыре группы роста: "Малый", "Ниже среднего", "Выше среднего", "Большой". По такой схеме работают методики Пирсона, Дюпертюи и Хэддена, Мануврие, Тельккя, и некоторых других. Этот же прием использует Неклюдов, в своей методике "Определение возраста по остеометрии верхней конечности": вначале определяется возраст с точностью до десятилетия, а затем, в пределах десятилетия, с точностью до нескольких лет.

Не спешите выбрасывать в корзину существующие методики. Вначале попытайтесь создать собственные, более совершенные. А пока Вы этого не сделаете, СМ-криминалистика будет использовать то, что есть.

С уважением, ws_K.



alx71
Цитата(ws_K @ 12.05.2012 - 20:41)
Может быть, поясните (разумеется, кратко), по какой такой вероятности эти странности должны произойти?

«Cтремление по вероятности» случайной величины s к некоторому числу A означает, что для любого постоянного b вероятность события "|s-A| больше b" стремится к нулю.

Например, частота выпадения орла при бросании монеты стремится по вероятности к вероятности выпадения орла (0,5) при увеличении объема выборки.

Сравните с определением предела по Коши.

Это должно быть во всех учебниках.



эдвард
Цитата(ws_K @ 12.05.2012 - 18:41)
Уважаемый alx71.
Вам должен быть известен прием, широко используемый в судебно-медицинской криминалистике (и не только в криминалистике): вначале устанавливается группа (роста или возраста), к которой принадлежит объект. Затем, с помощью регрессионных уравнений, выведенных для соответствующей группы, определяется наиболее вероятное значение роста (или возраста) и доверительный интервал при соответствующей доверительной вероятности. Судебно-медицинская наука устанавливает четыре группы роста: "Малый", "Ниже среднего", "Выше среднего", "Большой". По такой схеме работают методики Пирсона, Дюпертюи и Хэддена, Мануврие, Тельккя, и некоторых других. Этот же прием использует Неклюдов, в своей методике "Определение возраста по остеометрии верхней конечности": вначале определяется возраст с точностью до десятилетия, а затем, в пределах десятилетия, с точностью до нескольких лет.


Названный Вами прием в широком смысле называется методом исключения неоднородности корреляции и кластеринга, когда для повышения точности прогноза выборка дробится на отдельные страты, к каждой из которых подгоняется отдельное уравнение регрессии. Однако такой подход хорош только при условии однозначного (невероятностного) определения принадлежности данного объекта к определенному кластеру, которое при этом должно быть осуществлено при исследовании именно этого объекта без обращения к другим объектам, которых может и не быть или не будет доказана их принадлежность к одному индивидууму (в примере с медико-криминалистической идентификацией роста). Если обсуждаемые в теме методики соответствуют приведенным критериям, пусть себе живут (все-таки Пирсон был в математической статистике как минимум второй по величине фигурой после Фишера, а то и первой). Но если нет, надо криминалистам искать другие методы. И это именно их проблема и ничья другая.

Возможно также, что мы говорим о разных формулах. Те регрессионные уравнения Пирсона и Мануврие, которыми я пользовался в молодости, не имели ограничений и не требовали предварительного определения каких-либо групповых принадлежностей. Но найти их я уже не смогу (все книги продал, а деньги пропил).


ws_K


alx71
Цитата(ws_K @ 19.05.2012 - 00:27)
Можно ли корректно, с точки зрения МатСтатистики, и приемлемо, с точки зрения СМ-криминалистики ОБОБЩИТЬ результаты, полученные по нескольким различным СМ-методикам, не владея полной (в статистическом смысле) информацией о характере самих методик?


С точки зрения матстатистики - можно.



эдвард
Цитата(ws_K @ 18.05.2012 - 22:27)
Уважаемый эдвард.
Можно ли корректно, с точки зрения МатСтатистики, и приемлемо, с точки зрения СМ-криминалистики ОБОБЩИТЬ результаты, полученные по нескольким различным СМ-методикам, не владея полной (в статистическом смысле) информацией о характере самих методик?

С точки зрения математики все можно сделать, с точки зрения доказательной медицины - нельзя.



ws_K
Цитата(alx71 @ 19.05.2012 - 05:28)
С точки зрения матстатистики - можно.

Уважаемый alx71.
А ну-ка:
Рост по четырем методикам (результаты реальной экспертизы):

S1 = 163 ± 8.85 см., р = 0.95
S2 = 162.7 ± 0.9 см., р = 0.95; R = 0.989
S3 = 167.3 см. (Доверительные интервал и вероятность в этой методике не определены).
S4 = 164.0 ± 0.1 см., р = 0.95; R = 0.995

И как мы это "обобщим"? Желательно с формулами и со ссылкой на литературный источник, обосновывающий их применение.

Цитата(эдвард @ 21.05.2012 - 08:59)
С точки зрения математики все можно сделать, с точки зрения доказательной медицины - нельзя.

Уважаемый эдвард.

Не вполне ясно, что следует понимать под термином "Доказательная медицина".
"Доказательная" в судебном заседании или что-то иное?

Это прямая ссылка на сайт, посвященный, в частности, этой самой Доказательной медицине. Сайт серьезный, и люди серьезные и уважаемые в научных кругах. Посмотрите. Мне кажется, Вам будет интересно…

http://www.biometrica.tomsk.ru/

С уважением, ws_K.


alx71
Цитата(ws_K @ 21.05.2012 - 18:54)
И как мы это "обобщим"?

Усредним.



эдвард
Цитата(ws_K @ 21.05.2012 - 17:54)
Уважаемый alx71.
А ну-ка:
Рост по четырем методикам (результаты реальной экспертизы):

S1 = 163 ± 8.85 см., р = 0.95
S2 = 162.7 ± 0.9 см., р = 0.95; R = 0.989
S3 = 167.3 см. (Доверительные интервал и вероятность в этой методике не определены).
S4 = 164.0 ± 0.1 см., р = 0.95; R = 0.995

И как мы это "обобщим"? Желательно с формулами и со ссылкой на литературный источник, обосновывающий их применение.

Можно просто усреднить точечные оценки, как это предложил alх71, да еще рассчитать их стандартное отклонение (будет как аналог стандартной ошибки среднего). С помощью среднего и его "стандартной ошибки" можно рассчитать доверительный интервал. Только он получится широкий из-за небольшого количества усредняемых точечных оценок. Вот если бы Вы применили методик этак 30-50, то интервал получился бы узкий. Поэтому для определения интервальных оценок лучше применить метод, который я описал выше (из множества нижних интервальных оценок выбираем наибольшую, из множества верхних - наименьшую).

Учитывая, что примененные методики отдельных авторов создавались по выборкам разного объема усреднять точечные оценки лучше с учетом весовых коэффициентов (чем выборка исходная больше, тем коэффициент больше, а точечная оценка играет большую роль при усреднении). Полоучится так называемое взвешенное среднее. Вот и все.

Математика позволяет сделать все, что угодно. А вот доказательная медицина не разрешает объединять вместе исследования разного качества (принципы мета-анализа).



alx71
Вообще данные какие-то странные... доверительный интервал для S1 почти в 100 раз больше, чем для S4... доверительный интервал для роста в 1 мм...
S3 без доверительного интервала я бы вообще не рассматривал бы.
Уж коли пошла такая пьянка, то, на мой взгляд, самое правильное - S3 вообще отбросить как не понять что, для остальных найти дисперсии, затем найти среднее или средневзвешенное, найти для него дисперсию (по трем ранее вычисленным) и по ней доверительный интервал.

Правда, что рост человека меняется в течении дня на сантиметр-другой?


ws_K
Уважаемый эдвард.

Цитата(эдвард @ 22.05.2012 - 08:56)
Можно просто усреднить точечные оценки, как это предложил alх71, да еще рассчитать их стандартное отклонение (будет как аналог стандартной ошибки среднего). С помощью среднего и его "стандартной ошибки" можно рассчитать доверительный интервал. Только он получится широкий из-за небольшого количества усредняемых точечных оценок. Вот если бы Вы применили методик этак 30-50, то интервал получился бы узкий...

А что? Давайте так и сделаем. (Возможности редактора ограничены, поэтому ход расчетов на картинке).

Вычислим выборочные среднее и дисперсию, а затем и выборочный стандарт:
Нажмите для просмотра прикрепленного файла
Формально верно? Абсолютно! И доверительный интервал, вопреки ожиданиям, оказался не таким уж большим. А по сути? С точки зрения "доказательной медицины", т.с.?

Кстати, где это Вы видели 30 – 50 методик? Мне известно лишь 9, более или менее сносно работающих по росту. Да и к ним есть вопросы.

Уважаемый эдвард.
Не только доказательная медицина, ни одна из существующих наук не допускает объединение неравноценных данных. Это удел псевдо- (или лже-) науки. Математика тонкий и очень мощный инструмент, требующий аккуратного обращения. Например, теоретически не обоснованное, механистическое "усреднение" зачастую имеет чудовищные, а иногда и фатальные последствия на практике. Любой математик-прикладник это отчетливо сознает. Хорошо было бы, чтобы и специалисты в прикладных областях знания это понимали. У Вас, мне кажется, это понимание есть.

Уважаемый alx71.
Цитата(alx71 @ 22.05.2012 - 10:28)
Вообще данные какие-то странные... доверительный интервал для S1 почти в 100 раз больше, чем для S4... доверительный интервал для роста в 1 мм...

Уж коли пошла такая пьянка, давайте я эти данные откомментирую, и, полагаю, будет все ясно.

S1 – методика Найниса. Это добросовестный и хорошо владеющий матстатистикой человек. Кроме того, он очень аккуратен при публикации своих работ, во всяком случае, никаких недоразумений в его данных мы ни разу не обнаружили. И, главное, он приводит сведения, которые обычно другие разработчики опускают: объем выборки, тип распределения, описательные статистики, проч.

S2, S4 – методики Мануврие и Тельккя, соответственно. Обе построены по данным, содержащимся в МП проф. Прозоровского. Но вот беда: таблицы содержат лишь средние значения длин костей и соответствующий длине кости рост. Никаких других статистик (дисперсия, ошибка среднего, проч.) в таблицах нет. Поэтому, по данным Прозоровского, удалось вывести регрессионные уравнения, но определить доверительную область, в которой лежит линия истинной регрессии, не получилось – недостаточно данных. Обычно для этого используют формулу Бартлета, но она требует знания объема выборки, выборочных стандартов и коэффициента корреляции. То, что стоит после ± это не доверительный интервал, а т.н. "стандартная ошибка оценки" – есть такой термин в регрессионном анализе. (В методике это оговорено). Толку от этой статистики мало, но отсюда и вытекает такая чудовищная "точность". Вообще, об этих методиках можно еще поговорить: там обнаруживаются странности, которые я не могу объяснить, могу лишь догадываться об их причинах. Если будет интересно, могу изложить.

S3 – методика Пирсона. Я не думаю, чтобы создатель корреляционного и регрессионного анализов ограничился лишь публикаций формул, и не привел хотя бы коэффициент корреляции своего собственного имени. Скорее всего, отечественные "публикаторы" иные статистики сочли лишними или не существенными и попросту выкинули их из методических писем. Главное-то среднее, а там – хоть потоп…

Данные, конечно, забавные, но, для СМ-криминалистики, не самые смешные…

С уважением, ws_K.



alx71
Уважаемый ws_K, Вы при расчете дисперсии разность не возводите в квадрат, Вы просто забыли его написать?
Буквой D принято обозначать дисперсию.


alx71
Цитата(alx71 @ 24.05.2012 - 06:41)
при расчете дисперсии

Имел в виду - стандартного отклонения.


эдвард
Цитата
Формально верно? Абсолютно! И доверительный интервал, вопреки ожиданиям, оказался не таким уж большим. А по сути? С точки зрения "доказательной медицины", т.с.?


С точки зрения доказательной медицины нужно найти оригинальные источники методик, критически оценить каждую из них (невзирая на фамилию Пирсона), предварительно сформулировав приемлемый для Вас или конкретной экспертизы порог качества. Если найдутся работы, которые первалят через этот порог, то нужно выбрать одно, наиболее качественное из них, и применить его. Если ни одна методика не достигает заявленного порога качества, то нужно отказаться от экспертного решения вопроса за неимением соответствующих методик.

Цитата
Математика тонкий и очень мощный инструмент, требующий аккуратного обращения.


С другой стороны, математика допускает и "полеты фантазии", лишь бы последние помогали решению поставленной задачи. В математике можно абстрагироваться, решать задачи "в первом приближении", окргулять и пренебрегать. С этой позиции математики делятся на 2 категории: чистых математиков (побрников строгости и логики) и прикладников. Первые из них "решают так, как нужно, то, что можно", а вторые - "так, как можно, то, что нужно". Один рисковый математик-практик Оливер Хевисайд, однажды сказал по поводу паники в среде математиков из-за одной нерешаемой задачи:
Цитата
Подумаешь, ряд расходится, неужели же мы ничего не сможем с ним сделать?

Для меня это выражение - путеводная нить по жизни.



ws_K
Цитата(alx71 @ 24.05.2012 - 05:41)
Уважаемый ws_K, Вы при расчете дисперсии разность не возводите в квадрат, Вы просто забыли его написать?
Буквой D принято обозначать дисперсию.


Конечно, забыл в записи формулы. Спасибо. Но при вычислениях разности в квадрат возводились, так что численные результаты верны.
Нажмите для просмотра прикрепленного файла
Обычно квадратом s обозначают выборочную дисперсию, просто s - выборочный стандарт. Не хотелось вносить путаницу - в выражениях S обозначает рост. Встречаются и другие обозначения. Это не суть важно - лишь бы они были определены и понятны читателю.

С уважением, ws_K.


ws_K
Господа!
Сие обсуждение оставляет чувство некоторой неудовлетворенности: следует ли, все-таки, "высчитывать коэффициент Стьюдента" при "усреднении" результатов, полученных по нескольким методикам или, может быть, ну его на фиг? И вообще, следует ли "усредненные" результаты приводить в тексте Заключения?

Мнения разделились:

Уважаемый FILIN считает, что ничего усреднять не надо. Достаточно привести результаты, полученные по всем, задействованным в исследовании методикам, возложив ответственность за их точность на СМ-науку и поставив несчастных потребителей СМ-информации перед необходимостью самим решать, какой из результатов признать истинным.

Уважаемый эдвард считает, что усреднять результаты можно, если отбросить доверительные интервалы граничных методик – показавших наименьшее и наибольшее значения (во всяком случае, так я понял фразу: "из множества нижних интервальных оценок выбираем наибольшую, из множества верхних - наименьшую"). Какое отношение этот "эвристический" (в худшем смысле этого слова) подход имеет отношение к математической статистике, и как он ею обосновывается, уважаемый эдвард, к сожалению, умалчивает.

Уважаемый alx71 считает, что усреднять результаты можно, а вычисленный по дисперсии результатов доверительный интервал будет соответствовать истинному. Это не так. Дело в том, что, в данном случае, доверительный интервал вычислен без учета доверительных интервалов каждой из методик, и он характеризует лишь разброс наиболее вероятных значений. Из рассмотренного численного примера видно, что в результате усреднения получен доверительный интервал существенно меньшей ширины доверительного интервала одной из методик (S1). Так не бывает.

Я (ws_K) считаю, что, в отсутствие необходимой и достаточной информации, усреднять результаты, полученные по разным методикам нельзя, а доверительный интервал для среднего (в данном случае) никакого смысла не имеет. Другое дело, если имеется необходимая информация по каждой из этих методик – объем и выборочная дисперсия. Тогда можно было бы вычислить ОБЩУЮ дисперсию по всем методикам и, соответствующей ей, доверительный интервал для среднего. К несчастью, небрежность "публикаторов" нас такой возможности лишает.

Между тем необходимость конкретизации судебно-экспертного вывода существует. Вопрос в том, как этой конкретизации достичь корректно, без "чрезвычайных упрощений" и "лихой эвристики".

С уважением, ws_K.



Русская версия Invision Power Board © 2001-2017 Invision Power Services, Inc.

© 2002-2015 Форум судебных медиков
При копировании материалов сайта размещение активной ссылки на источник обязательно!