Программы для автоматизации анализа мтДНК

Полная версия: Программы для автоматизации анализа мтДНК

Форум судебных медиков России > Судебная медицина и судебно-медицинская экспертиза > Судебно-медицинская генетика

10gin

25.09.2008 - 13:23

Коллеги!

Очень хотелось бы узнать о вашем опыте использования программ занимающихся автоматизацией анализа мтДНК. Конкретно - об их плюсах и минусах. Вопрос очень актуален на данный момент, а адекватной информации нет практически нигде...

someone

25.09.2008 - 21:05

С чего ж такая срочность? Область эта видите ли неторопливая, требует умения высасывать информацию буквально из пальца, не кодис

И что понимается по "автоматизацией анализа мтднк"? Митохондриалка человеческая? Вам нужны популяционные частоты, дискриминирующие свойства тех или иных участков, филогения?

10gin

26.09.2008 - 09:30

Под "автоматизацией ..." понимается исследование нуклеотидных последовательностей. Митохондриалка человеческая.
Срочность - ввиду необходимости довольно поспешного выбора продукта, которым предстоит пользоваться долго.

someone

26.09.2008 - 10:19

Цитата(10gin @ 26.09.2008 - 10:30)

Под "автоматизацией ..." понимается исследование нуклеотидных последовательностей.

"исследованием нуклеотидных последовательностей" можно назвать абсолютно любую манипуляцию с молекулой. Не могли бы Вы пояснить конкретнее? Нет программы которая делала бы все возможные задачи.

1) Подбор праймеров - смотрите статьи по исследованию локусов которые Вам интересны. Там описаны стандартные праймеры. Экзотические подбираются с помощью тех же программ которыми дизайнят любые другие праймеры.
2) Анализ трейсов - разве Ваш секвенатор не снабжен софтом для вывода данных скажем в FASTA? А выравнивать фасту по риференсу - вполне стандартная задача.
3) Частоты аллелей в популяциях. Публичные базы очень малы. Мы работали много лет чтобы создать базу удовлетворительного качества. Если Вам нужны частоты каких-то гаплотипов в популяциях - пожалуйста пишите в личку, я Вам сброшу выборки по КОНКРЕТНЫМ гаплотипам.
4) Если Вам нужны данные по патологиям, то Митомар Орг дает массу информации упорядоченной по сайту или участку.

Что из этого делает Ваш "продукт" если не секрет? Единственное, что можно поручить программе - это выравнивание и подобные технические действия, все остальное нужно делать самостоятельно.

Genetik

27.09.2008 - 18:46

Цитата(10gin @ 25.09.2008 - 14:23)

Очень хотелось бы узнать о вашем опыте использования программ занимающихся автоматизацией анализа мтДНК. Конкретно - об их плюсах и минусах. Вопрос очень актуален на данный момент, а адекватной информации нет практически нигде...

Гаврилей Ю.К., Корниенко И.В., Щербаков В.В., Иванов П.Л. Разработка автоматизированной системы анализа данных секвенирования митохондриальной ДНК «mDNAbase» для целей экспертной идентификации неопознанных тел в условиях массового поступления останков // Судебно-медицинская экспертиза.- 2002. № 5.- C. 15-21.

someone

27.09.2008 - 20:00

Цитата(Genetik @ 27.09.2008 - 19:46)

Не смешите человека не первый год помогающего в этой задаче судебным медикам. В 2002 году даже Парсон и В ИДЕАЛЕ не умел делать того что представляется НЕОБХОДИМЫМ сейчас. Грубо говоря, если эксперт при работе с митохондриалкой не может гарантировать хорошей вероятности неисключения, более 99.9%, лучше вообще не тратить деньги налогоплательщиков.

10gin

30.09.2008 - 17:03

Genetik - спасибо за ссылку.

Меня интересует:
Выравнивание.
Определение и вывод гаплотипа. (и все это чем "автоматическее" - тем лучше)
Печать удобоваримого отчёта.
Возможность редактирования сиквенса (обрезка областей, редактирование, замена нуклеотидов)
Возможность сохранять результаты работы.
Возможность поиска по популяциям.

someone

30.09.2008 - 19:57

Цитата(10gin @ 30.09.2008 - 18:03)

Меня интересует:
Выравнивание.
Определение и вывод гаплотипа. (и все это чем "автоматическее" - тем лучше)
Печать удобоваримого отчёта.
Возможность редактирования сиквенса (обрезка областей, редактирование, замена нуклеотидов)
Возможность сохранять результаты работы.
Возможность поиска по популяциям.

ОК. От выравнивания до сохранить - умеет делать масса бесплатных программ. Правда придется дорабатывать это дело с напильником - скажем для поиска в базе вам нужен формат типа 16223,16362 а в наличии есть только выравненная строка. Для программиста раз плюнуть, а пользователю неудобно - не БЛАСТить же базу. То есть обязательно проверьте в какие форматы умеет конвертировать сиквенсы предлагаемый Вам продукт.

Далее, в программе должна быть возможность при поиске соответствий игнорировать инделы, вообще длину С-трактов. Инделы нужны только при сличении двух образцов предположительно принадлежащих одному и тому же человеку. При подсчете частоты в популяциях они будут мешать. Также должна быть возможность игнорировать при поиске любой набор сайтов, скажем обычный кандидат на удаление - 16519.

Поиск по популяциям - здесь дам Вам пару советов.

1) Разумеется любая база будет отставать по количеству записей от того максимального количества сиквенсов что есть в литературе. Скажем, сейчас опубликовано уже за 100000 ГВС, хотя и не все из них с хорошими популяционными привязками. В коммерческой базе желательно видеть хотя бы треть от этого количества. В частности европеоидов в базе долно быть не менее 15000-20000 образцов, иначе работать не сможете. Проверьте также сколько есть по этнич. русским. В настоящее время опубликовано примерно 1200, если вам предложат значительно меньше - база фуфло. Если Вам будут предлагать закрытые базы с неопубликованными данными судебного происхождения, будьте аккуратны - обычно там масса ошибок в сиквенсах и скверно с определением этнической принадлежности.
2) Очень желательно чтобы там были не только данные ГВСов но и полиморфизмы кодирующего участка, либо гаплогруппа определенная через ПДРФ/мультиплекс. Даже если Вы не будете типировать кодирующие области, такие данные могут уберечь от неправильных выводов. Кстати, сейчас это стандарт, что бы ни писали в старых статьях.

В общем можете написать здесь или в личку что умеет предлагаемый Вам "продукт", подумаем. Честно говоря, я не встречал разработок даже отдаленно соответствующих всем требованиям.

10gin

1.10.2008 - 17:47

Большое спасибо!
Очень исчерпывающе, правда. Не хватает только названий самих продуктов.
Еще один вопрос.вот скажем при покупки определённого продукта фирмы А (устраивающего по всем параметрам кроме собственно базы) - есть ли возможность научить его работать с базой фирмы Б? и если можно пример.

someone

1.10.2008 - 20:39

Цитата(10gin @ 1.10.2008 - 18:47)

Не хватает только названий самих продуктов.

я бы сам рад узнать какие есть сейчас продукты. То что я сам видел было еще только на пути к пользователю. Это типа "коробочные". Есть и публичные, например когда-то была бесплатная недоделка SWGDAM, сейчас начинает развиваться http://www.empop.org , но они не спешат пока затачивать ее для судебных целей. Я тоже занят разработкой подобного продукта, он будет бесплатным и будет с большой базой, но не скоро, так как мы делаем параллельно под unix и windows.

Цитата(10gin @ 1.10.2008 - 18:47)

Еще один вопрос.вот скажем при покупки определённого продукта фирмы А (устраивающего по всем параметрам кроме собственно базы) - есть ли возможность научить его работать с базой фирмы Б? и если можно пример.

"Научить" в принципе нельзя так как коробочные продукты слишком специальны. Но если Вы знаете про тот или иной продукт что он скажем выравнивает Фасту переводя ее скажем в PHYLIP а другой продукт умеет что-то делать с этими выравниваниями в PHYLIP - в таком смысле совместимость есть. И тут надо все проверять на опыте - бывает что программе какая-нибудь лишняя запятая мешает. Имхо следует посмотреть что Вам предлагают, может к этому продукту совсем немного доработок нужно. Разузнайте для начала какие у него фичи и какой размер базы, иначе мы можем вечность рассуждать и ни к чему не прийти.

someone

1.10.2008 - 21:03

Пожалуй чтобы хоть какой-то толк от переписки был, сформулирую все еще конкретнее.

1) Выясните какие фичи у продукта, не считая базы. Почему так? Потому что при работе с конкретным локусом, в данном случае это митохондриалка, требуются определенные специальные алгоритмы, которых в общих пакетах нет. Мега или Эмбосс или куча подобных программ могут вам и выравнять на ура, и искать сиквенсы и многое другое. Если бы у вас была задача выравнивать ген щуки с человеческим то качество выравнивания будет иметь значение. А в вашем случае отнюдь нет - за глаза хватит простых старых методов типа Clustal. Главное чтобы это самое выравнивание по CRS выдавало вам строчку в формате который поступит на вход базы, с минимальной правкой, скажем заменить запятые на пробелы. Если база в FASTA - можно искать прямо как выдал секвенатор, а если база в формате типа 234234A,43534556C,5634664Y - стало быть и выравнивание должно приводить к этому формату. Но даже если в продукте встроенная база все равно должна быть возможность конвертировать сиквенс в строку попарных отличий от референсного сиквенса, иначе вы не сможете быстро пользоваться другими базами и быстро запихивать результаты в отчеты. Также повторяю обратите внимание на опции поиска - нужна возможность исключать малозначительные сайты. Если перечисленных фич нет то без собственного программиста не обойтись.

2) Если продукт всем устраивает но база маловата, тогда выясните можно ли расширить эту базу закачав туда что-то внешнее. Здесь понадобится программист, но возможно это окупится.

10gin

6.10.2008 - 10:31

На выходных знакомый сказал что в инсбруке в 2006 г. кажется был представлен подобный продукт.
причем именно русский. нет ли у вас информации о его судьбе/стадии развития?
(и не ваш ли это?

)

10gin

6.10.2008 - 11:28

P.S.
предварительно рассматриваем функционал Applied Biosystems SeqScape.

10gin

6.10.2008 - 13:33

По поводу русской разработки нашел следующую информацию (правда английский)

Automating the mtDNA analysis with the MitoTyper software
Orekhov V, Markov A, Ivanov P

Нажмите для просмотра прикрепленного файла

Программы для автоматизации анализа мтДНК