Логотип
РУС
ХудРук — д.б.н. Балановская Е.В.

Среднеэтнические частоты

В данном разделе представлены частоты гаплогрупп Y хромосомы у отдельных народов. Частоты в различных региональных популяциях одного народа усреднены в одну запись на весь народ, потому-то этот раздел и называется «среднеэтнические частоты». 

Конечно же, часть информации при усреднении теряется, зато таблица становится обозримой и понятной не только генетикам, но и коллегам из смежных областей. Разработка полной версии инфосистемы (с информацией по отдельным популяциям и по STR гаплотипам) планируется на 2011-2012 годы.

Скачать базу данных (файл Excel, 885 КБ)


База данных среднеэтнических частот гаплогрупп Y хромосомы у народов мира содержит информацию о частотах 335 гаплогрупп Y хромосомы у 252 народов (84 420 записей). Суммарная выборка 55024 человек.

ИСТОЧНИКИ ИНФОРМАЦИИ

Опубликованные в международных и российских изданиях научные статьи по изменчивости Y хромосомы в популяциях человека (см раздел Источники данных), а также неопубликованные (архивные) данные лаборатории популяционной генетики человека МГНЦ РАМН (зав. лаб. Е.В. Балановская).

КРАТКОЕ ОПИСАНИЕ АЛГОРИТМА, ИСПОЛЬЗОВАННОГО ПРИ СОСТАВЛЕНИИ БД 

Этап 1. На первом этапе составления БД каждый источник данных (научная статья) обрабатывался отдельно. На основании опубликованной в статье генотипической информации составлялась таблица Excel, в которой указывалось: популяция, дефенирующий маркер, число человек с данным дефенирующим маркеров в данной популяции. Важно, что указывалось не буквенное обозначение гаплогруппы (наплимер R1a1) а конкретный дефенирующий эту гаплогруппу маркер, непосредственно типированный авторами публикации (например, М17). Это делает базу данных независимой от частых изменений в номенклатуре гаплогрупп. Дефенирующий маркер может иметь и более сложный вид, например M207(xM269).

Этап 2. На втором этапе информация из всех таблиц была объединена в единый файл и проведена многоступенчатая обработка данных с целью составить надежную таблицу с частотами гаплогрупп в каждой изученной популяции. В случае, если один и тот же народ был изучен в нескольких разных популяциях или несколькими разными авторами, частоты гаплогрупп были усреднены, с тем чтобы получить для каждого народа единственное (и наиболее надежное) значение частоты данной гаплогруппы.

               

РЕКОМЕНДАЦИИ ПО ИСПОЛЬЗОВАНИЮ       

Полная версия базы данных содержит информацию о 335 гаплогруппах, что обычно является избыточным и затрудняет навигацию по базе. Поэтому в рекомендуемой версии базы данных 335 (дробных) гаплогрупп объединены в 29 основных гаплогрупп. Использование полной версии целесообразно лишь в тех редких случаях, когда нужно получить информацию по дробному субварианту той или иной гаплогруппы или детально разобраться, на чем основана указанная в рекомендуемой версии частота гаплогруппы. Во всех остальных случаях целесообразно пользоваться "рекомендуемой версией" базы данных.

На листе "полная версия" содержится информация о частотах 335 гаплогрупп. В связи с ограничениями наиболее широко распространенной версии MS Excel (не более 256 столбцов), на данном листе народы представлены в столбцах, а гаплогруппы - в строках. В ячейках содержатся частоты данной гаплогруппы у данного народа. Народы отсортированы справа налево в алфавитном порядке. Для каждого народа указано его название, страна (или страны) где он был изучен, объем выборки по данному народу, ссылка на источники информации.

На листе "рекомендуемая версия" содержится информация о частотах 29 основных гаплогрупп. Для удобства пользования народы представлены в строках, а гаплогруппы - в столбцах. В ячейках на пересечениях представлены частоты данных гаплогрупп у данных народов. Пустые ячейки означают что для данного народа нет информации о частоте данной гаплогруппы. Народы отсортированы сверху вниз в алфавитном порядке. Для каждого народа указано его название, страна (или страны) где он был изучен, объем выборки по данному народу, ссылка на источники информации. В рекомендуемой версии применено условное форматирование: ячейки окрашены разным цветом в зависимости от того, насколько большое значение частоты в них содержится: синий цвет - частота около нуля (гаплогруппы нет или почти нет), светло-желтый - низкая частота (гаплогруппы мало), желтый - средняя частота, красный - высокая частота данной гаплогруппы у данного народа. Окрашивание ячеек может не работать в версиях Excel старше Excel-2007. Для отмены или изменения правил окрашивания ячеек следует воспользоваться функцией "условное форматирование" MS Excel. Также в рекомендуемой версии включен автофильтр, что позволяет быстро найти информацию по интересующему народу или осуществить поиск по диапазону частот интересующей гаплогруппы.

 

КАК ЦИТИРОВАТЬ:      

При использовании данной базы данных ссылаться на нее следует как: "Балановский О.П., Пшеничнов А.С., Сычев Р.С., Евсеева И.В., Балановская Е.В. Y-base: частоты гаплогрупп Y хромосомы у народов мира, 2010; www.genofond.ru"

 

КОНТАКТЫ:     

Вопросы по использованию базы данных следует адресовать Балановскому Олегу по электронной почте genepool@list.ru

  • На главную
  • Карта сайта
  • Написать письмо