Лекция 4


The Presentation inside:

Slide 0

Введение в эволюционную и медицинскую геномику, часть II ФББ МГУ, весна 2008 Лекция 4


Slide 1

Предсказание эффекта замен аминокислот с помощью вычислительных методов Важная задача: Именно несинонимичные замены в кодирующих частях генов – основная причина существования различных фенотипов Значительная часть такой вариации – нейтральная ? задача отбора предположительно функциональных вариантов Осмысленная с точки зрения биоинформатики задача: Хорошо формализуема (данные «на входе») Большое количество контрольных данных (проверка результатов «на выходе») Большой выбор параметров, описывающих эффект замены («внутри» метода)


Slide 2

Botstein & Risch Nat Genet (2003) 33:228


Slide 3

1: Andersen MC, Engstrom PG, Lithwick S, Arenillas D, Eriksson P, Lenhard B, Wasserman WW, Odeberg J. In silico detection of sequence variations modifying transcriptional regulation. PLoS Comput Biol. 2008 Jan;4(1):e5. Epub 2007 Nov 27. 2: Barnes MR, Deharo S, Grocock RJ, Brown JR, Sanseau P. The micro RNA target paradigm: a fundamental and polymorphic control layer of cellular expression. Expert Opin Biol Ther. 2007 Sep;7(9):1387-99. Review. 3: Chen K, Rajewsky N. Natural selection on human microRNA binding sites inferred from SNP data. Nat Genet. 2006 Dec;38(12):1452-6. Epub 2006 Oct 29. 4: Chen JM, Ferec C, Cooper DN. A systematic analysis of disease-associated variants in the 3' regulatory regions of human protein-coding genes II: the importance of mRNA secondary structure in assessing the functionality of 3' UTR variants. Hum Genet. 2006 Oct;120(3):301-33. Epub 2006 Jun 29. Review. 5: Kralovicova J, Lei H, Vorechovsky I. Phenotypic consequences of branch point substitutions. Hum Mutat. 2006 Aug;27(8):803-13. PubMed: “prediction regulatory SNPs”


Slide 4

Генетика сложных заболеваний: поиск факторов // Выбор функционального варианта из двух, которые сцеплены друг с другом и оба ассоциированы с фенотипом; различение редких полиморфизмов и этиологических мутаций Генетическое консультирование: анализ врожденных дефектов (birth defects) и выбор стратегии лечения Генетика модельных организмов: определение с помощью мутагенеза генов, участвующих в биологических процессах // Поиск кандидатов для мутагенеза Геномика и эволюционная генетика: оценка давления отбора // Определение доли функциональных вариантов в популяции Замены аминокислот: примеры приложений


Slide 5

J.Cohen et al., Science (2004) 305:869-72 Генетика сложных заболеваний: пример


Slide 6

How genetic testing can help to diagnose an inherited disorder with certainty in patients X-linked lymphoproliferative disease (XLP) is a rare, life-threatening inherited disorder. In patients with XLP, infection with Epstein-Barr virus (EBV) - the virus that causes mononucleosis (known as "mono") - can lead to an out-of-control immune response, usually resulting in death within days. XLP can be cured by bone marrow transplantation. However, XLP can be difficult to diagnose with certainty and bone marrow transplantation is too risky a procedure to be performed without a definite diagnosis of XLP. Genetic testing can provide such a definitive diagnosis of XLP.   How genetic testing can help to differentiate between different forms of an inherited disorder in patients Congenital hyperinsulinism (CH) is due to a malfunction of the parts of the pancreas that are involved in producing the hormone insulin. CH leads to dangerously low blood sugar levels in newborns and infants. This inherited disorder has been associated with genetic variations in any one of at least five different genes. Treatment depends on which gene is affected and on the nature of the genetic variation and can vary from (1) drug therapy to (2) partial or (3) complete removal of the pancreas. Генетическое консультироваие: пример


Slide 7

Оценка качества метода предсказания: Чувствительность (false negatives) Специфичность (false positives) Покрытие (coverage) Контрольные наборы данных: disease mutations mutagenesis data (??) neutral nsSNPs divergence substitutions Базовые типы информации: Тип замены (Val ?Ile хорошо, Asp ? Arg плохо) Позиция замены (Ядро/поверхность, и т.д.)


Slide 8


Slide 9

PolyPhen: prediction of amino acid substitution effect on protein function Prediction: benign (neutral), damaging (deleterious)


Slide 10

I. Sequence annotation Hereditary hemochromatosis protein precursor (HLA-H, Q30201) Features checked: * bond: DISULFID, THIOLEST, THIOETH * site: BINDING, ACT_SITE, LIPID, METAL, SITE, MOD_RES, SE_CYS * region: TRANSMEM, SIGNAL, PROPEP


Slide 11

II. PSIC: profile analysis of homologous sequences Align with homologous proteins with seq. ide. 30..94%


Slide 12

II. PSIC: profile analysis of homologous sequences 2. Calculate the profile matrix with PSIC algorithm Profile matrix: Sa,j = ln[ pa,j / qa ], a = {1,..20}, j = {1,..N}, N = alignment length


Slide 13

II. PSIC: profile analysis of homologous sequences 3. Analyse difference between profile scores for two a.a. variants: Asn?Cys: ? = | SAsn,4 – SCys,4 | = 1.591


Slide 14

III. 3D structure analysis 1. Residues that are in spatial contact with a ligand or other “critical” residues Zen 999 residues in 5A contact with Zen 999 Bos Taurus trypsin [PDB ID :1ql7]


Slide 15

III. 3D structure analysis 2. Residues that form the hydrophobic core of the protein (buried residues) Bos Taurus trypsin [PDB ID :1ql7] Surface residues Buried residues


Slide 16

Structural parameters and contacts Secondary structure Phi-psi dihedral angles Solvent accessible surface area, normed s.a.s.a Change in accessible surface propensity Change in residue side chain volume Contacts with heteroatoms Interchain contacts Contacts with functional sites (BINDING, ACT_SITE, LIPID, and METAL) Region of the phi-psi map (Ramachandran map) Normalised B-factor (temperature factor)


Slide 17


Slide 18

PolyPhen, контрольные наборы данных:


Slide 19

PolyPhen predictions for dbSNP b.121 All: 9,502 unknown 27,991 benign...............67.6% 7,905 possibly damaging....19.1% 5,521 probably damaging....13.3% 50,919 total (44,005 unique rs’s) With structure: 42 unknown 2,142 benign...............57.1% 531 possibly damaging....14.2% 1,076 probably damaging....28.7% 3,791 total (,167 uniqe rs’s) [ Ivan Adzhubei, 2004 ]


Slide 20

PolyPhen predictions for dbSNP b.121 All: Filtered: ?5 seq. in multiple alignment 16,813 benign...............64.2% 5,195 possibly damaging....19.8% 4,168 probably damaging....15.9% 26,176 total (21,677 unique rs’s) With structure: Filtered: ?5 seq. in multiple alignment 2,021 benign...............56.6% 499 possibly damaging....14.0% 1,050 probably damaging....29.4% 3,570 total (2,983 unique rs’s) [ Ivan Adzhubei, 2004 ]


Slide 21

Hydrophobic core stability parameters are the best predictors Ramensky et al., Nucleic Acids Res. (2002) 30:3894-90


Slide 22

Validation: case studies APEX1 protein: 24 out of 26 substitutions predicted correctly (Xi et al.) Plasminogen activator inhibitor-2: 18 out of 20 (Di Guisto et al.) 3 HapMap populations and 10 primate species: analysis of ~27,000 nsSNPs with frequencies (Victoria Carlton, AFFYMETRIX, private communication)


Slide 23

Validation: allele frequency


Slide 24

Validation: nsSNPs vs. human-mouse interspecies variation


Slide 25

PolyPhen 2.0: New alignment pipeline: only PSIC score, FP=10%, TP: 71.6% (new ali) vs. 65.1% (old ali) IdPMax: proxy for var2, maxi{S(Mut?i)*ident(i)} Nucleotide context: conserved CpG SVM (Support Vector Machines) vs. ADT (Alternating Decision Trees)


Slide 26

PolyPhen 2.x: что еще хорошо было бы сделать Интеграция с базами данных мутаций: проверять, нет ли уже такой замены в базах SwissProt, HGMD. PolyPhen + SDPPred: замены в позиции, определяющей специфичность Компенсаторные замены: принимать во внимание не только позицию замены


Slide 27

PolyPhen http://www.bork.embl.de/PolyPhen PolyPhen input : Protein identifier OR sequence Substitution position Substitution type


Slide 28

PolyPhen http://www.bork.embl.de/PolyPhen


Slide 29

PolyPhen: nsSNPs data collection


Slide 30

DAMAGING nsSNPs Transphyretin (PDB: 1tyr, SNP000012365) Thr118 ? Asn occurs at the ligand (REA) binding site Thr 118 REA 130


Slide 31

DAMAGING nsSNPs Trypsin (PDB: 1trn, SNP000012965) Ser142?Phe results in the strong side chain volume change at a buried position Ser 142


Slide 32

PolyPhen: дитя семи нянек ЦИКЛОП ПОЛИФЕМ ПРЕДСТАВЛЯЛ СОБОЙ УНИКАЛЬНЫЙ ПОДВИД КАРЛИКОВЫХ СЛОНОВ Известия-Наука, 18 ноября 2003 Вонзая заостренное бревно в единственный глаз свирепого циклопа Полифема, легендарный Одиссей истреблял уникальный вид карликовых слонов, обитавших на острове Сицилия. Древний миф об одноглазых человекообразных исполинах развеяли итальянские палеонтологи на научной экспозиции "Полифем в Модене". На выставке представлены черепа, обнаруженные исследователями на Сицилии, у которых одна фронтальная глазница. С первого взгляда она очень напоминает глаз во лбу. Найденные рядом с черепами кости действительно принадлежат немаленькому млекопитающему, которое имело габариты крупного медведя. Обладатель этих останков был не циклопом, а карликовым слоном. "Глаз" во лбу - отверстие для дыхательных путей, то есть для хобота.


Slide 33

Polyphenism: the ability of a single genome to produce two or more alternative morphologies within a single population in response to an environmental cue (such as temperature, photoperiod, or nutrition). [Dr. Ehab Abouheif, McGill University, Montreal Quebec] The seasonal morphs of the buckeye butterfly, Precis coenia (Nymphalidae). The ventral surfaces are shown. The Summer morph ("linea") is on the left; the Fall morph ("rosa") is on the right. [Scott F.Gilbert, A Companion to Developmental Biology. Chapter 22, Seasonal Polyphenism in Butterfly Wings]


×

HTML:





Ссылка: