人类遗传统计基础--术语、概念、基础统计(ppt96)-经营管理(编辑修改稿)内容摘要:
似然比T(θ )的常用对数。 Z(θ) = log10[T(θ )] = log10[L(θ,F)/ L(θ 0,F)] 不一定最大化 Z(θ) , 而是计算一系列Z(θ) 例:腺瘤样息肉,显性遗传 (Ff), 标记等位基因 1或 2。 祖父是纯合体 f2/f2, 祖母患病已死,子女患病 /未患病 → 祖母疾病基因型 Ff, 子女标记基因有 12/22, → 祖母标记基因型 12。 但祖母可能有 2相 , Ⅰ: F1/f2, Ⅱ: F2/f1。 Ⅰ 相 ⇒ 4个非重组型, Ⅱ 相 ⇒ 4个重组型。 两相按等概处理 : L(θ )=(1θ) 4 /2 +θ 4/2=[(1θ) 4 +θ 4]/2 似然比统计量 T(θ )=L(θ )/L(1/2)=8[(1θ) 4+θ 4] Z(θ) =log10[8]+log10[(1θ) 4+θ 4] 若 θ= , Z(θ) = 例:疾病位点等位基因记为 1, 2和 3,标记位点是 HLA( 等位基因 a,b,c,d) 或 ABO血型 ( 等位基因 A,B,O) 个体 表现型 可能的基因型 父 1/3。 a/b I:1a/3b II: 1b/3a 母 3/3。 c/d 3c/3d 子 3/3。 a/c 3a/3c 女 3/3。 b/c 3b/3c 父 I型下子重组, II型下女重组,似然函数为 L(θ )=θ(1 θ )/2+(1θ )θ/2=θ(1 θ ) L(1/2)=1/4⇒ Z(θ)=log[4 θ(1 θ )] 个体 表现型 可能的基因型 父 ━ I:1a/3b II: 1b/3a 母 3/3。 c/d 3c/3d 子 1/3。 a/c 1a/3c 女 1/3。 b/c 1b/3c 女 3/3。 a/d 3a/3d 父表现型未知,通过其他成员得其可能的基因型。 I型下 2重组, II型下 1重组, 似然函数: L(θ ) =θ 2(1θ )/2+(1θ )2θ/2 =θ(1 θ )/2 L(1/2)=1/8⇒ Z(θ)=log[4 θ(1 θ )]⇒ 此 3子女信息量与上面 2子女同 个体 表现型 可能的基因型 父 1/3。 O 1o/3o 母 1/3。 A I: 1a/3o II: 1o/3a 子 1/3。 O 1o/3o 子 1/3。 O 1o/1o 子 3/3。 A 3a/3o 因子有 O型血 ,故母亲杂合。 I下若 1st子的 1o来自母亲则为重组 ,来自父亲为非重组, II型下反之。 给定任意1型,其概率为: [θ/2+(1 θ)/2 ]/2=1/4,是常数,在 LOD里消掉,无信息贡献。 次子与三子在 I型下重组。 L(θ ) =θ 2/2+(1θ )2/2=[θ 2+(1θ )2]/2 Z(θ)=log2+log[ θ 2+(1θ )2] 个体 表现型 可能的基因型 父 ━ p2:3a/3o 2p(1p): 3a/xo或 3o/xa 母 1/1。 O 1o/1o 女 1/3。 O 3o/1o 子 1/3。 A 3a/1o 子 1/3。 O 3o/1o 父的 ABO基因必是 a/o, 疾病位点只考虑 3,把其他并为“ x‖。 记 3的基因频率为 p,有 3种可能的基因型: 1: 3/3,此时 3个子女基因型出现概率为 1/2,条件似然 Lc为 1/8,无连锁信息。 此情形出现的概率为 p2。 2: 3/x,若 3a/xo, 则长子非重组,其余 2子女重组, Lc=θ 2(1θ )/8。 3o/xa下反之 , Lc=θ (1θ )2/8。 加总得 Lc =θ (1θ )/16, 其概率 2p(1p)。 把条件似然按概率加权求和得到 : L(θ )=p2/8+p(1p)θ (1θ )/8 ⇒ Z(θ,p)=log{4[θ(1θ)(1p)+p]/(1+3p)} Zmax在 θ=1/2处达到 (Zmax=0) ,其他 lod皆为负值。 Z(θ,p)除了随 θ改变而外,还依赖于参数 p。 ◇ 多个齐性家系的资料, Z(θ) 值可以累加 (固定 θ)。 一般以表格形式报告连锁分析结果,列是不同 θ 的值,行是不同的家系。 ◇ 由于不完全外显、信息缺失、男女重组率不同等原因, Z(θ) 一般需通过计算机程序计算。 ◇ 资料如果有偏,似然函数 L(θ )会受影响,但 似然比统计量 T(θ )(因而 Z(θ) )不受影响,因为分子分母同时受影响而抵消。 ◇ 一般 θ 从 0以步长 1/2,计算一系列的 Z(θ) 值 ◆ Morton双位点连锁分析 当 – 2 Z(θ) 3 → 继续抽样 当 Z(θ) ≧ 3 → 推断有连锁, 当 Z(θ) ≦ 2 → 无连锁 α=,β = 对 X连锁位点,上界为 2即可。 ~ χ 21, 3=→ 渐近p= 因单尾,渐近 p= 当考虑男女 θ 不同,应取 ,否则 p实际上 =。 ◆ Morton后验 Ⅰ 类错误概率 P(H0|s)=P(s|H0)p(H0)/ [P(s|H0)p(H0)+ P(s|H1)p(H1)] 一般认为 p(H1)=(在 44条染色体中,2基因位于同 1条上的概率为 ) ,若β =,α= →% 的后验 ◆ 为什么连锁分析里设定的 α 那么小。 为了使 Morton后验 Ⅰ 类错误概率不过大 ◆ 简单假设下的切贝雪夫不等式p(T(θ )≧ Tc|H0)≤1/Tc 对广义似然比检验 (此时 θ 不事先设定,而是估出 )仍成立: p(Zmax≧Z c|H0)≤10 Zc 例如 Zc=3对应的 p值上界是。 ◆ 任何观察到的 Zmax,对应了一个不超过10Zmax的经验 P值。 例如 Zmax=4对应的经验p值 ≦ , Zmax= p值 ≦。 ◆ θ 的 1单位支持区间 :高度为 Zmax1的横线与 Z(θ) 曲线产生两个交点。 若 Z(θ) 在 θ=0 时最大,则下界取 0。 ~ χ 21, 1个 Z(θ) 单位乘以 χ 2单位。 一个对 θ =θ 0的 χ 2检验在 χ 2达到 时对应了一个。 因此,上述 支持区间有时被看作渐近置信区间,置信度%。 按切贝雪夫不等式 p(Zmax≧Z c|H0)≤10– Zc, 置信度下界为 90%。 为了使 支持区间一致于检验,仅当 Zmax≧3 时才构造 3单位支持区间。 ◆ 等量观察数 当 k/n已知,则 k/n=θ e为 θ 的 MLE, 对 θ e≠ 0: Zmax =nlog2+(nk)log(1θ e) + klogθ e =nlog2+n(1θ e)log(1θ e) +nθ elogθ e =n[log2+(1θ e)log(1θ e) +θ elogθ e] Zmax =nlog2 当 θ e=0 ⇒ 解出 n : n= Zmax / [log2+(1θ e)log(1θ e) +θ elogθ e] 当 θ e≠ 0 n= Zmax / log2。人类遗传统计基础--术语、概念、基础统计(ppt96)-经营管理(编辑修改稿)
相关推荐
e cutting board back out and put the items back onto the cutting board. Guess which switch controls the projector screen? This picture shows a projector screen in a conference room. The white screen
赖的正确意义,是互助而非倚赖。 例如有甲、乙两人,如果“甲的义务,即系乙的权利;同时乙的义务,亦即甲的权利”,互相消而又互相益,便是互助。 推而至于分工合作,成为更复杂的互助。 中国象棋 的十六个成员最能体现互赖的精神。 虽然他们各自可以独立作战,不必也不能依赖他人。 但是它们之间,却是互助合作的。 车固然可以保护马,马也可以“看”住车,不让它平白遭受对方的攻击。 士、象当然是将的心腹
同的策略。 在发展亲和感的过程中,了解别人做事情所使用的策略,就像得到某人心灵配臵图一样。 “ 能否告诉我你在买房子的愉快、满足的经验。 ” , “ 哦,当然,我还刻,那栋房子是我和太太及孩子们一起看的。 ” “ 史密斯先生,请您告诉我,使你下决心要习那个房子的第一个理由是什么。 ” A。 是因为你看到了什么东西吗。 B是因为你听到某些东西吗。 C是因为你碰触到什么
性别对群体人尺寸差别的影响也许是最大的 . 对比表 21和 22我们可以看出 , 男女之间的平均身高相差为 10 厘米以上 . 如果我们按男性 95% 设计的达到高度将有 50%以上的女性达不到 . 有趣的是在消费品的设计中我们常常能够考虑女性的要求 , 如女式服装 , 女式自行车 , 而在机器的设计中往往忽略了这个因素 , 如我们很少听到有女式车床 , 女式办公桌等 . 这大概是女性在消费
tandem repeats STR 单核苷酸多态性标记 :既 SNP (single nucleotide polymorphism).109左右, 300万个 1/1000bp 来自 中国最大的资料库下载 构建遗传图谱的基本原理 真核生物遗传过程中会发生减数分裂, 在减数分裂过程中染色体要进行重组和交换。
的定义可以从不的角度去探讨;二是知识虽然无处不在,无时没有,但却很难作出准确的界定。 国家科技领导小组办公室在《关于知识经济与国家知识基础设施的研究报告》中,对 “ 知识 ” 做出如下定义: “ 经过人的思维整理过的信息、数据、形象、意象、价值标准以及社会的其它符号产物,不仅包括科学技术知识 ── 知识中最重要的部分,还包括人文社会科学的知识、商业活动、日常生活和工作中的经验和知识,人们获取