人类遗传统计基础--术语、概念、基础统计(ppt96)-经营管理(编辑修改稿)内容摘要:

似然比T(θ )的常用对数。 Z(θ) = log10[T(θ )] = log10[L(θ,F)/ L(θ 0,F)]  不一定最大化 Z(θ) , 而是计算一系列Z(θ) 例:腺瘤样息肉,显性遗传 (Ff), 标记等位基因 1或 2。 祖父是纯合体 f2/f2, 祖母患病已死,子女患病 /未患病 → 祖母疾病基因型 Ff, 子女标记基因有 12/22, → 祖母标记基因型 12。 但祖母可能有 2相 , Ⅰ: F1/f2, Ⅱ: F2/f1。 Ⅰ 相 ⇒ 4个非重组型, Ⅱ 相 ⇒ 4个重组型。 两相按等概处理 :  L(θ )=(1θ) 4 /2 +θ 4/2=[(1θ) 4 +θ 4]/2  似然比统计量 T(θ )=L(θ )/L(1/2)=8[(1θ) 4+θ 4]  Z(θ) =log10[8]+log10[(1θ) 4+θ 4]  若 θ= , Z(θ) = 例:疾病位点等位基因记为 1, 2和 3,标记位点是 HLA( 等位基因 a,b,c,d) 或 ABO血型 ( 等位基因 A,B,O) 个体 表现型 可能的基因型 父 1/3。 a/b I:1a/3b II: 1b/3a 母 3/3。 c/d 3c/3d 子 3/3。 a/c 3a/3c 女 3/3。 b/c 3b/3c 父 I型下子重组, II型下女重组,似然函数为 L(θ )=θ(1 θ )/2+(1θ )θ/2=θ(1 θ ) L(1/2)=1/4⇒ Z(θ)=log[4 θ(1 θ )] 个体 表现型 可能的基因型 父 ━ I:1a/3b II: 1b/3a 母 3/3。 c/d 3c/3d 子 1/3。 a/c 1a/3c 女 1/3。 b/c 1b/3c 女 3/3。 a/d 3a/3d 父表现型未知,通过其他成员得其可能的基因型。 I型下 2重组, II型下 1重组, 似然函数: L(θ ) =θ 2(1θ )/2+(1θ )2θ/2 =θ(1 θ )/2 L(1/2)=1/8⇒ Z(θ)=log[4 θ(1 θ )]⇒ 此 3子女信息量与上面 2子女同 个体 表现型 可能的基因型 父 1/3。 O 1o/3o 母 1/3。 A I: 1a/3o II: 1o/3a 子 1/3。 O 1o/3o 子 1/3。 O 1o/1o 子 3/3。 A 3a/3o 因子有 O型血 ,故母亲杂合。 I下若 1st子的 1o来自母亲则为重组 ,来自父亲为非重组, II型下反之。 给定任意1型,其概率为: [θ/2+(1 θ)/2 ]/2=1/4,是常数,在 LOD里消掉,无信息贡献。 次子与三子在 I型下重组。 L(θ ) =θ 2/2+(1θ )2/2=[θ 2+(1θ )2]/2 Z(θ)=log2+log[ θ 2+(1θ )2] 个体 表现型 可能的基因型 父 ━ p2:3a/3o 2p(1p): 3a/xo或 3o/xa 母 1/1。 O 1o/1o 女 1/3。 O 3o/1o 子 1/3。 A 3a/1o 子 1/3。 O 3o/1o 父的 ABO基因必是 a/o, 疾病位点只考虑 3,把其他并为“ x‖。 记 3的基因频率为 p,有 3种可能的基因型: 1: 3/3,此时 3个子女基因型出现概率为 1/2,条件似然 Lc为 1/8,无连锁信息。 此情形出现的概率为 p2。 2: 3/x,若 3a/xo, 则长子非重组,其余 2子女重组, Lc=θ 2(1θ )/8。 3o/xa下反之 , Lc=θ (1θ )2/8。 加总得 Lc =θ (1θ )/16, 其概率 2p(1p)。 把条件似然按概率加权求和得到 : L(θ )=p2/8+p(1p)θ (1θ )/8 ⇒ Z(θ,p)=log{4[θ(1θ)(1p)+p]/(1+3p)} Zmax在 θ=1/2处达到 (Zmax=0) ,其他 lod皆为负值。 Z(θ,p)除了随 θ改变而外,还依赖于参数 p。 ◇ 多个齐性家系的资料, Z(θ) 值可以累加 (固定 θ)。 一般以表格形式报告连锁分析结果,列是不同 θ 的值,行是不同的家系。 ◇ 由于不完全外显、信息缺失、男女重组率不同等原因, Z(θ) 一般需通过计算机程序计算。 ◇ 资料如果有偏,似然函数 L(θ )会受影响,但 似然比统计量 T(θ )(因而 Z(θ) )不受影响,因为分子分母同时受影响而抵消。 ◇ 一般 θ 从 0以步长 1/2,计算一系列的 Z(θ) 值 ◆ Morton双位点连锁分析  当 – 2 Z(θ) 3 → 继续抽样  当 Z(θ) ≧ 3 → 推断有连锁,  当 Z(θ) ≦ 2 → 无连锁  α=,β =  对 X连锁位点,上界为 2即可。  ~ χ 21, 3=→ 渐近p= 因单尾,渐近 p=  当考虑男女 θ 不同,应取 ,否则 p实际上 =。 ◆ Morton后验 Ⅰ 类错误概率  P(H0|s)=P(s|H0)p(H0)/  [P(s|H0)p(H0)+ P(s|H1)p(H1)]  一般认为 p(H1)=(在 44条染色体中,2基因位于同 1条上的概率为 ) ,若β =,α= →% 的后验 ◆ 为什么连锁分析里设定的 α 那么小。 为了使 Morton后验 Ⅰ 类错误概率不过大 ◆ 简单假设下的切贝雪夫不等式p(T(θ )≧ Tc|H0)≤1/Tc 对广义似然比检验 (此时 θ 不事先设定,而是估出 )仍成立: p(Zmax≧Z c|H0)≤10 Zc 例如 Zc=3对应的 p值上界是。 ◆ 任何观察到的 Zmax,对应了一个不超过10Zmax的经验 P值。 例如 Zmax=4对应的经验p值 ≦ , Zmax= p值 ≦。 ◆ θ 的 1单位支持区间 :高度为 Zmax1的横线与 Z(θ) 曲线产生两个交点。 若 Z(θ) 在 θ=0 时最大,则下界取 0。  ~ χ 21, 1个 Z(θ) 单位乘以 χ 2单位。 一个对 θ =θ 0的 χ 2检验在 χ 2达到 时对应了一个。 因此,上述 支持区间有时被看作渐近置信区间,置信度%。 按切贝雪夫不等式 p(Zmax≧Z c|H0)≤10– Zc, 置信度下界为 90%。  为了使 支持区间一致于检验,仅当 Zmax≧3 时才构造 3单位支持区间。 ◆ 等量观察数 当 k/n已知,则 k/n=θ e为 θ 的 MLE, 对 θ e≠ 0:  Zmax =nlog2+(nk)log(1θ e) + klogθ e  =nlog2+n(1θ e)log(1θ e) +nθ elogθ e  =n[log2+(1θ e)log(1θ e) +θ elogθ e]  Zmax =nlog2 当 θ e=0  ⇒ 解出 n :  n= Zmax / [log2+(1θ e)log(1θ e) +θ elogθ e]  当 θ e≠ 0  n= Zmax / log2。
阅读剩余 0%
本站所有文章资讯、展示的图片素材等内容均为注册用户上传(部分报媒/平媒内容转载自网络合作媒体),仅供学习参考。 用户通过本站上传、发布的任何内容的知识产权归属用户或原始著作权人所有。如有侵犯您的版权,请联系我们反馈本站将在三个工作日内改正。