歡迎先看前面的博客,再繼續進行后面的內容:
群體遺傳學_tRNA做科研的博客-CSDN博客
當雜合子的適應度超出純合子的范圍時,二倍體能夠展現出更多令人著迷的選擇實例。這種形式的一種是雜合子優勢,或稱為“超顯性”,其中雜合子的適應度甚至高于任何一種純合子。超顯性的經典例子是在瘧疾高發地區,人類鐮狀細胞貧血的血紅蛋白等位基因。在瘧疾猖獗的地區,由于改變的紅細胞增加了對瘧疾的抵抗力,雜合子具有適應度優勢。然而,純合子患有貧血癥,盡管有抗瘧疾能力,但總體適應度成本較高。 這似乎導致了一個穩定的平衡,其中等位基因頻率通過選擇保持在一定水平。如果它的頻率上升到足夠高的水平,以至于產生更多的純合子,適應度成本會導致更少的這些等位基因被傳遞下去。如果它的頻率較低,就會產生雜合子,并且由于平均適應度優勢,該等位基因的頻率會增加。讓我們看一下Allison(1956)的數據,該數據收集了坦桑尼亞600多名個體的血紅蛋白S的血紅蛋白基因型數據。 讓我們在哈代-溫伯格預測下驗證觀察到的和預期的比例。
# 定義觀察到的各基因型數量
AA <- 400
AS <- 249
SS <- 5# 計算總個體數
n <- AA + AS + SS# 計算等位基因S的頻率
p <- (SS + AS/2) / n# 根據哈迪-溫伯格定律計算期望的各基因型數量
EAA <- n * (1-p)^2
EAS <- n * 2 * p * (1-p)
ESS <- n * p^2# 打印觀察到的和期望的基因型頻率
print(paste("Observed:", AA/n, AS/n, SS/n))
print(paste("Expected:", EAA/n, EAS/n, ESS/n))# 將觀察到的和期望的基因型數量放入向量
geno <- c(AA, AS, SS)
expe <- c(EAA, EAS, ESS)# 計算哈迪-溫伯格平衡的卡方統計量G
G <- 2 * sum(geno * log(geno/expe))# 打印卡方統計量G
print(paste("G:", G))# 計算G統計量的P值,判斷是否符合哈迪-溫伯格平衡
pvalue <- pchisq(G, df=1, lower.tail=FALSE)# 打印P值
print(paste("P-value:", pvalue))
與我們之前看到的血紅蛋白S數據不同:【基于R語言群體遺傳學】-6-表型計算等位基因頻率、最大似然估計方法-CSDN博客
基于我們的似然比檢驗,這些值與哈代-溫伯格預測相差很大。考慮到我們對雜合子潛在適應度優勢的了解,預期維持這種等位基因頻率的雜合子適應度優勢的大小是多少? 我們可以通過設置等位基因的平均適應度相等來計算這個平衡點。讓s代表頻率為p的導致鐮狀細胞的等位基因,a代表常見的血紅蛋白等位基因,有三種基因型適應度:wss、wsa、waa。s等位基因要么與自己配對,頻率為p,適應度為wss,要么與a配對,頻率為1?p,適應度為wsa。這給出了平均等位基因適應度為:?
?
同樣可以得到a等位基因的適應度為:
?
繼續推導:?
?
得到雜合子適應性:
?
Allison(1956)估計在坦桑尼亞穆索馬,wss的閾值為0.2。如果我們設waa的相對適應度為1,并假設觀察到的等位基因頻率處于平衡狀態(p = 0.199),我們可以計算假設的雜合子適應度。
p
w_ss <- 0.2
w_aa <- 1
(w_sa <- (p*(w_ss+w_aa)-w_aa) / (2*p-1))
?
那么,如果瘧疾能夠被有效地根除,我們會期待發生什么呢?使用我們估計的雜合子抵抗瘧疾所帶來的適應度優勢,即使在面對等位基因在純合子中配對時帶來的重大健康成本,讓我們看看s等位基因的多個起始等位基因頻率的影響。然后,讓我們看看如果我們去除疾病帶來的壓力會發生什么。我們可以重新利用我們之前編寫的FitFreq函數。
# 設置初始等位基因頻率
init_p <- p# 定義適應度值
w_ss <- 0.2 # 純合隱性基因型的適應度
w_aa <- 1 # 純合顯性基因型的適應度
w_sa # 雜合基因型的適應度# 定義模擬的代數
gen <- 50# 創建適應度場景列表
w <- list(c(w_ss, w_sa))# 創建初始等位基因頻率矩陣
p <- matrix(c(0.01, 0.1, 0.2, 0.5, 0.9))# 生成迭代序列
iter <- seq_along(p)# 循環模擬每一代的變化
for(i in 1:(gen-1)){# 更新等位基因頻率矩陣p <- cbind(p, lapply(iter,function(i, y, n) {FitFreq(y[[1]], n[[i]])},y=w, n=p[,ncol(p)]))
}# 繪制圖形,設置x軸和y軸的標簽及范圍
plot(x=NULL, xlab="Generations", ylab="Allele frequency",xlim=c(1,2*gen), ylim=c(0, 1))# 繪制第一種適應度情景下的等位基因頻率變化曲線
for(i in 1:nrow(p)){lines(1:gen, p[i,], lwd=2, col="blue")
}# 創建第二種適應度情景
w <- list(c(w_ss, 1))# 重置等位基因頻率矩陣為初始頻率
p <- matrix(init_p)# 重新生成迭代序列
iter <- seq_along(p)# 再次循環模擬每一代的變化
for(i in 1:gen){# 更新等位基因頻率矩陣p <- cbind(p, lapply(iter,function(i, y, n) {FitFreq(y[[1]], n[[i]])},y=w, n=p[,ncol(p)]))
}# 繪制第二種適應度情景下的等位基因頻率變化曲線
for(i in 1:nrow(p)){lines(gen:(2*gen), p[i,], lwd=2, col="red")
}
?
從結果圖中,我們可以看到,如果失去適應度優勢(即如果瘧疾在很大程度上被根除),并且雜合子的適應度與普通純合子相等,s等位基因預計將在另外50代中從0.2下降到約十分之一(1/10)的平衡頻率,即約0.02,患貧血癥的SS純合子的比率將從4%(1/25)下降到兩個數量級,即0.04%(1/2500)。
雜合子優勢的反面是次顯性:雜合子的適應度低于任何一種純合子。這種形式的常見例子是在染色體重排中,例如相互易位,其中兩條非同源染色體交換片段。對于平衡易位的雙雜合子個體,其一半的配子是不平衡的,受精后會導致來自部分非整倍體的有害基因劑量效應。一個有用的近似是,雜合子的適應度是純合子的一半,以模擬動態。
?
次顯性平衡可以使用與超顯性情況相同的公式和邏輯來計算:
?
讓我們計算我們的平衡等位基因頻率:
w_ss <- 0.9
w_sa <- 0.5
(p_eq <- (1- w_sa)/(w_ss-2*w_sa + 1))
如果我們的平衡等位基因頻率略高于50%,讓我們看看從起始等位基因頻率在0.1到0.9范圍內,我們可以預期什么樣的等位基因頻率軌跡。
# 定義模擬的代數
gen <- 20# 創建適應度場景列表
w <- list(c(w_ss, w_sa))# 創建初始等位基因頻率矩陣,頻率從0.1到0.9,步長為0.1
p <- matrix(seq(0.1, 0.9, 0.1))# 生成迭代序列
iter <- seq_along(p)# 循環模擬每一代的變化
for(i in 1:(gen-1)){# 更新等位基因頻率矩陣p <- cbind(p, lapply(iter,function(i, y, n) {FitFreq(y[[1]], n[[i]])},y=w, n=p[,ncol(p)]))
}# 繪制圖形,設置x軸和y軸的標簽及范圍
plot(x=NULL, xlab="Generations", ylab="Allele frequency",xlim=c(1,gen), ylim=c(0, 1))# 繪制不同初始頻率下的等位基因頻率變化曲線
for(i in 1:nrow(p)){lines(1:gen, p[i,], lwd=2, col="blue")
}# 創建一個新的等位基因頻率矩陣,初始頻率為平衡頻率 p_eq
p <- matrix(p_eq)# 再次循環模擬每一代的變化
for(i in 1:(gen-1)){# 更新等位基因頻率矩陣p <- cbind(p, lapply(1,function(i, y, n) {FitFreq(y[[1]], n[[i]])},y=w, n=p[,ncol(p)]))
}# 繪制平衡頻率下的等位基因頻率變化曲線,使用虛線表示
lines(1:gen, p, lwd=2, lty="dashed", col="blue")
?
從這個結果中,我們可以看到,起始等位基因頻率低于我們的平衡頻率的很快就會趨向滅絕,而那些起始略高于平衡頻率的則有望在不久之后增加到接近固定。與超顯性不同,次顯性平衡是不穩定的,等位基因頻率傾向于遠離它,而不是趨向它。因為稀有等位基因最常以雜合子的形式出現,次顯性轉化為稀有等位基因的不利,稀有等位基因傾向于丟失,即使較罕見的純合子比另一種更適應。同樣,超顯性被認為是稀有等位基因的優勢,因為稀有等位基因傾向于存在于雜合子中,導致穩定的多樣性。這說明了受倍性和適應度差異約束的進化軌跡如何被困在適應性較低的局部適應度“高峰”上的一個例子。 在種群遺傳學的早期,人們推測廣泛的超顯性可能解釋了為什么物種中存在如此多的遺傳變異。然而,這些假設在很大程度上已經不再受歡迎,現在大量的遺傳變異被認為是在選擇上是中性的。