【遺伝統計学の基礎】第1章を読みました
【これならわかる深層学習】は少しお休み。
山田亮 【遺伝統計学の基礎】を読んでいこうと思います。
『遺伝統計学の基礎』オーム社 - StatGenetKyotoU
受講生から遺伝統計学について教えてほしいという依頼があったので読んでみることに。教えるというより、一緒に学ぶ感じでも良いということだったので引き受けました。まずは、遺伝子について知らないと・・・。
形質の観察データ=フェノタイプ(表現型) 染色体 = DNA分子 + それを取り巻くタンパク質 染色体 = 核染色体とミトコンドリア染色体 核染色体 = 常染色体22本 + 性染色体1本(XX母由来, XY父由来)
#染色体の長さ chromLen <- c(247249719,242951149,199501827,191273063,180857866,170899992,158821424,146274826,140273252,135374737,134452384,132349534,114142980,106368585,100338915,88827254,78774742,76117153,63811651,62435964,46944323,49691432,154913754,57772954) #棒グラフ barplot(chromLen, names=c(1:22, "X", "Y"), col="black")
染色体の特定の部位が持つ情報 = 遺伝子座(ローカス)
DNA分子は、4種類の塩基(A,T,G,C)と呼ばれる部分が線状に並んだ構造をしている。 長さ1の塩基部分を遺伝子座とみなした時、1塩基多型(SNP)と呼び、その座を占める塩基のバリエーションをアレルという。
ある長さに渡っての遺伝子座とみなして考える時はハプロタイプという。 →ちょっとテキストは日本語怪しくない?
ある形質に関するDNA上の情報が連続してコードされている場合と不連続にコードされている場合がある。 不連続の場合は、1つ1つをエクソン、その間をイントロンという。