测序数据中的常见概念

测序数据常见概念

reads:此次数据中所有小纸条数量
counts:此次测序中某基因的小纸条数量
同一样本中不同基因counts大小的决定因素:表达量、基因长度、测序深度
不同样本中相同基因counts大小的决定因素:表达量、测序深度(测序的策略啥的不同)
所以想比较表达量必须对counts进行标准化
RPK:平衡了基因长度的影响,可做组比较
RPKM/FPKM:在RPK基础上,平衡了样本内的测序深度,可做组比较
TPM:(归一化处理+平衡基因长度、测序深度)使各样本内部所有基因的表达量值之和都相同,可做组内,也可组间
CPM:(only归一化处理,未平衡长度与深度),只能组间比较,不能组内比较

Attachments/Pasted image 20250926222236.png