Page 18 - 《渔业研究》2026年第1期
P. 18
第 1 期 李 娴等: 乌鳢生长性状全基因组关联分析 15
鳢科(Channidae) 、鳢属(Channa) ,是中国重 长性状进行描述性统计分析,计算各性状的最大
要的淡水经济鱼类。乌鳢生长速度快、环境适应性 值、最小值、中位数、平均值和标准差等,并进行
强,肉质细腻、营养丰富、无肌间刺,是预制水产 独立样本 t 检验和相关性分析。
品的主要来源之一,市场前景广阔 [5-6] 。然而,随 1.3.2 测序数据分析
着养殖规模的扩大和养殖密度的增加,以及养殖企 经 Illumina Nova 高通量测序的原始图像数据
业长期自养自繁等原因,乌鳢种质资源逐渐退化, 序列用碱基识别后转化为原始测序序列(Raw
出现生长变缓、病害频发、成活率低等现象,严重 Reads) ,其结果以 FASTQ(简称为 fq)文件格式
影响了其商品价值和养殖效益。因此,开展乌鳢种 存储。使用预处理软件 fastp 对 Raw Reads 进行质
质资源保护和新品种培育已成为产业可持续发展的 量过滤,去除接头序列、N 碱基≥5 和平均碱基质
重要需求。目前,乌鳢的良种培育主要以杂交鳢为 量值<20 的 Reads,获取 Clean Reads。利用 BWA [9]
[7]
主 ,尚未有采用 GWAS 方法开展乌鳢经济性状 软件将 Clean Reads 比对到参考基因组上,根据比
选育的报道。为深入分析乌鳢生长性状的遗传基 对结果统计样品深度信息并计算测序数据对乌鳢参
础,定位相关候选基因,本研究选择体质量和体 考基因组(Accession:PRJNA721844)的覆盖度。
长 2 个生长性状为目标性状,采用 GWAS 方法寻 使用 Qualimap [10] 统计各样本的插入片段长度分布。
找目标性状关联的 SNP 位点和候选功能基因,以 1.3.3 SNP 注释
期为乌鳢的种质资源保护、良种创制和持续利用提 基于样本与参考基因组的比对结果,使用
供基础资料。 GATK4 [11] 软件的 Haplotypecaller 模块进行 SNP 检
测。QD 是突变质量值(Quality)除以覆盖深度
1 材料与方法
(Depth)得到的比值,以 QD≥2.0 进行过滤,降
1.1 实验材料 低 SNP 和 InDel 检测的错误率,只保留同时满足
实验材料选择微山乌鳢省级原种场同批次繁育 该条件的突变位点。使用 VCFtools [12] 进一步过
的乌鳢,均一化养殖至 12 月龄,共选取 13 个家系 滤,保留 Reads 支持深度不小于 4 的位点,去除最
405 尾乌鳢用于分析。分别使用卡尺和电子天平测 小等位基因频率(Minor allele frequency,MAF)
量乌鳢的全长(精确到 0.01 cm)和体质量(精确 小于 0.01 的位点,保留 80% 的个体能够分型的位
到 0.01 g) 。剪取乌鳢胸鳍,置于无水乙醇中,24 h 点。对于有注释文件(gff 文件)的基因组,使用
后换液,在−20 ℃ 冰箱中保存。山东省淡水渔业研 SnpEff [13] 软件对得到的 SNP 进行注释,以确定
究院批准动物实验,批准编号为 LLSC2025001。 SNP 在基因元件的位置、对氨基酸的变化影响等。
1.2 文库构建与测序 1.4 全基因组关联分析
样品使用 TIANGEN 动物基因组抽提试剂盒 使用 EMMAX 软件的高效混合模型进行 SNP
进行基因组 DNA 提取,再使用分光光度计检测 标记和 GWAS 分析,以基因型为主要自变量、表
DNA 纯度(OD260/OD280 比值) ,并通过琼脂糖 型值为因变量,同时考虑并控制群体结构、亲缘关
凝胶电泳分析 DNA 纯度和完整性。DNA 抽提质检 系等其他因素可能造成的假阳性。GWAS 的主要
合格后,利用 Super-GBS 技术 [8] 构建测序文库, 结果是每个 SNP 位点(或其他类型的标记)与表
采用 PstI-HF/MspI 酶切 DNA,酶切后的片段两端 型的相关性程度,一般用 P 值表示,每个 SNP 能
通过 T4 连接酶加接头和 barcode,使用磁珠回收系 得到 1 个相对应的统计概率 P 值。零假设为该
统回收 300~700 bp 的片段,对回收片段使用高保 SNP 位点与表型无关,备择假设为该 SNP 位点与
真酶进行聚合酶链式反应(Polymerase chain reac- 表型有关,当在零假设下得到的 P 值很小时,表示
tion,PCR)扩增,使用 Qubit 测定 PCR 产物浓度 该 SNP 位点与表型无关的可能性很小,也就是说
(浓度需大于 5 ng/μL) ,而后使用 Illumina Nova 该 SNP 位点很可能与表型相关,这类 SNP 位点优
(PE150)平台,将各样本按照一定浓度进行混库 先进行下一步的实验验证。研究使用 2 种阈值筛选
上机测序。 强显著性位点,第 1 种控制错误发现率(False
1.3 数据分析 discovery rate,FDR)法是由 Yoav 等 [14] 提出的通
1.3.1 表型数据分析 过控制错误发现的概率对 P 值进行调整的方法;
使用 Excel 和 SPSS 软件对测得的体质量和全 第 2 种 Bonferroni 校正法是多重比较中控制假阳性

