Page 6 - 《渔业研究》2026年第3期
P. 6

金笑延等: 基于转录组学和代谢组学分析选育系                F 5 代与非选育系马苏大麻哈鱼卵基因表达及
                第 3 期                                 代谢物水平的差异                                         299

              nex,美国)进行非靶代谢组液相色谱−质谱分析。                         expressed metabolites,DEMs)注释到    KEGG  代谢
              一级质谱参数:分辨率:70 000,自动增益控制目                        通路上,根据       Pearson  相关性分析方法,并利用
              标值:1e6,最大离子注入时间:50 ms,扫描范围:                      Cytoscape 软件选取前     30  个显著富集通路进行绘
              150~1 500 m/z;二级质谱参数:分辨率:17 500,                 图。选育和非选育的陆封型马苏大麻哈鱼卵中显著
              自动增益控制目标值:1e5,最大离子注入时间:                          富集的共同通路的相关性网络图由武汉影子基因科
              50 ms,TopN  采集模式:选取前        10  个离子,归一化          技有限公司提供。

              碰撞能量:10、30、55。使用            Progenesis QI 软件                 表 1    色谱梯度洗脱程序
              进行物质注释鉴定。通过武汉影子基因科技有限公                                 Tab. 1    Program of hplc gradient elution
              司  Omicsmart 代谢组分析平台进行偏最小二乘判别                       时间/min       流动相/% A         流动相/% B
                                                                   Time       Mobile phase A  Mobile phase B
              ( Partial  least  squares  discriminant  analysis, PLS-
                                                                    0             98               2
              DA)分析和正交−偏最小二乘判别(Orthogonal
                                                                    1.0           98               2
              partial  least  squares  discriminant  analysis, OPLS-  5.5          0              100
              DA)分析后再进行不同组间的差异代谢物分析                                14.0            0              100
              [  变量重要性投影(Variable importance projection,           14.1           98               2
                                                                   16.0           98               2
              VIP)≥1、T-test P<0.05];数据的统计分析主要由

              R  软件(4.0  版本)完成,代谢物的数据处理会经
                                                                2 结果
              过数据过滤(样本缺少超过 80%,或质控样本缺失
              率超过    50%) 、数据填补       [  采用  K  近邻算法(K-         2.1 转录组学分析结果
              nearest neighbors imputation,KNN)]  和数据标准         2.1.1 测序质量评估
              化  [  采用概率商归一化法(Probabilistic quotient               对获得的    raw reads 利用  fastp  进行质控,过滤
              normalizaton,PQN)]。                              低质量数据     [  样本缺少超过     80%,或原始数据质量
               1.4 转录组学和代谢组学联合分析                               控制(Quality control,QC)缺失超过       50%],得到
                  比较转录组中基因参与的通路和代谢组中代谢物                        clean reads。如表  2  所示,各样本的有效数据分布
              参与的通路,获得共同参与通路数,绘制韦恩图。                           在  4.34~5.59 Gb,Q30  碱基率最低为     95.13%,平均
              将相同组的差异表达基因(Differentially expressed             GC  含量为  45.27%,说明所获得的转录组测序数据
              genes,DEGs)和差异表达代谢物(Differentially               质量良好,能够满足后续分析的要求。


                                   表 2    非选育系和选育系陆封型马苏大麻哈鱼卵转录组测序质量分析
               Tab. 2    Analysis of the transcriptome sequencing quality of non-selected and selected lines of landlocked O. masou eggs
                  组别         样本        Raw reads 数量/个   Clean reads 数量/个  Q20  值/%   Q30  值/%    GC  含量/%
                 Groups     Samples    Raw reads number  Clean reads number  Q20 value  Q30 value  GC content
                            LLMS1        46 006 174        44 259 250      98.58       95.98       44.74
                            LLMS2        45 627 412        44 012 078      98.67       96.21       45.48
                 LLMS       LLMS3        45 146 986        43 616 756      98.50       95.95       45.33
                            LLMS4        50 563 326        49 020 214      98.86       96.79       44.38
                            LLMS5        45 592 010        43 411 256      98.46       96.19       44.31

                            LBSMS1       47 220 086        44 516 596      98.59       96.07       46.18
                            LBSMS2       47 192 508        45 912 308      98.45       95.81       45.44
                 LBSMS      LBSMS3       57 758 364        55 985 890      98.12       95.13       45.02
                            LBSMS4       49 119 498        46 600 564      98.57       96.12       45.21
                            LBSMS5       46 740 826        44 317 616      98.71       96.33       46.57

               2.1.2 DEGs 分析                                   表达的影响,以错误发现率(False discovery rate,
                  为探究选育对陆封型马苏大麻哈鱼卵基因                           FDR)≤0.05、|log (FC)|≥1(FC       为差异倍数,
                                                                               2
   1   2   3   4   5   6   7   8   9   10   11