Сборка транскриптома De Novo на основе РНК-секвенирования и открытие гена мясистого стебля Cistanche Deserticola-Ⅱ
Jul 24, 2024
Функциональная классификация всех экспрессируемых транскриптов на основе онтологии генов и баз данных KEGG
Аннотация Gene Ontology (GO) была получена из файла аннотаций UniProt и ассоциации идентификаторов. Всего 20 907 транскриптов, что составляет 32,69% от общего числа экспрессируемых последовательностей, были отнесены к 1745 функциональным терминам. Из общего количества функциональных терминов ГО большую часть (1116, 63,95%) составили отнесения к биологическим процессам, за которыми следовали клеточный компонент (329, 18,85%) и молекулярная функция (300, 17,20%). Назначенные функции экспрессируемых транскриптов охватывают широкий диапазон категорий ГО, а 10 основных терминов ГО с наибольшим количеством аннотированных транскриптов перечислены в Таблице 3. Мы предоставляем распределение всех экспрессируемых транскриптов по трем категориям генной онтологии (молекулярная функция, клеточный компонент и биологический процесс) в дополнительном файле (набор данных S3). Термины GO, связанные с функциями связывания и трансферазной активностью, преимущественно были представлены в категории молекулярных функций. Что касается функций связывания, то связывание катионов (4394 транскрипта) было наиболее распространенным, за ним следовали связывание нуклеотидов/нуклеозидов (в среднем 3404 транскрипта) и связывание белков (2422 транскрипта). В группе трансферазной активности больше всего тех, у которых переносятся фосфорсодержащие группы (2256 транскриптов, 65,77%). Среди категории клеточных компонентов транскрипты были более локализованы внутриклеточно (в среднем 10 581 транскрипт), тогда как среди категории биологических процессов транскрипты были более вовлечены в метаболический процесс биополимера (в среднем 6 683 транскрипта), а затем в регуляцию клеточных процессов (4 841 транскрипт). ), экспрессия генов (4678 транскриптов) и транспорт (3512 транскриптов).

НАТУРАЛЬНЫЙ ЦИСТАНХ ТУБУЛОЗНЫЙ ДЛЯ ПРЕДОТВРАЩЕНИЯ БОЛЕЗНИ АЛЬЦГЕЙМЕРА PHGS75% ECH 30% ACT 12%
Для анализа генов, участвующих в биосинтезе лигнина и PhG, было найдено 21 358 неизбыточных потенциальных белковых последовательностей против последовательностей генов 13 растительных организмов в базе данных KEGG, и они были отнесены к 275 путям KEGG с как минимум 5 совпадениями. Топ-10 путей с наиболее выровненными последовательностями перечислены в Таблице 4. Большинство путей были вовлечены в первичные метаболические процессы, такие как метаболизм аминокислот или белков (ko01230, ko04141 и ko04120), метаболизм углеводов (ko01200 и ko00500), а также метаболизм нуклеотидов или нуклеозидный метаболизм (ко03018, ко00230 и ко00240). Кроме того, существует 27 вторичных путей, связанных с метаболизмом (рис. 2), таких как биосинтез терпеноидного остова, биосинтез фенилпропаноидов, биосинтез каротиноидов, биосинтез алкалоидов изохинолина и биосинтез алкалоидов тропана, пиперидина и пиридина. Эти результаты еще раз указывают на то, что в организме человека происходят активные метаболические процессы.С. пустыннаястеблевая ткань. Все экспрессированные транскрипты, связанные с путями KEGG, были перечислены в дополнительном файле (набор данных S4). Хотя существуют некоторые существенно измененные пути между C. Deserticola и другими растениями, такими как рис (набор данных S5), наша главная цель в этом исследовании — выявить весь профиль транскриптома стебля C. Deserticola и представить связанные пути биосинтеза PhG. что может быть полезно для руководства выращиванием.

Гены-кандидаты, кодирующие ферменты, участвующие в биосинтезе лигнина
Лигнин является вторым по распространенности природным наземным полимером в растительном мире, составляя до одной трети материала, содержащегося в стенках растительных клеток. Являясь важным компонентом клеточных стенок, лигнины помогают транспортировать воду, обеспечивают механическую поддержку и структурную целостность, а также защищают от патогенов и травоядных животных. Эта роль лигнина очень важна для поддержки подземного роста C. Deserticola в пустыне. В этом исследовании мы представили полную картину путей биосинтеза лигнина у C. Deserticola (рис. 3), в которых мономеры лигнина биосинтезируются из фенилаланина посредством ряда ферментативных реакций, включая гидроксилирование, метилирование, восстановление и процесс окислительной полимеризации. Ферменты, связанные с биосинтезом лигнина, были обнаружены для трех, главным образом, синтезируемых в сосудистой ткани форм (п-гидроксифенил (Н), гваяцил (G) и сирингил (S) лигнин) и 5-гидроксил-гваяцил лигнина, который был идентифицирован только в растениях с дефицитом COMT (кофеиновая кислота 3-O-метилтрансфераза, EC 2.1.1.68) (например, нокдаун).

Фенилаланин-аммиаклиаза (PAL, EC 4.3.1.24) является первым ключевым ферментом в пути биосинтеза лигнина (рис. 3), который превращает фенилаланин в коричную кислоту путем неокислительного дезаминирования. Всего было секвенировано 6297 чтений PAL и собрано 7 транскриптов PAL у C. Deserticola (Таблица 5). Путем сравнения сходства последовательностей мы обнаружили, что 4 из них (comp28550_c1_seq1/2/3/5) имели сходство более чем на 95% с известной последовательностью мРНК C. Deserticola (gi| 289595227|gb|ADD12041.1|), тогда как comp28550_c1_seq4 и comp25940_c0_seq1 имели сходство 77% и 82% соответственно. Прогнозирование ORF выявило, что 5 транскриптов потенциально могут кодировать белки и несут лиазный домен ароматических аминокислот (PF00221.14). Среди них только транскрипт comp28550_c1_seq4 мог кодировать полную белковую последовательность из 718 аминокислотных остатков. Сообщалось, что PAL кодируется небольшим мультигенным семейством у большинства видов растений, например, 4 у Arabidopsis thaliana, 5 у Populus trichocarpa, 3 у Scutellaria baicalensis, 7 Cucumis sativus и т. д. Наш филогенетический анализ показал, что их было 4. Гены, кодирующие PAL, у C.


Deserticola, и мы назвали их CdPAL1, CdPAL2, CdPAL3 и CdPAL4 соответственно (рис. S2). 4-кумарат-КоА-лигаза (4CL, EC 6.2.1.12) и трансциннамат 4-монооксигеназа (CYP73A, EC 1.14.13.11) представляют собой два фермента, ответственных за преобразование коричной кислоты в дикумарол-КоА в два обратных процесса. заказы. Они также находятся в магистральных цепях, и значения их экспрессии FPKM составляют 39,57 и 51,93 соответственно.

Четыре типа лигнинов биосинтезировались разными путями, которые контролировались тремя ключевыми ферментами: циннамоил-КоА-редуктазой (CCR, EC 1.2.1.44), шикимат-о-гидроксициннамоилтрансферазой (HCT, EC 2.3.1.133) и ферулатом{{1{ {56}}}}гидроксилаза (F5H, EC 1.14.-.-). Сообщалось, что CCR является контрольной точкой лигнинового пути [50, 51], который катализирует X-CoA (X, включая дикумарол, кофеоил, ферулоил, 5-гидроксилферулоил и синапоил) в Y-альдегид (Y, включая p -кугар, кофеоил, кониферил, 5-гидроксилкониферил и оснап), в то время как HCT катализирует п-кумароил-СоА до п-кумароилшикимовой кислоты/п-кумароилхинной кислоты. Два фермента, как переключатель, регулируют биосинтез P-гидроксифениллигнинов или трех других типов лигнинов. F5H был еще одним переключателем ветви, который регулировал сирингиллигнин и 5-гидроксилгуаяциллигнин. Другие важные ферменты, включая 3-O-метилтрансферазу кофейной кислоты (COMT, EC 2.1.1.68), кофеил-CoA O-метилтрансферазу (CCoAOMT, EC 2.1.1.104) и дегидрогеназу циннамилового спирта (CAD, EC 1.1.1.195). ) также были обнаружены выраженные. Подробная информация об экспрессии приведена в Таблице 6. Эти гены ферментов, идентифицированные в этом исследовании, станут ценным ресурсом для функциональных геномных исследований этого важного лекарственного растения. 10 генов, связанных с путем биосинтеза лигнинов в таблице 6, были выбраны для проверки RT-qPCR для подтверждения наших результатов RNAseq (рис. 4), и их высокие корреляции (коэффициент корреляции Пирсона: 0,90343) указывают на высокую точность и воспроизводимость нашего анализа транскриптома. В наборе данных S1 перечислены последовательности праймеров, использованные в этом анализе.

НАТУРАЛЬНЫЙ ЦИСТАНШ ТУБУЛОЗНЫЙ ДЛЯ УЛУЧШЕНИЯ ПОЛОВОЙ ФУНКЦИИ PHGS75% ECH 30% ACT 12%
Гены-кандидаты, кодирующие ферменты, участвующие в биосинтезе PhG
Известно, что фенилэтаноидные гликозиды (PhG) являются основными активными ингредиентами C. Deserticola, которые улучшают сексуальную потенцию, удаляют свободные радикалы и замедляют старение. Тремя химическими компонентами PhG являются органическая кислота, сахарид и фенилэтанолагликон (рис. 3). Органические кислоты, включая кофейную кислоту, феруловую кислоту и кумаловую кислоту, являются продуктами пути биосинтеза фенилпропаноидов. Компоненты сахарида, в том числе глюкоза и рамноза, являются продуктами путей углеводного обмена, таких как метаболизм крахмала и сахарозы, метаболизм аминосахара и нуклеотидного сахара, метаболизм фруктозы и маннозы и т. д. Однако путь биосинтеза фенилэтанольной части пока неясен. Здесь мы предложили два возможных пути биосинтеза фенилэтанола на основе наших данных о последовательностях. Одним из них является известный путь кофейной кислоты или феруловой кислоты, также известный как путь коричной кислоты, который аналогичен основному пути биосинтеза лигнина. Другой основан на пути метаболизма фенилаланина (рис. 3), в котором превращение фенилаланина в фенилэтанол осуществлялось с помощью известного «пути Энрлиха», который был впервые обнаружен у дрожжей сто лет назад и подтвержден на цветках петунии, томатах и розах. В стебле C. Deserticola обнаружены экспрессированные четыре гена ферментов, кодирующих аспартат/тирозинаминотрансферазу, гистидинфосфатаминотрансферазу и первичную аминоксидазу, ответственные за превращение фенилаланина в фенилэтанол. Продукт фенилэтанола может быть дополнительно окислен монооксигеназой или метилирован метилтрансферазой до его производных (фенилэтанолагликона), которые принимают участие в биосинтезе ФГ. Таким образом, были предложены два предполагаемых пути биосинтеза агликона фенилэтанола.С. пустыннаяно все еще нуждаются в дальнейшем изучении.
Обсуждения
В последние годы геномика растений быстро развивалась с применением технологий секвенирования нового поколения, в то время как лишь немногие исследования были сосредоточены на геномике пустынных лекарственных растений. Срочно необходимо провести геномные или транскриптомные исследования, чтобы понять его адаптацию к засухе и засоленности, а также путь биосинтеза основных биологически активных компонентов. Открытие de novo транскриптома некоторых лекарственных растений.


такие как Panax ginseng, Ginkgo biloba и Glycyrriza uralensis, впервые были использованы с использованием платформы Roche 454 из-за ее большой длины считывания. Из-за способности эффективной сборки с короткими прочтениями, особенно с преимущественными чтениями на парных концах, секвенирование и сборка транскриптома на основе Illumina также широко использовались для модельных и немодельных организмов. В настоящем исследовании мы создали около 8G парных концевых чтений длиной 101 п.н. и создали более длинные унигенные последовательности со средней длиной 725 п.н. Крупномасштабные данные транскриптома, специфичные для стеблей, могут предоставить полезные справочные данные и использоваться для изучения вторичного метаболизма биоактивных компонентов C. Deserticola. 81,62% общего числа необработанных считываний прошли строгие фильтры качества (включая обрезку адаптера и отбрасывание некачественных считываний) перед сборкой, что свидетельствует о высоком качестве наших данных секвенирования, а 82,08% высококачественных считываний были полезны для сборки. Другие чтения, которые не удалось использовать для сборки, могут быть вызваны ошибками последовательности, параметрами сборки и т. д. Эти неиспользованные высококачественные чтения остались полезными для улучшения сборки de novo в сочетании с более длинными чтениями с другой платформы (например, Roche 454) в будущем.

НАТУРАЛЬНЫЙ ЦИСТАНШ ТУБУЛОЗНЫЙ ДЛЯ УЛУЧШЕНИЯ ПОЛОВОЙ ФУНКЦИИ PHGS75% ECH 30% ACT 12%
Большое количество собранных транскриптов (30 098) продемонстрировало высокое сходство последовательностей с известными генами в общедоступных базах данных, что позволяет предположить, что наши данные о парных концах, полученные с помощью Illumina, охватывают значительную часть транскриптов C. Deserticola. Транскрипты без совпадений BLAST могут возникать из-за 3'- или 5'-нетранслируемых областей, некодирующей РНК или новых последовательностей генов C. Deserticola. Экспрессированные транскрипты были аннотированы для широкого спектра категорий GO и путей KEGG (таблицы 3 и 4), в которых многие транскрипты были отнесены к вторичным путям, связанным с метаболизмом. Как мы знаем, фенилпропаноид может функционировать как индуцируемое антимикробное соединение, весьма полезное для подземного образа жизни [1], а также выступать в качестве сигнальной молекулы в растительно-микробных взаимодействиях, помимо своего медицинского применения [68, 69]. Терпеноид используется для биосинтеза биоактивных компонентов (таких как 6- дезоксикатальпол) [70]. Мы обнаружили, что гены, участвующие в пути биосинтеза фенилпропаноидов и терпеноидов, широко распространены у C. Deserticola. Что еще более важно, открытие хорошо известных путей биосинтеза лигнина (рис. 3) указывает на активный метаболический процесс лигнина в стебле C. Deserticola. Все известные гены ферментов, участвующих в биосинтезе лигнина (рис. 3), были обнаружены экспрессированными, а четыре ключевых фермента, включая PAL, CCR, HCT и F5H, имели более низкую степень экспрессии (FPKM 26,47, 3,89, 3,4 и 3,83 соответственно) по сравнению с гены других ферментов (табл. 6). Вопрос о том, может ли изменение экспрессии этих трех генов повлиять на выработку лигнина у C. Deserticola, заслуживает дальнейшего изучения. PAL является ключевым ферментом биосинтеза лигнина, а также участвует в биосинтезе фенилпропаноида, ресвератрола, флавоноида и кумарина [71–74]. Мы обнаружили четыре различных гена PAL в геноме C. Deserticola (рис. S2), что совпало с тем, что PAL кодируется небольшим мультигенным семейством [39, 43, 45–49], и дополнительно доказали, что он может играть важную роль в метаболическом потоке углерода. .
PhG является основным активным ингредиентом C. Deserticola. Гены, участвующие в биосинтезе фенилэтанола, важны для качества C. Deserticola. Мы выявили два различных пути биосинтеза фенилэтанола и 17 генов ферментов, участвующих в биосинтезе PhG в стебле C. Deserticola. Возможные процессы после кофеиновой/феруловой кислоты (рис. 3) также были впервые выведены на основе структурной формулы промежуточных продуктов и каталитических свойств соответствующих ферментов, в которых кофеиновая/феруловая кислота сначала будет окисляться до производного фенилпирувата; затем карбоксильную группу лишили декарбоксилазы; наконец, альдегидная группа была преобразована обратно в спиртовую группу под действием дегидрогеназы. Это первое применение технологии парного секвенирования Illumina для исследования всего транскриптома C. Deserticola и сборки считываний РНК-секвенирования без эталонного генома. Это исследование предоставит полезные ресурсы и последовательности генов для исследований функциональной геномики и протеомики C. Deserticola в будущем.
Выводы
В этом исследовании мы профилировали транскриптом стебля C. Deserticola на основе данных высокопроизводительного секвенирования, идентифицировали гены, участвующие в путях биосинтеза лигнина, а также впервые сделали вывод о потенциальном пути биосинтеза PhG, что, безусловно, ускорит понимание неоднозначных физиологических процессов и огромной лечебной ценности на молекулярном уровне. На данный момент это первая попытка de novo собрать весь транскриптом стебля C. Deserticola и определить путь биосинтеза лекарственных компонентов с использованием наборов данных секвенирования на базе Illumina. Наше исследование может способствовать разработке натуральных лекарств и отбору сортов с лечебными свойствами.

НАТУРАЛЬНЫЙ ЦИСТАНШ ТУБУЛОЗНЫЙ ДЛЯ УЛУЧШЕНИЯ ПОЛОВОЙ ФУНКЦИИ PHGS75% ECH 30% ACT 12%







