הרכבת תעתיק וגילוי גנים של גזע בשרני של Cistanche Deserticola-Ⅰ

Sep 06, 2024

רקעים

Cistanche deserticola הוא צמח טפיל שאינו פוטוסינתטי לחלוטין בעל ערך רפואי רב ומופץ בעיקר במדבר של צפון מערב סין. הגבעול הבשרני המיובש שלו הוא טוניק מכריערפואה סינית מסורתיתעם תפקידים של בעיקר שיפור התפקוד המיני הגברי וחיזוק חסינות, אך מחקרים מכניסטיים מעטים נערכו בין השאר בשל היעדר משאבים גנומיים ותעתיקים.

Natural cistanche tubulosa

NATURAL CISTANCHE TUBULOSA רפואה סינית מסורתית PHGS75% ECH 30% ACT 12%

תוצאות

במחקר זה, ביצענו רצף תעתיק עמוק בגזע הבשרני של C. deserticola, וכ-80 מיליון קריאות נוצרו באמצעות רצף צמדי Illumina בפלטפורמת HiSeq2000. באמצעות ה-trinity assembler, השגנו 95,787 רצפי תמלול עם אורכי תמלול שנעים בין 200bp ל-15,698bp, באורך ממוצע של 950 בסיסים ואורך N50 של 1,519 בסיסים. 63,957 תמלילים זוהו כמבוטאים באופן פעיל עם FPKM גדול מ-0.5 או שווה ל-0.5, שבהם 30,098 תמלילים צוינו בתיאורי גנים או במונחים אונטולוגיים של גנים על ידי ניתוחי דמיון ברצף מול מספר מאגרי מידע ציבוריים (Uniprot, NR ו-Nt ב-NCBI ו-KEGG) . יתרה מזאת, זיהינו גנים אנזים מרכזיים המעורבים בביוסינתזה של ליגנין וגליקוזידים פנילתנואידים (PhGs) אשר ידועים כמרכיבים הפעילים העיקריים. ארבעה גנים של פנילאלנין אמוניה-ליאז (PAL), האנזים המפתח הראשון בביו-סינתזה של ליגנין ו-PhG זוהו בהתבסס על השוואת רצפים וניתוח פילוגנטי. שני מסלולי ביוסינתזה של PhGs הוצעו גם הם בפעם הראשונה.

מסקנות

בסך הכל, השלמנו ניתוח גלובלי של תעתיק הגזע הבשרני של C. deserticola באמצעות טכנולוגיית RNA-seq. אוסף של גנים אנזימים הקשורים לביו-סינתזה של גליקוזידים של ליגנין ופנילתאנואידים זוהה מהתמלילים המורכבים והמוערים, וגם משפחת הגנים של PAL נחזו. נתוני הרצף ממחקר זה יספקו משאב רב ערך לביצוע מחקר עתידי על ביו-סינתזה של פנילתנואידים גליקוזידים ומחקרים גנומיים פונקציונליים בצמח מרפא חשוב זה.

מָבוֹא

C. deserticola הוא סוג עולמי של צמחי מדבר רב-שנתיים ממשפחת ה- Orobanchaceae והוא מין שאינו פוטוסינתטי לחלוטין ובדרך כלל מגדל צמח הולופרזי תת-קרקעי. הוא טפיל על שורשיו של הפסמופיט האמודנדרון Haloxylon ammodendron (Chenopodiaceae), השוכן בעיקר במדבריות ומדבריות למחצה, בשל הסבילות הגבוהה שלו לבצורת ולמליחות. C. deserticola מראה עמידות חזקה לתנאי סביבה קשים ומופץ בעיקר בצפון מערב סין, במיוחד במונגוליה הפנימית, גנסו ושינג'יאנג. הוא נחשב לזן בר בסכנת הכחדה בשנים האחרונות עקב צריכה מוגברת של בני אדם. C. deserticola אשר מכונה לעתים קרובות ג'ינסנג מדברי ידוע בדרך כלל כ-Desert-broroomrape והגבעול הבשרני המיובש נמצא בשימוש נרחב כחומר מחזק מסורתי בסין וביפן במשך שנים רבות. הוא תועד בתחילה ב-Shen Nong Ben Cao Jing (מילון סינית Materia Medica, 1977) לפני כ-1800 שנה ונחשב לאחד המקורות העיקריים שלעשב מרפא סיני Cistanche.

Chinese cistanche tubulosa

NATURAL CISTANCHE TUBULOSA לשיפור התפקוד המיני PHGS75% ECH 30% ACT 12%

לתמציות של C. deserticola יש מגוון רחב של תפקודים רפואיים, במיוחד לשימוש בשיפור התפקוד המיני, חיטוב הכליות, הגנה על הכבד, פעילות מקדימה, שיפור הזיכרון, פעילות חיסונית, נוגדת חמצון, פעילות אנטי דלקתית, אנטי ויראלית וכו'. הרכיבים הביו-אקטיביים העיקריים של C. deserticola הם פנילתנואידים גליקוזידים (PheGs, PhGs). עד כה בודדו יותר מ-20 פנילתנואידים גליקוזידים מהגבעול העסיסי של C.deserticola. ביניהם,אקטאוזיד ואכינאקוסידהם שני מרכיבים עיקריים בעלי פעילות פרמקולוגית משמעותית ומתועדים כתקני האיכות של C. deserticola בפרמקופיה הסינית (מהדורות 2005 ו-2010). שלושה מרכיבים כימיים של PhGs הם חומצה אורגנית, סכריד ופנילתנואיד, עם זאת, הפרטים הנוגעים למסלולים ביוסינתטיים של פנילתנואידים נותרו מובנים בצורה גרועה ב-C.deserticola.

למרות החשיבות המסחרית והרפואית של C.deserticola, הנתונים הגנומיים והתעתיקים של מין זה מוגבלים מאוד. אין ESTs זמינים במסד הנתונים של NCBI ומידע הגנום המלא עבור מין זה נותר בלתי זמין למעט רצף הגנום של הכלורופלסט. הנתונים הטרנסקריפטומיים המוגבלים מעכבים את חקר המנגנונים הביוסינתטיים של PhG. טכנולוגיית RNA-seq יכולה ליצור רצפים של החלקים המובעים של הגנום הממוקד ולזהות גנים [18] באמצעות פלטפורמות הטכנולוגיה של NGS (כגון Applied Biosystems SOLiD, Illumina HiSeq ו-Roche 454). זה הופך יותר ויותר פופולרי בהרכבת תעתיק דה נובו, מכיוון שזו גישה חסכונית וחזקה עם רזולוציה גבוהה וטווח דינמי רחב, במיוחד מכיוון שיש לה יתרון לחקור תמלילים בשפע נמוך. בגלל היתרונות השונים, RNA-seq אטרקטיבי במיוחד עבור אורגניזמים שאינם מודלים עם משאבים גנטיים מוגבלים. עם זאת, אין מחקר מפורט על transcriptome C. deserticola על ידי RNA-seq.

במחקר זה, רצפנו באופן גלובלי את תעתיק הגזע עבור C. deserticola באמצעות פלטפורמת Illumina Hiseq2000 וקיבלנו נתונים גולמיים של 7.9G. על ידי הרכבה והערה, כרינו את הגנים המעורבים בביוסינתזה של PhG ואת הגנים האחראים לביו-סינתזה של ליגנין. ניתוח ה-RNA-seq שלנו יצר את תעתיק הקונצנזוס הראשון של C. deserticola וסיפק תובנות חדשות לגבי הבנה מקיפה של הערך הרפואי של C. deserticola. בנוסף, השיטה המתוארת כאן יכולה להיות מיושמת באופן נרחב על תעתיקי פרופיל כדי להקל על גילוי גנים המעורבים במסלולי ביוסינתזה ספציפיים של רכיבים רפואיים בצמח מרפא אחר עם משאבים גנומיים מוגבלים מאוד.

חומרים ושיטות

איסוף חומרים צמחיים

הגבעול העסיסי הטרי עבור C. deserticola בשלב החפירה נאסף מבסיס צמחים בעיר BayanHot של Alxa League שבמונגוליה הפנימית בצפון מערב סין. היתר האיסוף התקבל מהבעלים (HongKui CongRong Group) של בסיס המפעל. דגימת השובר הופקדה במתקן הגנומי הליבה במכון בייג'ינג לגנומיקה, האקדמיה הסינית למדעים. לאחר הניקוי, רקמות הגבעול העסיסיות נחתכו לחתיכות קטנות והוקפאו מיד בחנקן נוזלי, ולאחר מכן אוחסנו בדרגה -80 עד לעיבוד נוסף.

מיצוי RNA, בניית ספריית cDNA ורצף Illumina

RNA כולל הופק מהגבעול העסיסי באמצעות TRIzol Reagent (Invitrogen Inc., קליפורניה, ארה"ב) לפי הוראות היצרן. הדגימות שהתקבלו טופלו ב-DNase I כדי להסיר כל DNA גנומי. RNA שחולצו כמתו באמצעות ביואנליזטור של Agilent 2100 (Agilent Technologies) ונבדקו תקינותם באמצעות אלקטרופורזה דנטורטית של ג'ל אגרוז עם צביעת אתידיום ברומיד. דגימות RNA עם יחסי A260/A280 בין 1.9 ל-2.1, יחסי RNA 28S:18S גבוהים מ-1.0 ומספרי שלמות RNA (RINs) -8.5 שימשו בניתוחים הבאים.

ספריות ה-RNA-seq נוצרו באמצעות ערכות הכנת דגימות RNA של Illumina Truseq. Poly(A)+ RNA בודד מ-RNA הכולל באמצעות חרוזי Dynal ligo(dT)25 לפי הוראות היצרן. לאחר הטיהור, נוסף חיץ פיצול כדי לשבור את ה-mRNA לשברים קצרים. cDNA של גדיל ראשון סונתז באמצעות מקטעים קצרים אלה כתבניות, יחד עם SuperScript III הפוך תעתיק ו-N6 אקראי הקסאמר פריימר. לאחר מכן סונתז cDNA של גדיל שני באמצעות חיץ, dNTPs, RNaseH ו-DNA פולימראז I. ה-cDNA הדו-גדילי שנוצר עבר תיקון קצה באמצעות T4 DNA פולימראז, DNA פולימראז I Klenow fragment ו-T4 polynucleotide kinase, ונקשר ל מתאמים באמצעות T4 DNA ligase. שברי קשירת מתאם טוהרו באמצעות ערכת מיצוי QiaQuick PCR ונפלטו עם חיץ EB. לאחר ניתוח באמצעות אלקטרופורזה של ג'ל אגרוז, נבחרו שברים מתאימים כתבניות להגברת PCR. ריצוף של ספריית cDNA שהתקבלה בוצע עם מערכת Illumina HiSeq 2000.

הרכבת תמלילים דה נובו וכימות ביטוי גנים

קריאות גולמיות שנוצרו מרצף נוקו על ידי הסרת רצפי המתאמים (ATCTCGTATGCCGTC) בשיטה פנימית. לאחר מכן ביצענו תהליך סינון קפדני באיכות נמוכה. ראשית, בסיסים עם ציון איכות phred נמוך מ-20 ייחתכו מקצה ה-3' של הרצף, עד שייכנסו לבסיס אחד עם איכות גבוהה יותר (גדול מ-20 או שווה ל-20). אם אורך הקריאה היה קצר מ-50bp, הוא יימחק. שנית, קריאות יסוננו עוד יותר לפי הקריטריון לפיו ל-70% מהבסיסים בקריאה אחת יש ציונים באיכות גבוהה (גדול מ-20 או שווה ל-20). שלישית, רק קריאות קצה זוגיות שימשו להרכבה נוספת. הרכבת התמלול De novo בוצעה באמצעות Trinity Release_20130216 [30] שהורכבה משלושה מודולי תוכנה עוקבים: Inchworm, Chrysalis ו-Bterfly. פרמטרי ההרכבה נקבעו כדלקמן:-seqType fq-JM 300G -min_contig_length 200-CPU 20-inchworm_cpu {{21} }bflyCPU 20.

כדי לכמת את שפע התמלילים, רצף הקריאה של קצה הזוגות מיושר מחדש לתמלילים שנאספו באמצעות סקריפט ב-Trinity. קריאות ממופות שימשו לכימות על ידי תוכנת RSEM (RNA-Seq by Expectation Maximization). ריבוי גנים או איזופורמים יוצג על ידי הפרגמנט לקילו-בסיס של ערך התמליל למיליון מקטע ממופה (FPKM), אותם תעתיקים עם ערך FPKM השווה או גדול מ-0.05 הוגדרו כמובטאים.

ביאור פונקציונלי של תמלילים מובעים

אין סטים של ביאור גנים של C. deserticola מלבד הגנום של הכלורופלסט [1]. ביארנו את התמלילים המובעים על ידי השוואתם ל-Genbank Nt, Genbank Nr, ו-TAIR10_ pep_20101214_מעודכנים של מערכי נתונים בנפרד באמצעות תוכנית BLAST (E< = 1e-20). Meanwhile, all expressed transcripts were translated into potential proteins according to ORF prediction by TransDecoder and predicated for the conserved domains based on the Pfam database.

Gene Ontology וביאור מסלול KEGG על ידי יישור דמיון ברצף למסד הנתונים של Uniprot (ביאור Gene Ontology (GO) של כל התמלילים שנאספו הושג באמצעות קובץ שיוך שהוורד מ- (ftp://ftp.ebi.ac.uk/pub/ databases/GO/goa/UNIPROT/gene_שיוך goa_uniprot.gz). קטגוריות CC, BP ​​ו-MF בנפרד.

מידע על מסלול KEGG הוקצה עבור כל רצפי החלבון החזויים באמצעות הכלי המקוון KAAS (KEGG Automatic Annotation Server) [34]. רצפים בפורמט fasta הוגשו לבקשת KAAS, והקבצים שהתקבלו של כל מידע המסלולים הקשורים לתעתיק גזע C. deserticola הורדו. 13 מערכי גנים של אורגניזמים צמחיים ב-KEGG שימשו לביאור בשיטת BBH (דו-כיוונית הטובה ביותר).

cistanche tubulosa extract

תמצית CISTANCHE TUBULOSA CISTANCHE PHGS75% ECH 30% ACT 12%

ניתוח RT-qPCR

לאחר עיכול עם DNase I, כ-5 אג' של RNA הכולל הומרו ל-cDNA של גדיל ראשון באמצעות תגובת השעתוק ההפוכה עם פריימרים oligo(dT)15 ו-GoScript Reverse Transcription System (Promega). לאחר מכן, תוצרי ה-cDNA הודללו 10-בקפל במים נטולי נוקלאז לפני השימוש כתבנית ב-PCR בזמן אמת. cDNAs ספציפיים הוגברו על ידי מערכת GoTaq 2-Step RT-qPCR (Promega) בנפח של 20 ul. הגברה של PCR בוצעה בטמפרטורת חישול של 60 מעלות עם 7500 Real-Time PCR Detection System (Applied Biosystems) לפי הוראות היצרן. שפע התמלילים היחסי חושב בשיטת סף המחזור ההשוואתית עם הגן "comp10579_c0" כסטנדרט פנימי, באמצעות תוכנת 7500 Manager.

צמדי פריימר עבור RT-PCR תוכננו על בסיס תוכנה מקוונת (http://primer3.ut.ee/) והם רשומים במערך הנתונים של S1.

תוצאות

רצף RNA והרכבת תעתיק דה נובו של גזע בשרני C. deserticola

גזע של C. deserticola נמצא בשימוש נרחב כטוניק חשוב מסורתי בסין וביפן במשך שנים רבות. כדי לקבל סקירה כללית של ביטוי גנים בגזע הבשרני של C. deserticola, אספנו דגימות גזע של C. deserticola מאותו בסיס צמחי ב-2013 וב-2014, בהתאמה. RNAs הכולל חולצו ו-polyA+ RNAs טוהרו לבניית ספריות RNA-seq בקצה זוווג. 79,433,734 ו-86,019,176 קריאות זוגיות המקבילות לכמעט 8 מיליארד ו-8.6 מיליארד בסיסים של הרצף הושגו באמצעות רצף Illumina HiSeq 2000

image

פלטפורמה בדגימות 2013-שנה ו2014-שנה (טבלה 1). לאחר הסרת רצפי מתאמים וסינון קריאות באיכות נמוכה (ראה פרטים בשיטות), נעשה שימוש ב-64,831,040 קריאות באיכות גבוהה של קצה צמד במדגם 2013-שנה להרכבת תעתיקים דה נובו. באמצעות ה-Trinity sequence assembler [30], נוצרו 51,719 גנים ו-95,787 רצפי תמלול עם אורכי תמלול שנעים בין 200 bp ל-15,698 bp. האורך הממוצע של תמלילים שנאספו הוא 950 בסיסים ואורך N50 הוא 1,519 בסיסים. מספר התמלילים באורכים שונים גילה כי 57.32% מהתמלילים שנאספו היו בערך 500 bp או יותר (איור 1A). קריאות זוגיות באיכות גבוהה במדגם 2014-שנה מופו לתעתיק המורכב. חוץ מזה, מצאנו שמספר התמלילים עבור כל גן מורכב השתנה ו-69% מהגנים עם איזופורם אחד שבא לידי ביטוי בעוד 31% מהגנים ביטאו שניים או יותר תעתיקים (איור 1B).

כימות ביטוי וביאור פונקציונלי של תמלילים מורכבים

שפע הגנים או התמלילים הוכמת באמצעות חבילת ה-RSEM, שבה הקריאות שנרשמו היו מיושרות מחדש לגנים או רצפי התמלילים שנאספו באמצעות Bowtie, ואלו הקריאות הממופות שימשו לכימות. ערך FPKM עבור כל גן או תמליל חושב, ולבסוף, זיהינו 63,957 ו-52,857 תעתיקים שהובעו באופן פעיל (ערך FPKM גדול או שווה ל-0.5) בדגימות גזע בשרניות של C. deserticola ב-2{{17} }13 ו-2014, בהתאמה. 44,776 תמלילים (70.01% במדגם 2013-שנה, 84.71% במדגם 2014-שנה) באו לידי ביטוי בדרך כלל בשני המשכפלים, והמתאם (מקדם מתאם פירסון: 0.91979) של נתוני הביטוי שלהם היה מוצג באיור S1. הנתונים הגולמיים של הרצף הועלו למסד הנתונים של NCBI SRA (מספרי גישה: SRX857402 ו-SRX858938). השתמשנו בגנים מובעים שזוהו במדגם 2013-שנה לניתוח נוסף. מידע ביאור פונקציונלי עבור כל התמלילים המובעים הושג בשתי שיטות. ראשית, כל התמלילים המובעים היו מיושרים לבסיסי נתונים ידועים של נוקלאוטידים (GenBank nt) ורצפי פפטיד (GenBank nr ופפטיד Arabidopsis) בנפרד על ידי אלגוריתם BLAST. מתוך 63,957 תמלילים מפורשים,

image

29,220 (45.7%) קיבלו הערות והראו הומולוגיה לרצפים בכל אחד משלושת מסדי הנתונים של הנושאים עם חיתוך E-value 1e-20. בינתיים, אזורי הקידוד המועמדים עבור כל רצפי התמלול המפורשים נחזו באמצעות תוכנת TransDecoder, וה-ORFs הארוכים ביותר עבור כל תמלול שימשו לחיפוש תחום Pfam. כתוצאה מכך, 21,358 (33.4%) תמלילים הוערו על סמך מסד הנתונים של Pfam. בסך הכל, 30,098 (47.1%) תמלולים הותאמו באופן משמעותי לגנים ידועים במאגרי המידע הציבוריים על ידי שילוב שתי השיטות לעיל. רשימת התמלילים המבוטאים המלאה עם הערת פונקציות הוצגה בנתונים משלימים (S2 Dataset).

סקרנו את 20 התמלילים המובילים לביטוי הגבוה ביותר (טבלה 2) התואמים ל-18.99% מכל קריאות הרצף, ומצאנו שרובם הם גנים המגיבים לאביוטיקה

image

גירוי מתח. Dehydrin (DHNs), מחלקה של חלבוני סטרס הידרופיליים ויציבים תרמיים עם מספר גבוה של חומצות אמינו טעונות השייכות למשפחת Group II Late Embryogenesis Abundant (LEA), הוא הגן המבוטא ביותר. שלושה תעתיקי Dehyrin שונים (comp28713_c0_seq1/2/4) זוהו כמתבטאים מאוד בגבעולים בשרניים אשר עשויים להיות מעורבים בהגנה על תאים מפני נזק שנגרם על ידי מתח בצורת. גנים אחרים הקשורים לסטרס כמו חלבון הלם חום, חלבון הקשור לפתוגן ומטלותיוניאין נמצאו גם הם בעלי ביטוי גבוה, מה שעשוי להיות קשור לסביבת ההישרדות הקשה שלו. בנוסף, כמה גנים מכוננים כולל גן RNA ריבוזומי 26S (comp22329_c2_seq1), חלבון מדוכא/תרדמה הקשור לאוקסין (comp20999_c0_seq1), גם גורם ADP-ribosylation (comp20499_ c0_seq1) הועתקו מאוד.

Cistanche tubulosa extract

סיטנשה טבעית לשיפור חסינות PHGS75% ECH 30% ACT 12%

drk-green-rounded-corner-button-buy-now-web


אולי גם תרצה