الجينوم الجامع

(تم التحويل من Pan-genome)
تحليل الجينوم الجامع لجينومات العقدية القاطعة للدر معدة ببرنامج أنفيو [1] الذي يقود تطويره أ. مراد إرين. جُلبت الجينومات من تتلين وزملائه (2005).[2] تتوافق كل دائرة مع جينوم واحد وكل نصف قطر يمثل عائلة جينية. في الأسفل وعلى اليمين توجد عائلات الجينوم الأساسية. قد تحتوي بعض العائلات في مركزها على أكثر من جين واحد لكل جينوم. في المنتصف، على يسار الشكل، يوجد الجينوم الهيكلي (الخارجي). في الجزء العلوي الأيسر تظهر عائلات الجينوم القابل للاستغناء عنه والأفراد الفرديين.

في تخصص علم الأحياء الجزيئي وعلم الوراثة، الجينوم الجامع (إنگليزية: pan-genome أو الجينوم الفائق supragenome)، هو مجموعة كاملة من الجينات من جميع السلالات داخل الفرع الحيوي. بشكل عام، هو اتحاد لكل جينومات الفرع الحيوي.[2][3][4][5] يمكن تقسيم الجينوم الجامعإلى "جينوم جامع أساسي" يحتوي على جينات موجودة في جميع الأفراد، و"جينوم جامع هيكلي" يحتوي على جينات موجودة في سلالتين أو أكثر، و"جينوم جامع سحابي" يحتوي على جينات موجودة فقط في سلالة واحدة.[3][4][6] يشير بعض المؤلفين أيضًا إلى الجينوم السحابي على أنه "جينوم إضافي" يحتوي على جينات "يمكن الاستغناء عنها" موجودة في مجموعة فرعية من السلالات والجينات الخاصة بالسلالة.[2][3][4] لاحظ أن استخدام مصطلح "يمكن الاستغناء عنه" كان موضع تساؤل، على الأقل في جينومات النبات، حيث تلعب الجينات الإضافية "دورًا مهمًا في تطور الجينوم وفي التفاعل المعقد بين الجينوم والبيئة".[5] يسمى مجال دراسة الجينوم الجامع بعلم الوراثة الجامع.[2]

المخزون الجيني للأنواع الجرثومية أكبر بكثير من المحتوى الجيني لسلالة فردية. [7] بعض الأنواع لديها جينومات جامعة مفتوحة (أو واسعة النطاق)، في حين أن البعض الآخر لديه جينومات جامعة مغلقة.[2] بالنسبة للأنواع ذات الجينوم الجامع المغلق، يضاف عدد قليل جدًا من الجينات لكل جينوم متسلسل (بعد تسلسل العديد من السلالات)، ويمكن توقع حجم الجينوم الجامع الكامل نظريًا. تحتوي الأنواع ذات الجامع الجامع المفتوح على عدد كافٍ من الجينات المضافة لكل جينوم متسلسل إضافي مما يجعل التنبؤ بحجم الجينوم الجامع الكامل أمرًا مستحيلًا.[4] أُقترح حجم ومكانة سكانية تعددية الاستخدامات باعتبارها أكثر العوامل تأثيرًا في تحديد حجم عموم الجينوم.[2]

أنشيء الجينوم الجامع في الأصل لأنواع الجراثيم والعتائق، لكن تم تطوير جينومات جامعة لحقيقيات النوى مؤخرًا ، خاصةً للأنواع النباتية. أظهرت الدراسات النباتية أن ديناميكيات عموم الجينوم مرتبطة بعناصر قابلة للنقل.[8][9][10][11] تبرز أهمية عموم الجينوم في سياق تطوري، لا سيما فيما يتعلق بالميتاجينومية،[12] ولكنها تستخدم أيضًا في سياق علم الجينوم الأشمل.[13] نُشر كتاب مفتوح الوصول يستعرض مفهوم الجينوم الجامع وآثاره، حرره تتلين ومديني، في ربيع 2020.[14]

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

التسمية

عام 2005، قام تتلين وزملائه بتعريف مصطلح الجينوم الجامع Pan-genome بمعناه الحالي؛[2] وهو مشتق من كلمة 'pan' من الكلمة اليونانية παν، وتعني 'الكامل' أو 'الجامع'، بينما تستخدم كلمة الجينوم بشكل شائع لوصف لمادة الوراثية الكاملة للعضية. طبق تتلين وزملائه المصطلح على وجه التحديد على الجراثيم، التي تشتمل على جينومها "الجينوم الأساسي الذي يحتوي على جينات موجودة في جميع السلالات وجينوم يمكن الاستغناء عنه يتكون من جينات غائبة عن سلالة أو أكثر من السلالات والجينات الفريدة لكل سلالة".[2]


أجزاء الجينوم

في الجينوم الجامع، يمكننا تحديد ثلاث مجموعات من الجينومات: الجينوم المركزي والهيكلي والسحابي. يتكون الجينوم الأساسي من الجينات الموجودة في جميع الجينومات التي تم تحليلها. لتجنب رفض العائلات الجينية بسبب تسلسل artifact، يعتبر بعض المؤلفين أنها لينة (تحث بنسبة أكبر من 95٪). يتكون الجينوم الهيكلي من الجينات المشتركة بين غالبية الجينومات (نسبة حدوث 10-95٪). توصف عائلات الجينات الموجودة في جينوم واحد فقط أو أقل من 10٪ من حالات حدوثها على أنها جينوم قابل للاستغناء عنها أو جينوم سحابي.

الجينوم المركزي

الجينوم المركزي هو جزء من الجينوم الجامع يتشاركه كل جينوم في المجموعة المختبرة. قام بعض المؤلفين بتقسيم الجينوم المركزي إلى النواة الصلبة، تلك العائلات من الجينات المتماثلة التي تحتوي على نسخة واحدة على الأقل من العائلة يتشاركها كل جينوم (100٪ من الجينوم) والنواة الملساء أو النواة الممتدة،[15] تلك العائلات موزعة فوق عتبة معينة (90٪). في دراسة تتضمن الجينومات الجامعة من "العصويات الشمعية" و"المكورات العنقودية الذهبية"، "عزل بعضها عن محطة الفضاء الدولية، كانت العتبات المستخدمة لتقسيم الجينوم الجامع كما يلي: "السحابي" و"الهيكلي" و"المركزي" تتوافق مع عائلات الجينات مع وجود في <10٪، و10 إلى 95٪، و> 95٪ من الجينوم، على التوالي.[16]

يعتمد حجم الجينوم المركزي ونسبته إلى الجينوم الجامع على عدة عوامل، لكنه يعتمد بشكل خاص على التشابه النشئي للجينومات المدروسة. على سبيل المثال، سيكون جوهر جينومين متطابقين هو أيضًا جينوم جامع كامل. سيكون جوهر الجنس دائمًا أصغر من الجينوم الأساسي للأنواع. غالبًا ما ترتبط الجينات التي تنتمي إلى الجينوم المركزي بالوظائف المتراكمة والتمثيل الغذائي الأولي للنسب، ومع ذلك، يمكن أن يحتوي الجين المركزي أيضًا على بعض الجينات التي تميز الأنواع عن الأنواع الأخرى من الجنس، أي التي قد تكون ذات صلة الإمراضية بالتكيف المتخصص.[17]

الجينوم الهيكلي

هو جزء من الجينوم الجامع تتقاسمه غالبية الجينومات في الجينوم الجامع.[18] لا توجد عتبة مقبولة عالميًا لتحديد الجينوم الهيكلي، يعتبر بعض المؤلفين عائلة الجينات جزءًا من الجينوم الجامع الهيكلي إذا كانت مشتركة مع أكثر من 50 ٪ من الجينومات في الجينوم الجامع.[19]

يمكن أن تكون العائلة جزءًا من الهيكل بواسطة العديد من الديناميكيات التطورية، على سبيل المثال عن طريق فقدان الجينات في سلالة حيث كانت في السابق جزءًا من الجينوم المركزي، مثل حالة الإنزيمات في المشغل الحيوي التريبتوفان في "الشعيات[20] أو عن طريق اكتساب الجينات وتثبيتها لعائلة الجينات التي كانت في السابق جزءًا من الجينوم الذي يمكن الاستغناء عنه مثل حالة الجين "trpF" في العديد من أنواع "الوتديات".[21]

الجينوم السحابي

يتكون الجينوم السحابي من تلك العائلات الجينية التي تشترك فيها مجموعة فرعية صغيرة من الجينومات في الجينوم الجامع،[22] يتضمن جينات مفردة أو موجودة في جينوم واحد فقط. يُعرف أيضًا باسم الجينوم المحيطي. غالبًا ما ترتبط العائلات الجينية في هذه الفئة بالتكيف البيئي.[بحاجة لمصدر]

التصنيف

a) تتميز الجينومات الجامعة المغلقة بجينومات مركزية كبيرة وجينومات ملحقة صغيرة. b) تميل الجينومات الجامعة المفتوحة إلى امتلاك جينومات مركزية صغيرة وجينومات ملحقة كبيرة. c) يميل حجم الجينومات الجامعة المفتوحة إلى الزيادة مع كل جينوم مضا ، وفي الوقت نفسه يميل حجم الجينوم الجامع المغلق إلى أن يكون مقاربًا على الرغم من إضافة المزيد من الجينوم. بسبب هذه الخاصية ، يمكن توقع حجم الجينوم الجامع الكامل بالنسبة للجينومات الجامعة المغلقة.

يمكن تصنيف الجينوم اعتباطياً إلى حد ما على أنه مفتوح أو مغلق بناءً على قيمة ألفا لقانون هيب: [23][15]

  • عدد العائلات الجينية.
  • عدد الجينومات.
  • ثابت التناسب.
  • حساب الأس من أجل تعديل منحنى عدد عائلات الجينات مقابل الجينوم الجديد.
إذا كانت  يعتبر الجينوم الجامع مفتوحاً.
إذا كانت  يعتبر الجينوم الجامع مغلقاً.

عادة ، يمكن لبرنامج الجينوم الجامع حساب متغيرات قانون هيب التي تصف سلوك البيانات بشكل أفضل.


الجينوم الجامع المفتوح

يكون الجينوم الجامع مفتوحاً عندما تستمر السلالة التصنيفية في زيادة عدد عائلات الجينات الجديدة ولا يبدو أن هذه الزيادة مقاربة بغض النظر عن عدد الجينومات الجديدة التي تمت إضافتها إلى الجينوم الجامع. من أمثلة الجينوم الجامع المفتوح "الإشريشيا معوية". يتراوح حجم الجينوم في الإشريشيا المعوية بين 4000-5000 جين وحجم الجينوم الجامع المقدر لهذه الأنواع مع ما يقرب من 2000 جينوم يتكون من 89000 عائلة جينية مختلفة.[24] كما يعتبر الجينوم الجامع لنطاق الجراثيم جينوم جامع مفتوح.


الجينوم الجامع المغلق

يكون الجينوم الجامع مغلقاً يحدث Pangenome المغلق في سلالة عندما يتم إضافة عدد قليل فقط من عائلات الجينات عندما يتم دمج الجينومات الجديدة في تحليل الجينوم الجامع، ويبدو أن العدد الإجمالي للعائلات الجينية في الجينوم الجامع مقارب لرقم واحد. يعتقد أن التطفل والأنواع المتخصصة في بعض المكامن تميل إلى أن تكون ذات جينوم جامع مغلق. ومن أمثلة الجينومات الجامعة المغلقة الجراثيم التعايشية "Staphylococcus lugdunensis".[25]

التاريخ

الجينوم الكامل

طُور مفهوم الجينوم الجامع الأصلي بواسطة تتلين وزملائه.[2] عندما حللوا الجينوم لثمانية عينة معزولة من "العقدية القاطعة للدر، حيث وصفوا الجينوم المركزي المشترك بين جميع العينات المعزولة، وهو ما يمثل حوالي 80٪ من أي جينوم منفرد، بالإضافة إلى جينوم يمكن الاستغناء عنه يتكون من الجينات المشتركة جزئيًا والخاصة بالسلالة. اقترح الاستقراء أن المخزون الجيني في العقدية القاطعة للدر هو جينوم جامع موسع وسيستمر تحديد الجينات الفريدة الجديدة حتى بعد تسلسل مئات الجينومات.[2] يشتمل الجينوم الجامع على جميع الجينات المكتشفة في الجينوم المتسلسل لنوع جرثومي معين ويمكن أن يتغير عندما يتم تسلسل الجينومات الجديدة ودمجها في التحليل.[بحاجة لمصدر]

يُعرَّف الجينوم الفائق بأنه جميع الجينات التي يمكن الوصول إليها من نوع معين، ويكون جينوم جامع إذا كان تسلسل جميع الجينومات لنوع واحد متاحًا. الميتا جينوم هو تحليل للجينوم الجامع المطبق على عينات الميتاجينومات، حيث يتم تقييم اتحاد الجينات من عدة أنواع لموئل معين.

يمثل الجينوم الجامع لسلالة الجينوم تباين محتوى الجين داخل النسب. يتطور الجينوم الجامعبسبب: ازدواج الجينات، وديناميكيات اكتساب الجينات وفقدانها، وتفاعل الجينوم مع العناصر المتحركة التي تتشكل عن طريق الانتقاء والانجراف.[26] تشير بعض الدراسات إلى أن الجينومات الجامعة بدائيات النوى هي نتيجة للتكيف، وليس التطور المحايد الذي يمنح الأنواع القدرة على الهجرة إلى منافذ جديدة.[27]


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

الجينوم الفائق

يمكن اعتبار الجينوم الفائق الحجم الحقيقي للجينوم الجامع إذا تم تتبع تسلسل جميع الجينومات من نوع ما.[28] يُعرف على أنه إمكانية الوصول إلى جميع الجينات لتتكسب من قبل نوع معين. لا يمكن حسابه بشكل مباشر ولكن يمكن تقدير حجمه من خلال حجم الجينوم الجامع المحسوب من بيانات الجينوم المتاحة. قد يكون تقدير حجم الجينوم السحابي أمرًا مزعجًا بسبب اعتماده على حدوث الجينات والجينومات النادرة. عام 2011 اقترحت السيولة الجينية كإجراء لتصنيف التشابه على مستوى الجين بين مجموعات العزلات المتسلسلة. [29] في بعض السلالات ، ظهرت الجينومات الفائقة "لانهائية"،[30] كما هو الحال في نطاق الجراثيم.[31]

الميتاجينوم

يُعرف الميتاجينوم على أنه نتيجة تحليل الجينومات الجامعة بالتزامن مع البيئة حيث تسترد وفرة وانتشار مجموعات الجينات والجينومات من خلال طلقات الميتاجينومات.[32] يشار إلى مزيج من الميتاجينومات مع الجينومات الجامعة، أيضاً باسم "metapangenomics"، يكشف عن نتائج مستوى السكان للترشيح الخاص بالموائل لمجموعة الجينات الجامعة.، يكشف عن نتائج مستوى السكان للترشيح الخاص بالموائل لمجموعة الجينات الجامعة.[33]

يعتبر مؤلفون آخرون أن Metapangenomics يوسع مفهوم الجينوم الجامع من خلال دمج تسلسلات الجين التي تم الحصول عليها من العضيات الدقيقة غير المستزرعة من خلال نهج الميتاجينوم. يشتمل metapangenome على كلا التسلسلات من الجينومات المجمعة للميتاجينوم (MAGs) ومن الجينومات التي تم الحصول عليها من العضيات الدقيقة المستزرعة.[34] تم تطبيق Metapangenomics لتقييم تنوع المجتمع، والتكيف الجرثومي، والتطور الجرثومي، والأنشطة الوظيفية، وشبكات التفاعل في المجتمع.[35] طورت منصة آنفيو سير عمل يدمج تحليل وتصور metapangenomes من خلال توليد الجينومات الجامعة ودراستها بالاقتران مع الميتاجينومات.[32]

أمثلة

الجينوم الكامل لبدائيات النوى

الجينوم الكامل للجرثومة العقدية الرئوية. (a) عدد الجينات الجديدة كدالة لعدد الجينومات المتسلسلة. ينخفض العدد المتوقع من الجينات الجديدة بشكل حاد إلى الصفر عندما يتجاوز عدد الجينومات 50. (b) عدد الجينات الأساسية كدالة لعدد الجينومات المتسلسلة. يتقارب عدد الجينات الأساسية إلى 1647 لعدد الجينومات n → ∞. من دوناتي وزملائه.[36]

عام 2018، كان 87٪ من تسلسلات الجينوم الكاملة المتاحة عبارة عن جراثيم تغذي اهتمام الباحثين بحساب الجينومات الجامعة لبدائيات النوى على مستويات تصنيفية مختلفة.[22] عام 2015، أظهرا الجراثيم المكونة من 44 سلالة من "الجرثومة العقدية الرئوية" عددًا قليلاً من الجينات الجديدة المكتشفة مع كل تسلسل جينوم جديد (انظر الشكل). في الواقع، انخفض العدد المتوقع للجينات الجديدة إلى الصفر عندما يتجاوز عدد الجينوم 50 (لاحظ، أن هذا ليس نمطًا موجودًا في جميع الأنواع). يعني هذا أن الجرثومة العقدية الرئوية لديها "جينوم جامع مغلق".[37] كان المصدر الرئيسي للجينات في الجرثومة العقدية الرئوية هو المكورات العقدية التي نُقلت الجينات منها أفقياً. حجم الجينوم الجامع للجرثومة العقدية الرئوية زاد لوغاريتميًا مع عدد السلالات وخطيًا مع عدد المواقع متعددة الأشكال للجينومات التي أخذت منها عينات، مما يشير إلى أن الجينات المكتسبة تتراكم بشكل متناسب مع عمر المستعمرات المستنسخة.[36] مثال آخر على جينوم بدائيات النوى هو "Prochlorococcus"، مجموعة الجينوم الأساسية أصغر بكثير من الجينوم الجامع، الذي تستخدمه أنواع بيئية مختلفة من "Prochlorococcus".[38] رُصد الجينوم الجامع المفتوح في العينات المعزولة بيئياً مثل البكتريا المقلية[39] والسراتية،[40] التي تظهر أسلوب حياة متكيف. ومع ذلك، فإن الجينوم الجامع المفتوح ليس حصريًا للعضيات الدقيقة، في دراسة 2015 عن جراثيم "بريفوتيلا" المعزولة من البشر، قورن المخزن الجينية لأنواعها المستمدة من مواقع جسم الإنسان المختلفة. كما أبلغ عن جينوم مفتوح يُظهر تنوعًا كبيرًا في مجموعة الجينات.[41]

خضعت العتائق أيضًا لبعض دراسات الجينوم الجامع. تُظهر الملحاء العصوية الجينوم الجامع للعائلات الجينية التالية في مجموعات الجينوم الجامع الفرعية: المركزي (300)، المكونات المتغيرة (المركزي الأملس: 998، السحابي: 36531، الهيكلي: 11784).[42]

الجينوم الجامع لحقيقيات النوى

العضيات من حقيقيات النوى مثل الفطريات، الحيوانات والنباتات أظهرت أيضًا دليلاً على الجينومات الجامعة. دُرس الجينوم الجامع في أربعة أنواع من الفطريات، عُثر على ما بين 80 و90٪ من النماذج الجينية كجينات أساسية. كانت الجينات الملحقة المتبقية مشاركة بشكل رئيسي في التسبب بالمرض ومقاومة مضادات الجراثيم.[43]

في الحيوانات، دُرس الجينوم الجامع البشري. عام 2010، قدرت دراسة أن الجينوم البشري الكامل يحتوي على -19-40 Megabases من تسلسل جديد غير موجود في الجينوم المرجعي الموجود.[44] عام 2011 كان هدف كونسورتيوم الجينوم البشري الجامع هدف معرفة تنوع الجينوم البشري.

بين النباتات، هناك أمثلة على دراسة الجينوم الجامع في الأنواع النموذجية، وساء ثنائية الصبغيات [9] ومتعددة الصبغيات،[10] وقائمة متزايدة من المحاصيل.[45][46]

المفهوم النباتي الناشئ هو مفهوم pan-NLRome، وهو مخخزون من بروتينات التكرار الغني بالليوسين (NLR) المرتبطة بالنيوكليوتيدات، ومستقبلات المناعة داخل الخلايا التي تتعرف على البروتينات المسببة للأمراض وتمنحها مقاومة المرض.[47]

الجينوم الجامع الفيروسي

ليس بالضرورة أن يكون للفيروس جينات مشتركة واسعة النطاقة بواسطة الكتل مثل حالة 16S في الجراثيم، وبالتالي فإن الجينوم المركزي لنطاق الفيروس الكامل فارغ. ومع ذلك، فقد حسبت العديد من الدراسات الجينوم الجامع لبعض السلالات الفيروسية. يتكون الجينوم الأساسي من ستة أنواع من فيروسات باندورا 352 عائلة جينية فقط 4.7٪ من الجينوم الجامع، مما يؤدي إلى فتح الجينوم الجامع.[48]

هياكل البيانات

يتزايد عدد الجينومات المتسلسلة باستمرار، "لن يكون مجرد توسيع خطوط أنابيب المعلوماتية الحيوية الراسخة كافياً للاستفادة من الإمكانات الكاملة لمجموعات البيانات الجينومية الثرية هذه".[49] الرسوم البيانية للجينومات الجامعة هي هياكل بيانات ناشئة مصممة لتمثيل الجينومات الجامعة ولتخطيط القراءات لها بكفاءة. تمت مراجعتها من قبل أيزنجا وزملائه. [50]

أدوات البرمجيات

تحليل الجينوم الجامع لجراثيم العقدية القاطعة للدر.[2] مثال على السلالات المصنوعة باستخدام برنامج BPGA. يتيح لنا هذا البرنامج إنشاء سلالات تستند إلى تجميع الجينوم المركزي أو الجينوم الجامع. لا تتطابق عمليات إعادة البناء الجوهرية والتطورية بالضرورة.

مع زيادة الاهتمام بالجينومات الجامعة، تم تطوير العديد من أدوات البرمجيات للمساعدة في تحليل هذا النوع من البيانات. لبدء تحليل الجينوم الجامع فإن الخطوة الأولى هي تجانس شرح الجينوم.[23] يجب استخدام نفس البرنامج للتعليق على جميع الجينومات المستخدمة، مثل GeneMark[51] أوRAST.[52] عام 2015، استعرضت مجموعة الأنواع المختلفة من التحليلات والأدوات التي قد تكون متاحة للباحث.[53] هناك سبعة أنواع من البرامج المطورة لتحليل الجينومات الجامعة: تلك المخصصة للجينات المتجانسة العنقودية؛ تحديد SNPs؛ مخطط ملامح الجينوم الجامع. بناء علاقات النشوء والتطور للجينات المتعامدة/عائلات السلالات/العزلات؛ البحث القائم على الوظيفة؛ الشرح و/أو التنظيم؛ والتصور.[53]

أكثر أداتين برمجيتين تم الاستشهاد بهما لتحليل الجينوم الجامع في نهاية عام 2014[53] هما Panseq[54]وخط أنابيب تحليل الجينومات الجامعة (PGAP).[55] تتضمن الخيارات الأخرى BPGA – خط أنابيب تحليل الجينوم الجامع لجينومات بدائيات النوى،[56] GET_HOMOLOGUES،[57] رواري.[58] وPanDelos.[59] نُشرت مراجعة عام 2015 تركز على الجينومات الجامعة لبدائيات النوى[60] وأخرى على الجينومات الجامعة للنباتات.[61] من بين حزم البرامج الأولى المصممة للجينومات الجامعة للنباتات برنامج PanTools.[62] و GET_HOMOLOGUES-EST.[11][57] عام 2018 نُشرت panX، أداة وب تفاعلية تسمح بفحص اتاريخ التطوري لعائلات الجينات.[63] يمكن لبرنامج panX عرض محاذاة الجينوم، وشجرة النشوء والتطور، ورسم خرائط للطفرات والاستدلال حول اكتساب وفقدان الأسرة في سلالة الجينوم الأساسي. في 2019 OrthoVenn 2.0 [64] الذي سمح بالتصور المقارن لعائلات الجينات المتماثلة في مخططات فين حتى 12 جينومًا.

Pangenome graph of 3 117 Acinetobacter baumannii genomes. Edges correspond to genomic colocalization and nodes correspond to genes. The thickness of the edges is proportional to the number of genomes sharing that link. The edges between persistent (similar to core genes), shell and cloud nodes are colored in orange, green and blue, respectively.
رسم بياني للجينوم الجامع لـ 3117 جينوم للراكدة البومانية تم إنشاؤه باستخدام برنامج PPanGGOLiN. تتوافق الحواف مع الترابط الجيني وتتوافق العقد مع الجينات. يتناسب سمك الحواف مع عدد الجينومات التي تتشارك في هذا الارتباط. الحواف ملونة بين العقد الثابتة (على غرار الجينات المركزية) والجينات الهيكلية والسحابية ملونة باللون البرتقالي والأخضر والأزرق على التوالي.

عام 2020 كانت منصة آنفيو[1] متاحة كمنصة متعددة الأنظمة تحتوي على تحليلات للجينوم الجامع و metapangenomic بالإضافة إلى سير عمل التصور. في آنفيو، يُعرض الجينوم في دوائر متحدة المركز ويمثل كل نصف قطر عائلة جينية، مما يسمح بمقارنة أكثر من 100 جينوم في تصورها التفاعلي. عام 2020، صدرت مقارنة حسابية لأدوات استخراج محتويات الجينوم الجامع المستندة إلى الجينات (مثل GET_HOMOLOGUES و PanDelos و Roary وغيرها).[65] قورنت الأدوات من منظور منهجي، وتم تحليل الأسباب التي تؤدي إلى تفوق منهجية معينة على الأدوات الأخرى. أجري التحليل من خلال مراعاة المجموعات الجرثومية المختلفة، والتي يتم إنشاؤها صناعياً عن طريق تغيير المعلمات التطورية. تظهر النتائج تمايزًا في أداء كل أداة يعتمد على تكوين جينومات الإدخال. مرة أخرى عام 2020، طرحت العديد من الأدوات تمثيلًا رسوميًا للجينومات الجامعة النباتية التي تُظهر تواصل الجينات (PPanGGOLiN،[45] Panaroo[63]).

مثال على المخرجات المحتملة لبرنامج BPGA. تحليل الجينومات الجامعة للجراثيم "العقدية القاطعة للدر". على اليسار، يُعرض توزيع شروط Go حسب الجينوم الأساسي/القابل للاستغناء/الفريد. في هذا المثال، يتم إثراء فئة النسخ المتماثل وإعادة التركيب والإصلاح في عائلات جينية فريدة. على اليمين، يُعرض مخطط عموم/ قلب نموذجي، عندما يضيف المزيد من الجينوم، يتناقص حجم اللب، وعلى العكس من ذلك، يزداد حجم الجينوم الجامع.[2]


. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

الجينوم الجامع للبشر

يُظهر مرجع الجينوم الجامع الجديد العديد من المسارات الممكنة للتسلسل، ممثلة بألوان مختلفة: الأصفر هو متغير تكرار؛ اللون الوردي هو البديل المعكوس. يمثل اللون الأخضر والأزرق متغيرًا للحذف، بينما يمثل اللون الأزرق الفاتح أحد متغيرات الإدراج.
رسم بياني يوضح خريطة الجينوم الجديدة تحتوي 18 صفًا من 12 نطاقًا لونيًا، حيث يمثل كل نطاق متغيرًا واحدًا من النيوكليوتيدات. وهي ملونة باللون البرتقالي والأرجواني والوردي والأزرق والأصفر والأخضر والأزرق الداكن وألوان أخرى.

كشف العلماء عن جينوم بشري أكثر تنوعًا، يسمى الجينوم الجامع. يمكن للجينوم الجامع الذي يجمع التسلسلات الجينية من 47 شخصًا من خلفيات عرقية متنوعة، أن يوسع نطاق الطب الشخصي بشكل كبير. يشبه مرجع الجينوم الجديد متاهة الذرة، مع مسارات بديلة ومسارات جانبية تسمح للعلماء باستكشاف نطاق أوسع من التنوع الجيني الموجود في الناس في جميع أنحاء العالم.[66]

بعد أكثر من 20 عامًا من إصدار العلماء لأول مرة مسودة تسلسل الجينوم البشري، اعيد كتابة كتاب الحياة الذي طال انتظاره. نُشرت نسخة أكثر دقة وشمولية من الشفرة الجينية في 10 مايو 2023، مما يمثل خطوة كبيرة نحو فهم أعمق لبيولوجيا الإنسان والطب الشخصي للأشخاص من مجموعة واسعة من الخلفيات العرقية والإثنية.

على عكس المرجع السابق - الذي كان يعتمد إلى حد كبير على الحمض النووي لرجل مختلط العرق من بوفالو، مع مدخلات من بضع عشرات من الأفراد الآخرين، معظمهم من أصل أوروبي - يشتمل "الجينوم الجامع" الجديد على تسلسلات جينية شبه كاملة من 47 رجلاً وامرأة من أصول متنوعة، بما في ذلك الأمريكيون من أصل أفريقي وجزر الكاريبي وشرق آسيا وغرب أفريقيا وأمريكا الجنوبية.

تمثل خريطة الجينوم التي تم تجديدها أداة حاسمة للعلماء والأطباء الذين يأملون في تحديد الاختلافات الجينية المرتبطة بالمرض. وقال الباحثون إنه يعد أيضًا بتقديم علاجات يمكن أن تفيد جميع الأشخاص، بغض النظر عن العرق أو السلالة.

قال إيوان بيرني، عالم الوراثة ونائب المدير العام لمختبر البيولوجيا الجزيئية الأوروبي، الذي لم يشارك في هذا الجهد: "لقد كانت هناك حاجة إلى ذلك منذ فترة طويلة - وقد قاموا بعمل جيد للغاية". "سيؤدي هذا إلى تحسين فهمنا الدقيق للتنوع ، ومن ثم سيفتح هذا البحث فرصًا جديدة للتطبيقات السريرية."

مدعومًا بأحدث تقنيات تسلسل الحمض النووي، يجمع الجينوم الجامع جميع الجينومات الفريدة البالغ عددها 47 في مورد واحد، مما يوفر الصورة الأكثر تفصيلاً حتى الآن للشفرة التي تشغل خلايانا. تم الآن سد الثغرات في المرجع السابق، مع ما يقرب من 120 مليون حرف دنا مفقود سابقًا مضافًا إلى الشفرة المكونة من ثلاثة مليارات حرف.

لقد ولت فكرة وجود خيط طوطمي من الحمض النووي يمتد ستة أقدام عندما يتم لفه ويمتد في خط مستقيم. الآن، يشبه المرجع المعاد تشغيله متاهة الذرة ، مع مسارات بديلة ومسارات جانبية تسمح للعلماء باستكشاف نطاق أوسع من التنوع الجيني الموجود في الناس في جميع أنحاء العالم.

يشبه الدكتور إريك جرين، مدير المعهد القومي لبحوث الجينوم البشري، الوكالة الحكومية التي مولت العمل، هذا النوع من التشققات بنوع جديد من دليل هيكل السيارة لمحلات إصلاح السيارات. بينما في السابق، كان لدى كل ميكانيكي مواصفات تصميم لنوع واحد فقط من السيارات، يوجد الآن مخطط رئيسي يغطي الماركات والموديلات المختلفة. وقال: "لقد انتقلنا من امتلاك مخطط واحد رائع حقًا لشيفي إلى وجود مخططات لـ 47 سيارة تمثيلية من كل من 47 مصنعًا مختلفًا".

إن معرفة ما يجب فعله مع كتاب كيلي الأزرق لعلم الجينوم سوف ينطوي على منحنى تعليمي حاد. هناك حاجة إلى أدوات تحليلية جديدة. يجب إعادة تعريف أنظمة التنسيق. سيستغرق التبني على نطاق واسع وقتًا. لكن الخبراء قالوا إنه في الوقت المناسب، سيحدث الجينوم الجامع ثورة في مجال الطب الجينومي.

قال إيفان إيشلر، عالم الجينوم في جامعة واشنطن: "سنستفيد من فهم أنفسنا فعليًا كأنواع أفضل بكثير". كان الدكتور إيشلر من بين أكثر من 100 عالم وخبير في أخلاقيات علم الأحياء ممن وصفوا مرجع الجينوم الجامع الجديد في مجلة ناتشر.

يواصل مهندسو المشروع إضافة المزيد من المجموعات السكانية، بهدف تضمين ما لا يقل عن 350 جينومًا عالي الجودة يشمل الجزء الأكبر من التنوع البشري العالمي. قال إيرا هول، عالم الوراثة الذي يقود مركز ييل للصحة الجينية: "نريد تمثيل جميع فروع الشجرة البشرية".

ستأتي بعض الجينومات الجديدة من سكان نيويورك الذين شاركوا سابقًا في برنامج بحثي في نظام جبل سيناء الصحي. إذا بدا أن بيانات الحمض النووي الأولية الخاصة بهم تعكس خلفيات وراثية معينة ناقصة التمثيل ، فسيتم دعوة هؤلاء الأفراد للمشاركة في مشروع الجينوم الجامع.

قد لا يتم سد بعض الفجوات في المرجع المتاح للجمهور، على الرغم من التصميم. غالبًا ما كانت المحاولات السابقة لالتقاط التنوع الجيني البشري تستخرج بيانات التسلسل من السكان المهمشين دون مراعاة احتياجاتهم وتفضيلاتهم. بناءً على تلك الأخطاء الأخلاقية ، يتعاون منسقو الجينوم الجامع الآن مع مجموعات السكان الأصليين لتطوير سياسات رسمية حول ملكية البيانات.

قالت باربرا كونيغ، أخصائية أخلاقيات علم الأحياء في جامعة كاليفورنيا، سان فرانسيسكو، والتي شاركت في المشروع: "ما زلنا نتصارع مع مسألة السيادة الأصلية والقبلية". في أستراليا، يقوم الباحثون بدمج تسلسلات الحمض النووي من مختلف الشعوب الأصلية في مستودع مماثل سيتم دمجه مع الجينوم الجامع مفتوح المصدر، ولكن بعد ذلك يتم الاحتفاظ به خلف جدار حماية. وفقًا لهارديب باتل من المركز الوطني الأسترالي لعلم الجينوم الأصلي في كانبرا، فإن العلماء يخططون بعد ذلك للتشاور مع قادة المجتمع حول ما إذا كان سيتم إتاحة البيانات من خلال الطلب أم لا

يريد بعض المدافعين عن السكان الأصليين رؤية مشروع الجينوم الجامع يذهب إلى أبعد من ذلك. اقترح كيولو فوكس، عالم الجينوم في جامعة كاليفورنيا، سان دييغو، وهو من سكان هاواي الأصليين، تدريب الجيل القادم من علماء السكان الأصليين ليكون لديهم وكالة أكبر على البيانات الجينية. قال الدكتور فوكس: "لقد حان الوقت أخيرًا لأن نضع اللامركزية في السلطة والسيطرة ونعيد توزيع ذلك بين المجتمعات نفسها".

انظر أيضاً

المصادر

  1. ^ أ ب Eren AM, Kiefl E, Shaiber A, Veseli I, Miller SE, Schechter MS, et al. (January 2021). "Community-led, integrated, reproducible multi-omics with anvi'o". Nature Microbiology. 6 (1): 3–6. doi:10.1038/s41564-020-00834-3. PMC 8116326. PMID 33349678.
  2. ^ أ ب ت ث ج ح خ د ذ ر ز س Tettelin, Hervé; Masignani, Vega; Cieslewicz, Michael J.; Donati, Claudio; Medini, Duccio; Ward, Naomi L.; Angiuoli, Samuel V.; Crabtree, Jonathan; Jones, Amanda L.; Durkin, A. Scott; DeBoy, Robert T. (2005-09-27). "Genome analysis of multiple pathogenic isolates of Streptococcus agalactiae: Implications for the microbial "pan-genome"". Proceedings of the National Academy of Sciences (in الإنجليزية). 102 (39): 13950–13955. Bibcode:2005PNAS..10213950T. doi:10.1073/pnas.0506758102. ISSN 0027-8424. PMC 1216834. PMID 16172379.
  3. ^ أ ب ت Medini D, Donati C, Tettelin H, Masignani V, Rappuoli R (December 2005). "The microbial pan-genome". Current Opinion in Genetics & Development. 15 (6): 589–94. doi:10.1016/j.gde.2005.09.006. PMID 16185861.
  4. ^ أ ب ت ث Vernikos G, Medini D, Riley DR, Tettelin H (February 2015). "Ten years of pan-genome analyses". Current Opinion in Microbiology. 23: 148–54. doi:10.1016/j.mib.2014.11.016. PMID 25483351.
  5. ^ أ ب Marroni F, Pinosio S, Morgante M (April 2014). "Structural variation and genome complexity: is dispensable really dispensable?". Current Opinion in Plant Biology. 18: 31–36. doi:10.1016/j.pbi.2014.01.003. PMID 24548794.
  6. ^ Wolf YI, Makarova KS, Yutin N, Koonin EV (December 2012). "Updated clusters of orthologous genes for Archaea: a complex ancestor of the Archaea and the byways of horizontal gene transfer". Biology Direct. 7: 46. doi:10.1186/1745-6150-7-46. PMC 3534625. PMID 23241446.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  7. ^ Mira A, Martín-Cuadrado AB, D'Auria G, Rodríguez-Valera F (2010). "The bacterial pan-genome:a new paradigm in microbiology". Int Microbiol. 13 (2): 45–57. doi:10.2436/20.1501.01.110. PMID 20890839.
  8. ^ Morgante M, De Paoli E, Radovic S (April 2007). "Transposable elements and the plant pan-genomes". Current Opinion in Plant Biology. 10 (2): 149–55. doi:10.1016/j.pbi.2007.02.001. PMID 17300983.
  9. ^ أ ب Gordon SP, Contreras-Moreira B, Woods DP, Des Marais DL, Burgess D, Shu S, et al. (December 2017). "Extensive gene content variation in the Brachypodium distachyon pan-genome correlates with population structure". Nature Communications. 8 (1): 2184. Bibcode:2017NatCo...8.2184G. doi:10.1038/s41467-017-02292-8. PMC 5736591. PMID 29259172.
  10. ^ أ ب Gordon SP, Contreras-Moreira B, Levy JH, Djamei A, Czedik-Eysenberg A, Tartaglio VS, et al. (July 2020). "Gradual polyploid genome evolution revealed by pan-genomic analysis of Brachypodium hybridum and its diploid progenitors". Nature Communications. 11 (1): 3670. Bibcode:2020NatCo..11.3670G. doi:10.1038/s41467-020-17302-5. PMC 7391716. PMID 32728126.
  11. ^ أ ب Contreras-Moreira B, Cantalapiedra CP, García-Pereira MJ, Gordon SP, Vogel JP, Igartua E, et al. (February 2017). "Analysis of Plant Pan-Genomes and Transcriptomes with GET_HOMOLOGUES-EST, a Clustering Solution for Sequences of the Same Species". Frontiers in Plant Science. 8: 184. doi:10.3389/fpls.2017.00184. PMC 5306281. PMID 28261241.
  12. ^ Reno ML, Held NL, Fields CJ, Burke PV, Whitaker RJ (May 2009). "Biogeography of the Sulfolobus islandicus pan-genome". Proceedings of the National Academy of Sciences of the United States of America. 106 (21): 8605–10. Bibcode:2009PNAS..106.8605R. doi:10.1073/pnas.0808945106. PMC 2689034. PMID 19435847.
  13. ^ Reinhardt JA, Baltrus DA, Nishimura MT, Jeck WR, Jones CD, Dangl JL (February 2009). "De novo assembly using low-coverage short read sequence data from the rice pathogen Pseudomonas syringae pv. oryzae". Genome Research. 19 (2): 294–305. doi:10.1101/gr.083311.108. PMC 2652211. PMID 19015323.
  14. ^ Tettelin H, Medini D (2020). Tettelin H, Medini D (eds.). The Pangenome (PDF) (in الإنجليزية البريطانية). doi:10.1007/978-3-030-38281-0. ISBN 978-3-030-38280-3. PMID 32633908. S2CID 217167361.
  15. ^ أ ب Halachev MR, Loman NJ, Pallen MJ (2011). "Calculating orthologs in bacteria and Archaea: a divide and conquer approach". PLOS ONE. 6 (12): e28388. Bibcode:2011PLoSO...628388H. doi:10.1371/journal.pone.0028388. PMC 3236195. PMID 22174796.
  16. ^ Blaustein RA, McFarland AG, Ben Maamar S, Lopez A, Castro-Wallace S, Hartmann EM (2019). "Pangenomic Approach To Understanding Microbial Adaptations within a Model Built Environment, the International Space Station, Relative to Human Hosts and Soil". mSystems. 4 (1): e00281-18. doi:10.1128/mSystems.00281-18. PMC 6325168. PMID 30637341.
  17. ^ Mosquera-Rendón J, Rada-Bravo AM, Cárdenas-Brito S, Corredor M, Restrepo-Pineda E, Benítez-Páez A (January 2016). "Pangenome-wide and molecular evolution analyses of the Pseudomonas aeruginosa species". BMC Genomics. 17 (45): 45. doi:10.1186/s12864-016-2364-4. PMC 4710005. PMID 26754847.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  18. ^ Snipen L, Ussery DW (January 2010). "Standard operating procedure for computing pangenome trees". Standards in Genomic Sciences. 2 (1): 135–41. doi:10.4056/sigs.38923. PMC 3035256. PMID 21304685.
  19. ^ Sélem-Mojica N, Aguilar C, Gutiérrez-García K, Martínez-Guerrero CE, Barona-Gómez F (December 2019). "EvoMining reveals the origin and fate of natural product biosynthetic enzymes". Microbial Genomics. 5 (12): e000260. doi:10.1099/mgen.0.000260. PMC 6939163. PMID 30946645.
  20. ^ Juárez-Vázquez AL, Edirisinghe JN, Verduzco-Castro EA, Michalska K, Wu C, Noda-García L, et al. (March 2017). "Evolution of substrate specificity in a retained enzyme driven by gene loss". eLife. 6 (6): e22679. doi:10.7554/eLife.22679. PMC 5404923. PMID 28362260.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  21. ^ Noda-García L, Camacho-Zarco AR, Medina-Ruíz S, Gaytán P, Carrillo-Tripp M, Fülöp V, Barona-Gómez F (September 2013). "Evolution of substrate specificity in a recipient's enzyme following horizontal gene transfer". Molecular Biology and Evolution. 30 (9): 2024–34. doi:10.1093/molbev/mst115. PMID 23800623.
  22. ^ أ ب Vernikos GS (2020). "A Review of Pangenome Tools and Recent Studies". The Pangenome: 89–112. doi:10.1007/978-3-030-38281-0_4. ISBN 978-3-030-38280-3. PMID 32633917. S2CID 219011507.
  23. ^ أ ب Costa SS, Guimarães LC, Silva A, Soares SC, Baraúna RA (2020). "First Steps in the Analysis of Prokaryotic Pan-Genomes". Bioinformatics and Biology Insights. 14: 1177932220938064. doi:10.1177/1177932220938064. PMC 7418249. PMID 32843837.
  24. ^ Land M, Hauser L, Jun SR, Nookaew I, Leuze MR, Ahn TH, et al. (March 2015). "Insights from 20 years of bacterial genome sequencing". Functional & Integrative Genomics. 15 (2): 141–61. doi:10.1007/s10142-015-0433-4. PMC 4361730. PMID 25722247.
  25. ^ Argemi X, Matelska D, Ginalski K, Riegel P, Hansmann Y, Bloom J, et al. (August 2018). "Comparative genomic analysis of Staphylococcus lugdunensis shows a closed pan-genome and multiple barriers to horizontal gene transfer". BMC Genomics. 19 (1): 621. doi:10.1186/s12864-018-4978-1. PMC 6102843. PMID 30126366.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  26. ^ Brockhurst MA, Harrison E, Hall JP, Richards T, McNally A, MacLean C (October 2019). "The Ecology and Evolution of Pangenomes". Current Biology. 29 (20): R1094–R1103. doi:10.1016/j.cub.2019.08.012. PMID 31639358. S2CID 204823648.
  27. ^ McInerney JO, McNally A, O'Connell MJ (March 2017). "Why prokaryotes have pangenomes" (PDF). Nature Microbiology. 2 (4): 17040. doi:10.1038/nmicrobiol.2017.40. PMID 28350002. S2CID 19612970.
  28. ^ Koonin EV (June 2015). "The Turbulent Network Dynamics of Microbial Evolution and the Statistical Tree of Life". Journal of Molecular Evolution. 80 (5–6): 244–50. Bibcode:2015JMolE..80..244K. doi:10.1007/s00239-015-9679-7. PMC 4472940. PMID 25894542.
  29. ^ Kislyuk AO, Haegeman B, Bergman NH, Weitz JS (January 2011). "Genomic fluidity: an integrative view of gene diversity within microbial populations". BMC Genomics. 12 (12): 32. doi:10.1186/1471-2164-12-32. PMC 3030549. PMID 21232151.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  30. ^ Puigbò P, Lobkovsky AE, Kristensen DM, Wolf YI, Koonin EV (August 2014). "Genomes in turmoil: quantification of genome dynamics in prokaryote supergenomes". BMC Biology. 12 (66): 66. doi:10.1186/s12915-014-0066-4. PMC 4166000. PMID 25141959.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  31. ^ Lapierre P, Gogarten JP (March 2009). "Estimating the size of the bacterial pan-genome". Trends in Genetics. 25 (3): 107–10. doi:10.1016/j.tig.2008.12.004. PMID 19168257.
  32. ^ أ ب Delmont, TO; Eren, AM (2018). "Linking pangenomes and metagenomes: the Prochlorococcus metapangenome". PeerJ. 6: e4320. doi:10.7717/peerj.4320. PMC 5804319. PMID 29423345.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  33. ^ Utter, Daniel R.; Borisy, Gary G.; Eren, A. Murat; Cavanaugh, Colleen M.; Mark Welch, Jessica L. (2020-12-16). "Metapangenomics of the oral microbiome provides insights into habitat adaptation and cultivar diversity". Genome Biology. 21 (1): 293. doi:10.1186/s13059-020-02200-2. PMC 7739467. PMID 33323129.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  34. ^ Ma B, France M, Ravel J (2020). "Meta-Pangenome: At the Crossroad of Pangenomics and Metagenomics.". In Tettelin H, Medini D (eds.). The Pangenome: Diversity, Dynamics and Evolution of Genomes. Springer. pp. 205–218. doi:10.1007/978-3-030-38281-0_9. ISBN 978-3-030-38281-0. PMID 32633911. S2CID 219067583.
  35. ^ Zhong C, Chen C, Wang L, Ning K (2021). "Integrating pan-genome with metagenome for microbial community profiling". Computational and Structural Biotechnology Journal. 19: 1458–1466. doi:10.1016/j.csbj.2021.02.021. PMC 8010324. PMID 33841754.
  36. ^ أ ب Donati C, Hiller NL, Tettelin H, Muzzi A, Croucher NJ, Angiuoli SV, et al. (2010). "Structure and dynamics of the pan-genome of Streptococcus pneumoniae and closely related species". Genome Biology. 11 (10): R107. doi:10.1186/gb-2010-11-10-r107. PMC 3218663. PMID 21034474.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  37. ^ Rouli L, Merhej V, Fournier PE, Raoult D (September 2015). "The bacterial pangenome as a new tool for analysing pathogenic bacteria". New Microbes and New Infections. 7: 72–85. doi:10.1016/j.nmni.2015.06.005. PMC 4552756. PMID 26442149.
  38. ^ Kettler GC, Martiny AC, Huang K, Zucker J, Coleman ML, Rodrigue S, et al. (December 2007). "Patterns and implications of gene gain and loss in the evolution of Prochlorococcus". PLOS Genetics. 3 (12): e231. doi:10.1371/journal.pgen.0030231. PMC 2151091. PMID 18159947.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  39. ^ Basharat Z, Yasmin A, He T, Tong Y (2018). "Genome sequencing and analysis of Alcaligenes faecalis subsp. phenolicus MB207". Scientific Reports. 8 (1): 3616. Bibcode:2018NatSR...8.3616B. doi:10.1038/s41598-018-21919-4. PMC 5827749. PMID 29483539.
  40. ^ Basharat Z, Yasmin A (2016). "Pan-genome Analysis of the Genus Serratia". arXiv:1610.04160 [q-bio.GN].
  41. ^ Gupta VK, Chaudhari NM, Iskepalli S, Dutta C (March 2015). "Divergences in gene repertoire among the reference Prevotella genomes derived from distinct body sites of human". BMC Genomics. 16 (153): 153. doi:10.1186/s12864-015-1350-6. PMC 4359502. PMID 25887946.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  42. ^ Gaba S, Kumari A, Medema M, Kaushik R (December 2020). "Pan-genome analysis and ancestral state reconstruction of class halobacteria: probability of a new super-order". Scientific Reports. 10 (1): 21205. Bibcode:2020NatSR..1021205G. doi:10.1038/s41598-020-77723-6. PMC 7713125. PMID 33273480.
  43. ^ McCarthy CG, Fitzpatrick DA (February 2019). "Pan-genome analyses of model fungal species". Microbial Genomics. 5 (2). doi:10.1099/mgen.0.000243. PMC 6421352. PMID 30714895.
  44. ^ Li R, Li Y, Zheng H, Luo R, Zhu H, Li Q, Qian W, Ren Y, Tian G, Li J, Zhou G, Zhu X, Wu H, Qin J, Jin X, Li D, Cao H, Hu X, Blanche H, Cann H, Zhang X, Li S, Bolund L, Kristiansen K, Yang H, Wang J, Wang J (2010). "Building the sequence map of the human pan-genome". Nat Biotechnol. 28 (1): 57–63. doi:10.1038/nbt.1596. PMID 19997067. S2CID 205274447.
  45. ^ أ ب Gao L, Gonda I, Sun H, et al. (May 2019). "The tomato pan-genome uncovers new genes and a rare allele regulating fruit flavor". Nature Genetics. 51 (6): 1044–51. doi:10.1038/s41588-019-0410-2. PMID 31086351. S2CID 152283283.
  46. ^ Jayakodi M, Padmarasu S, Haberer G, et al. (Nov 2020). "The barley pan-genome reveals the hidden legacy of mutation breeding". Nature. 588 (7837): 284–9. Bibcode:2020Natur.588..284J. doi:10.1038/s41586-020-2947-8. PMC 7759462. PMID 33239781.
  47. ^ Van de Weyer AL, Monteiro F, Furzer OJ, Nishimura MT, Cevik V, Witek K, Jones JD, Dangl JL, Weigel D, Bemm F (August 2019). "A Species-Wide Inventory of NLR Genes and Alleles in Arabidopsis thaliana". Cell. 178 (5): 1260–72. doi:10.1016/j.cell.2019.07.038. PMC 6709784. PMID 31442410.
  48. ^ Aherfi S, Andreani J, Baptiste E, Oumessoum A, Dornas FP, Andrade AC, et al. (2018). "A Large Open Pangenome and a Small Core Genome for Giant Pandoraviruses". Frontiers in Microbiology. 9 (9): 1486. doi:10.3389/fmicb.2018.01486. PMC 6048876. PMID 30042742.
  49. ^ The Computational Pan-Genomics Consortium (January 2018). "Computational pan-genomics: status, promises and challenges". Briefings in Bioinformatics. 19 (1): 118–135. doi:10.1093/bib/bbw089. PMC 5862344. PMID 27769991.
  50. ^ Eizenga JM, Novak AM, Sibbesen JA, Heumos S, Ghaffaari A, Hickey G, et al. (August 2020). "Pangenome Graphs". Annual Review of Genomics and Human Genetics. 21: 139–162. doi:10.1146/annurev-genom-120219-080406. PMC 8006571. PMID 32453966.
  51. ^ Besemer J, Lomsadze A, Borodovsky M (June 2001). "GeneMarkS: a self-training method for prediction of gene starts in microbial genomes. Implications for finding sequence motifs in regulatory regions". Nucleic Acids Research. 29 (12): 2607–18. doi:10.1093/nar/29.12.2607. PMC 55746. PMID 11410670.
  52. ^ Aziz RK, Bartels D, Best AA, DeJongh M, Disz T, Edwards RA, et al. (February 2008). "The RAST Server: rapid annotations using subsystems technology". BMC Genomics. 9 (9): 75. doi:10.1186/1471-2164-9-75. PMC 2265698. PMID 18261238.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  53. ^ أ ب ت Xiao J, Zhang Z, Wu J, Yu J (February 2015). "A brief review of software tools for pangenomics". Genomics, Proteomics & Bioinformatics. 13 (1): 73–6. doi:10.1016/j.gpb.2015.01.007. PMC 4411478. PMID 25721608.
  54. ^ Laing C, Buchanan C, Taboada EN, Zhang Y, Kropinski A, Villegas A, et al. (September 2010). "Pan-genome sequence analysis using Panseq: an online tool for the rapid analysis of core and accessory genomic regions". BMC Bioinformatics. 11 (1): 461. doi:10.1186/1471-2105-11-461. PMC 2949892. PMID 20843356.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  55. ^ Zhao Y, Wu J, Yang J, Sun S, Xiao J, Yu J (February 2012). "PGAP: pan-genomes analysis pipeline". Bioinformatics. 28 (3): 416–8. doi:10.1093/bioinformatics/btr655. PMC 3268234. PMID 22130594.
  56. ^ Chaudhari NM, Gupta VK, Dutta C (April 2016). "BPGA- an ultra-fast pan-genome analysis pipeline". Scientific Reports. 6 (24373): 24373. Bibcode:2016NatSR...624373C. doi:10.1038/srep24373. PMC 4829868. PMID 27071527.
  57. ^ أ ب Contreras-Moreira B, Vinuesa P (December 2013). "GET_HOMOLOGUES, a versatile software package for scalable and robust microbial pangenome analysis". Applied and Environmental Microbiology. 79 (24): 7696–701. Bibcode:2013ApEnM..79.7696C. doi:10.1128/AEM.02411-13. PMC 3837814. PMID 24096415.
  58. ^ Page AJ, Cummins CA, Hunt M, Wong VK, Reuter S, Holden MT, et al. (November 2015). "Roary: rapid large-scale prokaryote pan genome analysis". Bioinformatics. 31 (22): 3691–3. doi:10.1093/bioinformatics/btv421. PMC 4817141. PMID 26198102.
  59. ^ Bonnici V, Giugno R, Manca V (November 2018). "PanDelos: a dictionary-based method for pan-genome content discovery". BMC Bioinformatics. 19 (Suppl 15): 437. doi:10.1186/s12859-018-2417-6. PMC 6266927. PMID 30497358.{{cite journal}}: CS1 maint: unflagged free DOI (link)
  60. ^ Guimarães LC, Florczak-Wyspianska J, de Jesus LB, Viana MV, Silva A, Ramos RT, et al. (August 2015). "Inside the Pan-genome - Methods and Software Overview". Current Genomics. 16 (4): 245–52. doi:10.2174/1389202916666150423002311. PMC 4765519. PMID 27006628.
  61. ^ Golicz AA, Batley J, Edwards D (April 2016). "Towards plant pangenomics" (PDF). Plant Biotechnology Journal. 14 (4): 1099–105. doi:10.1111/pbi.12499. PMID 26593040.
  62. ^ Sheikhizadeh S, Schranz ME, Akdel M, de Ridder D, Smit S (September 2016). "PanTools: Representation, Storage and Exploration of Pan-Genomic Data". Bioinformatics. 32 (17): i487–i493. doi:10.1093/bioinformatics/btw455. PMID 27587666.
  63. ^ أ ب Ding W, Baumdicker F, Neher RA (January 2018). "panX: pan-genome analysis and exploration". Nucleic Acids Research. 46 (1): e5. doi:10.1093/nar/gkx977. PMC 5758898. PMID 29077859.
  64. ^ Xu L, Dong Z, Fang L, Luo Y, Wei Z, Guo H, et al. (July 2019). "OrthoVenn2: a web server for whole-genome comparison and annotation of orthologous clusters across multiple species". Nucleic Acids Research. 47 (W1): W52–W58. doi:10.1093/nar/gkz333. PMC 6602458. PMID 31053848.
  65. ^ Bonnici V, Maresi E, Giugno R (2020). "Challenges in gene-oriented approaches for pangenome content discovery". Briefings in Bioinformatics. 22 (3). doi:10.1093/bib/bbaa198. ISSN 1477-4054. PMID 32893299.
  66. ^ "Scientists Unveil a More Diverse Human Genome". نيويورك تايمز. 2023-05-10. Retrieved 2023-05-10.