اكتشاف أداة جديدة لتحسين البحث عن الجينات المسببة للأمراض
تعمل أداة إحصائية جديدة طورها باحثون في جامعة شيكاغو على تحسين القدرة على العثور على المتغيرات الجينية المسببة للأمراض.
الأداة، الموصوفة في ورقة بحثية جديدة نُشرت في مجلة Nature Genetics، تجمع بيانات من دراسات الارتباط على مستوى الجينوم (GWAS) وتنبؤات التعبير الجيني للحد من عدد الإيجابيات الكاذبة وتحديد الجينات السببية والمتغيرات بشكل أكثر دقة، وفقا لما تم نشره في موقع ميديكال إكسبريس.
أسلوب شائع الاستخدام
GWAS هو أسلوب شائع الاستخدام لتحديد الجينات المرتبطة بمجموعة من السمات البشرية، بما في ذلك الأمراض الأكثر شيوعًا.
يقارن الباحثون تسلسلات الجينوم لمجموعة كبيرة من الأشخاص المصابين بمرض معين، على سبيل المثال، مع مجموعة أخرى من التسلسلات من أفراد أصحاء.
يمكن أن تشير الاختلافات التي تم تحديدها في مجموعة المرض إلى المتغيرات الجينية التي تزيد من خطر الإصابة بهذا المرض وتتطلب مزيدًا من الدراسة.
ومع ذلك، فإن معظم الأمراض التي تصيب الإنسان لا تنتج عن تباين جيني واحد، وبدلا من ذلك، فهي نتيجة لتفاعل معقد بين جينات متعددة، وعوامل بيئية، ومجموعة من المتغيرات الأخرى.
ونتيجة لذلك، غالبًا ما تحدد GWAS العديد من المتغيرات عبر العديد من مناطق الجينوم المرتبطة بالمرض.
ومع ذلك، فإن حدود GWAS هي أنها تحدد الارتباط فقط، وليس السببية.
في المنطقة الجينومية النموذجية، ترتبط العديد من المتغيرات ارتباطًا وثيقًا ببعضها البعض، وذلك بسبب ظاهرة تسمى اختلال التوازن الارتباطي، وذلك لأن الحمض النووي ينتقل من جيل إلى جيل في كتل كاملة، وليس جينات فردية، لذلك تميل المتغيرات القريبة إلى الارتباط.
قال مؤلف الدراسة الجديدة، شين هي، أستاذ مشارك في علم الوراثة البشرية، وكبير الباحثين: «قد يكون لديك العديد من المتغيرات الجينية في كتلة ترتبط جميعها بمخاطر المرض، لكنك لا تعرف أي منها هو في الواقع المتغير السببي».
وأضاف: «هذا هو التحدي الأساسي الذي يواجه GWAS، وهو كيف ننتقل من الارتباط إلى السببية».
ولجعل المشكلة أكثر صعوبة، فإن معظم المتغيرات الجينية تقع في جينومات غير مشفرة، مما يجعل تفسير آثارها صعبا. إحدى الاستراتيجيات المشتركة لمواجهة هذه التحديات هي استخدام مستويات التعبير الجيني.
الأساس المنطقي لاستخدام بيانات eQTL هو أنه إذا كان المتغير المرتبط بمرض ما هو eQTL لبعض الجينات X، فمن المحتمل أن يكون X هو الرابط بين المتغير والمرض. ومع ذلك، فإن المشكلة في هذا المنطق هي أن المتغيرات القريبة وeQTLs للجينات الأخرى يمكن أن ترتبط مع eQTL للجين X بينما تؤثر على المرض بشكل مباشر، مما يؤدي إلى نتيجة إيجابية كاذبة.
لقد تم تطوير العديد من الطرق لترشيح الجينات الخطرة من GWAS باستخدام بيانات eQTL، لكنها جميعًا تعاني من هذه المشكلة الأساسية المتمثلة في الخلط بين الارتباطات القريبة. في الواقع، يمكن للطرق الحالية توليد جينات إيجابية كاذبة في أكثر من 50% من الحالات.
في الدراسة الجديدة، قام الباحثون بتطوير طريقة جديدة تسمى دراسات الارتباط السببية على مستوى النسخ، أو cTWAS، الذي يستخدم تقنيات إحصائية متقدمة لتقليل المعدلات الإيجابية الكاذبة، بدلًا من التركيز على جين واحد فقط في كل مرة، فإن نموذج cTWAS الجديد يمثل جينات ومتغيرات متعددة، باستخدام نموذج الانحدار المتعدد بايزي، يمكنه التخلص من الجينات والمتغيرات المربكة.
وقال الباحثون: «إذا نظرت إلى واحدة تلو الأخرى، فستحصل على نتائج إيجابية كاذبة، ولكن إذا نظرت إلى جميع الجينات والمتغيرات القريبة معًا، فمن الأرجح أن تجد الجين المسبب».
وتوضح الورقة فائدة هذه التقنية الجديدة من خلال دراسة الجينات لمستويات الكولسترول LDL. على سبيل المثال، رشحت طرق eQTL الحالية جينًا مشاركًا في إصلاح الحمض النووي، لكن نهج cTWAS الجديد أشار إلى متغير مختلف في الجين المستهدف للستاتين، وهو دواء شائع يستخدم لعلاج ارتفاع نسبة الكوليسترول. في المجمل، حددت cTWAS 35 جينًا سببيًا مفترضًا لـ LDL، ولم يتم الإبلاغ عن أكثر من نصفها مسبقًا. تشير هذه النتائج إلى مسارات بيولوجية جديدة وأهداف علاجية محتملة لـ LDL.
برنامج cTWAS متاح الآن للتنزيل من موقع He's lab. وهو يأمل في مواصلة العمل عليه لتوسيع قدراته لدمج أنواع أخرى من بيانات omics، مثل الربط وعلم الوراثة اللاجينية، وكذلك استخدام eQTLs من أنواع أنسجة متعددة.
وقال الباحثون: «سيسمح البرنامج للناس بإجراء التحليلات التي تربط الاختلافات الجينية بالأنماط الظاهرية. وهذا هو التحدي الرئيسي الذي يواجه المجال بأكمله.. لدينا الآن أداة أفضل بكثير لإجراء هذه الروابط».