Ontology design patterns and methods for integrating phenotype ontologies

Thumbnail Image

Date

2023

Journal Title

Journal ISSN

Volume Title

Publisher

Saudi Digital Library

Abstract

Ontologies are widely used in various domains, including biomedical research, to structure information, represent knowledge, and analyze data. The combination of ontologies from different domains is crucial for systematic data analysis and comparison of similar domains. This process requires ontology composition, integration, and alignment, which involve creating new classes by reusing classes from different domains, aggregating types of ontologies within the same domain, and finding correspondences between ontologies within the same or similar domain. This thesis presents use cases where we applied ontology composition, integration, and alignment of phenotype ontologies, and evaluated the resulting ontologies and alignment. First, we analyzed a large aging dataset of inbred laboratory mice, using Mouse Anatomy and Mouse Pathology ontologies. Second, we integrated phenotype ontologies for human and model organism phenotypes to enable comparisons of phenotypes between and within individual species. We developed Pheno-e, an extension of PhenomeNet. We identified novel abnormal anatomical classes for fly phenotypes, allowing the annotation of fly genes that were not annotated before. We demonstrate the distinct contributions of each species' phenotypic data to detecting human diseases using Pheno-e, and show that mouse phenotypic data contributes the most to the discovery of gene--disease associations. This work could guide the selection of model organisms when building methods to find gene-disease associations. Additionally, we refined class definitions in phenotypic ontologies, specifically targeting cell cardinality phenotypes. This representation resolved incorrect inferences in the utilized ontologies, enabling accurate interpretation of phenotypic descriptions. Our findings reveal that this correction enhances gene-disease prediction for diseases associated with cardinality phenotypes. Third, we introduce a novel neural-symbolic method that combines logic fundamentals with machine learning for ontology alignment. This method begins with symbolic representation, followed by iterative neural learning for alignment and symbolic representation consistency checking and reasoning, and back to neural learning. We demonstrate that our system generates noncontroversial alignments first and these alignments are coherent with respect to OWL EL. This novel method can pave the way for more accurate and efficient ontology-based methods, which can have significant implications for various semantic web applications.

Description

تستخدم الأنطولوجيات على نطاق واسع في مختلف المجالات، بما في ذلك البحوث الطبية الحيوية، لتنظيم المعلومات، تمثيل المعرفة، وتحليل البيانات. يعد تجميع الأنطولوجيات من مجالات مختلفة أمرًا حاسمًا لتحليل البيانات بشكل منهجي ومقارنة المجالات المتشابهة. هذه العملية تتطلب تكوين الأنطولوجيا ودمجها ومحاذاتها، والتي تنطوي على إنشاء فئات جديدة عن طريق إعادة استخدام الفئات من مجالات مختلفة، وتجميع أنواع الأنطولوجيات ضمن نفس المجال، وإيجاد التوافقيات بين الأنطولوجيات ضمن نفس المجال أو المجال المشابه. تقدم هذه الرسالة استخدامات حيث تم تطبيق تكوين الأنطولوجيا ودمجها ومحاذاتها لأنطولوجيات السمات الظاهرية(phenotype ontologies)، وتقييم الأنطولوجيا الناتجة ومحاذاة  الأنطولوجيات. أولاً، قمنا بتحليل مجموعة بيانات كبيرة عن الشيخوخة للفئران المختبرية المستأنسة، باستخدام أنطولوجيات تشريح الفأر وأمراض الفأر. ثانياً، دمجنا أنطولوجيات السمات الظاهرية للكائنات الحية النموذجية والبشرية لتمكين المقارنات بين الظواهر داخل وبين كل نوع. وطورنا Pheno-e، وهي أنطولوجيا موسعة  لـ PhenomeNet. تم التعرف على فئات تشريحية غير عادية جديدة لظواهر الذباب، مما سمح بتوصيف جينات ذباب لم يتم توصيفها من قبل. تمكنا من حساب المساهمات المميزة لكل نوع من بيانات السمات الظاهرية في اكتشاف الأمراض البشرية باستخدام Pheno-e، ووجدنا أن بيانات السمات الظاهرية للفأر هي الوحيدة التي أظهرت نتائج ايجابية بشكل مستمر في اكتشاف العلاقات بين جينات وأمراض الإنسان مقارنة بباقي الكائنات الأخرى التي قمنا بتحليلها. ويرجع هذا لوجود بعض التحيزات التي وضحناها ولها علاقة بطريقة جمع بيانات السمات الظاهرية للكائنات الحية. يمكن أن يوجه هذا العمل الأبحاث في هذا المجال. بالإضافة إلى ذلك، صقلنا التعريفات المنطقية للسمات الظاهرية في الأنطولوجي، مع التركيز بشكل خاص على ظواهر العددية الخلوية. حل هذا التمثيل الاستدلالات الغير صحيحة في الأنطولوجيات المستخدمة، مما يتيح تفسير دقيق لأوصاف الظاهرة. تكشف نتائجنا أن هذا التصحيح يعزز التنبؤ بالجينات المسببة للأمراض المرتبطة بظواهر العددية. ثالثاً، نقدم طريقة جديدة عصبية-رمزية تجمع بين أساسيات المنطق مع التعلم الآلي لمحاذاة الأنطولوجيا. تبدأ هذه الطريقة بالتمثيل الرمزي، تليها تعلم عصبي تكراري للمحاذاة وفحص التناسق الرمزي للتمثيل والمنطق، والعودة إلى التعلم العصبي. نظهر أن نظامنا يولد أولاً المحاذاة غير المثيرة للجدل وأن هذه المحاذاة متسقة بالنسبة لـ OWL EL. يمكن أن تمهد هذه الطريقة الجديدة الطريق لطرق أكثر دقة وكفاءة تعتمد على الأنطولوجيا، والتي يمكن أن تكون لها آثار كبيرة على تطبيقات الويب الدلالية المختلفة."

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By

Copyright owned by the Saudi Digital Library (SDL) © 2024