Issue |
Med Sci (Paris)
Volume 18, Number 3, Mars 2002
|
|
---|---|---|
Page(s) | 366 - 374 | |
Section | Repères : Lexique | |
DOI | https://doi.org/10.1051/medsci/2002183366 | |
Published online | 15 March 2002 |
Modélisation des données biologiques
Bio-informatique (2)
Biological data and knowledge modeling
Inria Rhône-Alpes, 655, avenue de l’Europe, Montbonnot, 38334 Saint Ismier, France
Les bases de données dédiées à la biologie moléculaire sont un complément essentiel aux données de la littérature. Il existe aujourd’hui une grande variété de bases de données hétérogènes. Cette diversité s’explique, certes, par la variété des données biologiques, qui ne se limitent pas aux séquences, mais aussi par la variété des objectifs qui ont présidé à leur conception. Le problème majeur de la gestion des données biologiques ne résulte donc pas tant de leur volume que de cette hétérogénéité, tant en termes de nature que de format. La question fondamentale est ainsi de savoir comment intégrer ces données biologiques afin de les rendre accessibles et exploitables aussi facilement que si elles figuraient dans une seule et même base. L’examen des différentes solutions techniques proposées met en évidence la nécessité, dans tous les cas, d’expliciter et de représenter formellement les entités concernées et leurs relations. Un exemple simple mais complet de modélisation illustre cette démarche.
Abstract
In molecular biology, databases form an essential complement tothe data contained in the literature. Nowadays there exists a large number of databases of heterogeneous data. On the one hand, this diversity can be explained by the variety of biological data, going wel beyond sequences. On the other hand, the databases have been designed with different objectives in mind. The major problem for the management of biologica data is therefore no so much their volume as their hete-rogeneity (nature of the data, representational formats). Consequently, the fundamental question is to integrate the biological data in order to make them accessible and to exploit them as easily as if they were contained in the same database. The review discusses the different technical solutions that have been propo-sed thus far. Il underlines the necessity in every case to conceptualise and to represent formally the biologica entities being concerned and their relations. A simple, but complete example illustrated this approach.
© 2002 médecine/sciences - Inserm / SRMS
Current usage metrics show cumulative count of Article Views (full-text article views including HTML views, PDF and ePub downloads, according to the available data) and Abstracts Views on Vision4Press platform.
Data correspond to usage on the plateform after 2015. The current usage metrics is available 48-96 hours after online publication and is updated daily on week days.
Initial download of the metrics may take a while.