Algèbre relationnelle

Page d’aide sur l’homonymie

Pour les articles homonymes, voir Algèbre (homonymie).

L'algèbre relationnelle est un langage de requêtes dans des bases de données relationnelles. L'algèbre relationnelle a été inventée en 1970 par Edgar Frank Codd, le directeur de recherche du centre IBM de San José.

Il s'agit de la théorie sous-jacente aux langages de requête des SGBD, comme SQL. Le théorème de Codd dit que l'algèbre relationnelle est équivalente au calcul relationnel (logique du premier ordre sans symbole de fonction). Elle est aussi équivalente à Datalog¬ (Datalog avec la négation) non récursif[1]. Datalog est un langage de requête et de règles pour les bases de données déductives.

Selon Abiteboul et al.[2], l'algèbre relationnelle est conceptuellement un langage "procédural" : en effet, les requêtes sont des suites d'opérations qui construisent la réponse. Cela s'oppose aux langages conceptuellement "déclaratifs" comme le calcul relationnel et Datalog.

Modèle relationnel

Article détaillé : Modèle relationnel.

Dans le modèle relationnel, les données sont stockées dans des tables, aussi appelées relations. Voici un exemple de relation :

Clé Nom Email
1 Alice [email protected]
2 Bob [email protected]
3 Carole [email protected]

Plus précisément[3], une relation (au sens du modèle de Codd) est constituée :

  1. d'un schéma, c'est-à-dire l'ensemble des noms des champs (ici Clé, Nom, Email), et des types correspondants (dans l'exemple respectivement, un nombre entier, puis deux chaînes de caractères).
  2. d'une extension, c'est-à-dire le contenu de la table, qui est un ensemble de n-uplets dont l'ordre n'a pas d'importance.

Définition

Le langage procédural contient les opérations ensemblistes de la théorie des ensembles[4] sur les relations ainsi que des opérations pour fusionner/projeter des relations.

Opérateurs ensemblistes

Les opérateurs ensemblistes sont l'union, l'intersection, la différence et le produit cartésien.

Union

L'union de deux relations sur le même schéma est la relation sur ce schéma contenant exactement l'union des enregistrements de ces deux relations. Formellement, R S = { t : t R   o u   t S } {\displaystyle R\cup S=\{t:t\in R\ ou\ t\in S\}\,} .

Employés de Renault
Nom ID Département
Harry 3415 Finance
Sally 2241 Vente
George 3401 Finance
Employés de Citroën
Nom ID Département
Bertrand 0808 Vente
Donald 0007 Vente
Employés de Renault U  Employés de Citroën
Nom ID Département
Harry 3415 Finance
Sally 2241 Vente
George 3401 Finance
Bertrand 0808 Vente
Donald 0007 Vente

Intersection

L'intersection de deux relations sur le même schéma est la relation sur ce schéma contenant exactement les enregistrements qui apparaissent dans les deux relations. Formellement, R S = { t : t R   e t   t S } {\displaystyle R\cap S=\{t:t\in R\ et\ t\in S\}\,} .

Personnes inscrits en football
Nom ID
Harry 3415
Sally 2241
George 3401
Personnes inscrits en cours de piano
Nom ID
Harry 3415
Bertrand 2
George 3401
Yoda 1000
Personnes inscrits en football ∩  Personnes inscrits en cours de piano
Nom ID
Harry 3415
George 3401

Différence

La différence de deux relations sur le même schéma est la relation sur ce schéma contenant exactement les enregistrements qui apparaissent dans la première relation mais pas dans la deuxième. Formellement, R S = { t : t R   e t   t S } {\displaystyle R-S=\{t:t\in R\ et\ t\not \in S\}\,} . Par exemple, on peut calculer les personnes inscrits en football mais qui ne sont pas inscrits en cours de piano :

Personnes inscrits en football
Nom ID
Harry 3415
Sally 2241
George 3401
Personnes inscrits en cours de piano
Nom ID
Harry 3415
Bertrand 2
George 3401
Yoda 1000
Personnes inscrits en football -  Personnes inscrits en cours de piano
Nom ID
Sally 2241

Produit cartésien

Avec le produit cartésien de deux relations, on recopie chaque tuple de la première relation pour chacun des tuples de la deuxième. Formellement, R × S = { ( r , s ) : r R   e t   s S } {\displaystyle R\times S=\{(r,s):r\in R\ et\ s\in S\}} .

Personnes
Nom ID
Harry 3415
Sally 2241
Cadeaux
Type Prix
livre 10
gâteau 20
ordinateur 300
Personnes -  Cadeaux
Nom ID Type Prix
Harry 3415 livre 10
Harry 3415 gâteau 20
Harry 3415 ordinateur 300
Sally 2241 livre 10
Sally 2241 gâteau 20
Sally 2241 ordinateur 300

Opérateurs relationnels

Sélection

La sélection (ou restriction) consiste à ne retenir que les enregistrements vérifiant une condition donnée. Dans l'exemple plus bas, on ne garde que les touristes dont la ville est Paris.

  • Données : Une relation R {\displaystyle R\,} et une formule F {\displaystyle F\,} formée d'une combinaison de comparaisons et de connecteurs logiques.
  • Résultat : σ F ( R ) = { r R : r {\displaystyle \sigma _{F}(R)=\{r\in R:r\,} satisfait la condition donnée par F } {\displaystyle F\}\,} , dans l'exemple σ V i l l e = P a r i s ( {\displaystyle \sigma _{Ville='Paris'}(\,} Touristes ) {\displaystyle )\,}
  • Équivalent SQL : WHERE
Touristes
idTouriste NomT Ville Sport
1 Marc Paris Ski
2 Jean Toulouse Tennis
3 Franc Marseille Football
4 Thomas Lyon Voile
5 Max Paris Golf
Sélection des touristes où Ville vaut Paris
idTouriste NomT Ville Sport
1 Marc Paris Ski
5 Max Paris Golf

Projection

La projection permet de ne garder que certains attributs. Dans l'exemple ci-dessous, on ne garde que les attributs NomT et Ville de la relation Touristes.

  • Données : Une relation R {\displaystyle R\,} et un ensemble d'attributs A {\displaystyle A\,} de R {\displaystyle R\,}
  • Résultat : π A ( R ) {\displaystyle \pi _{A}(R)\,} , qui est la Relation R {\displaystyle R\,} où on ne considère que les attributs de A {\displaystyle A\,} , par exemple π N o m T , V i l l e ( {\displaystyle \pi _{NomT,Ville}(\,} Touristes ) {\displaystyle )\,}
  • Équivalent SQL : SELECT
Touristes
idTouriste NomT Ville Sport
1 Marc Paris Ski
2 Jean Toulouse Tennis
3 Franc Marseille Football
4 Thomas Lyon Voile
5 Max Paris Golf
Projection de la relation Touristes sur les attributs NomT et Ville
NomT Ville
Marc Paris
Jean Toulouse
Franc Marseille
Thomas Lyon
Max Paris

Renommage

Renommage :

  • Données : Une relation R {\displaystyle R\,} et un attribut b {\displaystyle b\,} de R {\displaystyle R\,}
  • Résultat : ρ a / b ( R ) {\displaystyle \rho _{a/b}(R)\,} , qui est la Relation R {\displaystyle R\,} avec b {\displaystyle b\,} renommé a {\displaystyle a\,}
  • Équivalent SQL : AS

Jointure

Jointure :

  • Données : deux relations R {\displaystyle R\,} et S {\displaystyle S}
  • Résultat : R S = { ( a , b , c ) : ( a , b ) R   e t   ( b , c ) S } {\displaystyle R\bowtie S=\{(a,b,c):(a,b)\in R\ et\ (b,c)\in S\}\,}
  • Équivalent SQL : JOIN
Touristes
idTouriste NomT Ville Sport
1 Marc Paris Ski
2 Jean Toulouse Tennis
3 Franc Marseille Football
4 Thomas Lyon Voile
5 Max Paris Golf
Destinations
idTouriste VilleD
1 Cannes
2 Ibiza
4 Tokyo
Touristes ⋈ Destinations
idTouriste NomT Ville Sport VilleD
1 Marc Paris Ski Cannes
2 Jean Toulouse Tennis Ibiza
4 Thomas Lyon Voile Tokyo

Division

La division prend en entrée deux relations R ( x 1 , . . . , x m , y 1 , . . . , y p ) {\displaystyle R(x_{1},...,x_{m},y_{1},...,y_{p})\,} et S ( y 1 , . . . , y p ) {\displaystyle S(y_{1},...,y_{p})\,} . Ainsi, tout n-uplet r R {\displaystyle r\in R\,} se décompose en deux n-uplets r = ( t , s ) {\displaystyle r=(t,s)\,} , avec t = ( t 1 , . . . , t m ) {\displaystyle t=(t_{1},...,t_{m})\,} de schéma X = { x 1 , . . . , x m } {\displaystyle X=\{x_{1},...,x_{m}\}\,} et s = ( s 1 , . . . , s p ) {\displaystyle s=(s_{1},...,s_{p})\,} de schéma y = { y 1 , . . . , y p } {\displaystyle y=\{y_{1},...,y_{p}\}\,} . et retourne la table de schéma X {\displaystyle X\,} tel que R / S = { t : s S ,   ( t , s ) R } {\displaystyle R/S=\{t:\forall s\in S,\ (t,s)\in R\}\,} . La division revient à donner “tous les x tels que pour tout y...”

Expressivité

Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?

L'algèbre SPC (sélection, projection et produit cartésien) correspond au calcul conjonctif (calcul relationnel sans disjonction et sans négation) : c'est une des versions du théorème de Codd. L'algèbre SPCU- (l'algèbre SPC avec en plus l'union et la différence) correspond au calcul relationnel en entier : c'est une autre version du théorème de Codd. L'équijointure[Quoi ?] peut être exprimée avec un produit cartésien, suivi d'une sélection, puis une projection.

Optimisation

Cette section est vide, insuffisamment détaillée ou incomplète. Votre aide est la bienvenue ! Comment faire ?

Voici des règles de réécriture pour transformer une expression de l'algèbre relationnelle en une autre expression équivalente.

Implémentation

Cependant, les bases de données relationnelles ne fonctionnent pas tout à fait selon les règles ensemblistes de l'algèbre relationnelle. En effet, si l'on ne définit pas de clé primaire, il est possible d'insérer plusieurs lignes identiques dans une table, ce qui d'un point de vue ensembliste n'a pas de sens : un élément fait partie ou ne fait pas partie d'un ensemble. Si l'on veut appliquer strictement les règles des ensembles, il faut vérifier à chaque ajout dans une table que les lignes introduites ne sont pas déjà présentes.

Objets précis du modèle

Il s'agit ici de déterminer des Domaines (i.e., type atomique) :

  • Numérique : entier ou réel (SQL : Int, Float, etc.) ;
  • Chaîne de caractères (SQL : Char(20), VarChar(32), etc.) ;
  • Date (SQL : DATE, TIME, YEAR, etc.) ;
  • Type énuméré.

Notes et références

  1. (en) Foundations of Databases : The Logical Level, Addison-Wesley Longman Publishing Co., Inc., , 685 p. (ISBN 978-0-201-53771-0, lire en ligne), p. 10
  2. (en) Foundations of Databases : The Logical Level, Addison-Wesley Longman Publishing Co., Inc., , 685 p. (ISBN 978-0-201-53771-0, lire en ligne), Part B - Basics: Relational QueryLanguages - p. 35
  3. « Apprendre les bases de données et SQL », sur Developpez.com (consulté le )
  4. (ro) « Aide mémoire sur les bases de données et SQL2 », sur scritube.com (consulté le ).

Voir aussi

Sur les autres projets Wikimedia :

  • algèbre relationnelle, sur le Wiktionnaire
  • Algèbre relationnelle, sur Wikiversity

Liens externes

  • RAT, Software Rational Algebra Translator to SQL
  • (fr) Laurent Audibert, « Bases de données relationnelles », sur developpez.com
  • icône décorative Portail des bases de données
  • icône décorative Portail des mathématiques