vendredi 21 octobre 2011

NoSql : A propos d'un livre blanc

La société Smile " :-)" a publié un livre blanc sur un sujet d'actualité  : intitulé "NoSQL". 
Saluons tout d'abord l'effort déployé pour produire un document dans la langue de Molière.


Cette étude est bien ficelée, une première partie claire , avec une présentation des concepts "ACID" et "CAP", une tentative de classification classique mais utile et un panorama des solutions qui a l’intérêt de faire le tri parmi plus de 100 bases dénombrées par le site nosql-database.orgUne deuxième partie présentant trois produits de manière incomplète. Elle présente des inexactitudes, des invraisemblances et des lacunes: un document de 55 pages sur le sujet c'est important mais trop succinct.
  
Je vais être critique, trop diront certains mais cela à un objectif de clarification pas de polémique.
J'ai pris quelques points que je considère comme des analyses erronées.


1 - Evolution des SGBRD sql:
" Au fur et à mesure du temps, les structures de données manipulées par les systèmes sont devenues de plus en plus complexes avec en contrepartie des moteurs de stockage évoluant peu." 
Jetez un oeil sur l'évolution des fonctionnalités au fil des ans du SGBDR Oracle Database_features, faites de même avec  sqlserver et db2, vous constaterez par vous-même comment ces moteurs évoluent.
Je dirais plutôt que les moteurs relationnels ont tant évolué qu'ils sont devenus des outils complexes sachant tout faire et sont considérés par beaucoup comme trop lourds à gérer.
Les implémentations NoSql, au contraire,  reviennent sur le désir des services marketing de ces éditeurs que leurs produits soient la solution unique à tous les problèmes de leurs clients.

2 - Présentation des outils associés 

HDFS est oublié alors que c'est le systeme de Hbase(Hadoop) et de Cassandra ....

3 - Architecture
Les conclusions sur les produits Cassandra et Mongodb sont simplistes.  A la décharge de l'auteur, il est difficile de décrire et de prendre position sur des produits qui sont présentés dans la littérature technique en plusieurs centaines de pages.  


4 - Sauvegarde

Les chapitres sur les gestions de sauvegarde me laissent perplexe... surtout celui sur Mongodb. Est-ce que la sauvegarde est utile, possible, dans le cas d'un système réparti, distribué et hautement répliqué? 
Silence sur les fichiers log de modification et surtout c'est étrangement décrit.

5 - GridFs 

Dire que GridFS est un système de fichiers distribués c'est un gag. D'ailleurs ce qui manque dans Mongodb c'est un système de fichiers de type FUSE. 

6 - Conclusion sur Cassandra 
"Cassandra est un outil relativement complexe. Cette complexité concerne principalement les développeurs "......
Cassandra est synonyme de complexité au niveau du data modèle, de la mise en oeuvre, de la conception de la base et de l'implémentation des logiciels et matériels. 

L'auteur de "Cassandra the definitive Guide", fait la remarque suivante : If your application is expected to require dozens of nodes Cassandra might be a great fit". Sinon passez votre chemin.


Ma conclusion, un livre blanc est intéressant à lire et à confronter aux présentations sur le sujet que l'on trouve sur le Net.

Aucun commentaire: