Meilleur fichiers distribué des produits de base linux de stockage à la ferme
J'ai un lot de pièces de rechange d'intel serveurs linux autour de la pose (des centaines) et que vous souhaitez les utiliser pour un système de fichiers distribués dans un site web d'hébergement et de partage de fichiers de l'environnement. Ce n'est pas pour un CPS de l'application, de sorte que de haute performance n'est pas critique. La principale exigence est de haute disponibilité, si un serveur est hors ligne, les données stockées sur les disques durs est toujours disponible à partir d'autres nœuds. Il doit s'exécuter sur TCP/IP et de fournir la norme POSIX autorisations de fichier.
J'ai regardé le suivant:
-
Lustre (http://wiki.lustre.org/index.php?title=Main_Page): Vient vraiment près, mais il ne fournit pas de redondance des données sur un nœud. Vous devez rendre les données d'HA à l'aide de RAID ou de DRBD. Pris en charge par le Soleil et l'Open Source, de sorte qu'il devrait être autour pendant un moment
-
gfarm (http://datafarm.apgrid.org/): il Semble qu'il fournit la redondance, mais au prix de la complexité et de la maintenabilité. Pas pris en charge que du Lustre.
Quelqu'un a une expérience avec ce produit ou de tout autre système qui pourrait fonctionner?
- Aimeriez-vous partager avec nous votre décision finale sur elle?
Vous devez vous connecter pour publier un commentaire.
vérifier également GlusterFS
Édition (Août-2012): Ceph est enfin prêt. Récemment, les auteurs ont formé Inktank, une entreprise indépendante à vendre à des conditions commerciales favorables. Selon certains presentaions, le montage conforme à POSIX système de fichiers est la couche la plus élevée et pas vraiment encore testé, mais les couches inférieures sont utilisées dans la production pendant un certain temps maintenant.
La partie intéressante est la ORAD de la couche, qui présente un objet de stockage en fonction à la fois d'une "native" de l'accès via le
librados
bibliothèque (disponible en plusieurs langues) et de Amazon S3 compatible REEE de l'API. Soit on en fait plus que suffisant pour l'ajout de stockage massive à un service web.Cette vidéo est une bonne description de la philosophie, l'architecture, les capacités et l'état actuel.
À mon avis, le meilleur système de fichiers pour Linux est MooseFS , il est tout à fait nouveau, mais j'ai eu l'occasion de le comparer avec Ceph et le Lustre et j'dire pour sûr que MooseFS est le meilleur.
Gluster commence à y avoir beaucoup de presse à l'heure actuelle:
http://www.gluster.org/
Si quelqu'un vous oblige à l'utiliser, je vous recommande vivement d'utiliser autre chose que du Lustre. De ce que j'ai entendu d'autres et ce aussi me suis donné des cauchemars depuis quelques temps, c'est le fait que le Lustre assez facilement se décompose dans toutes sortes de situations. Et si un seul client dans le système tombe en panne, elle se met dans une interminable do_nothing_loop mode typiquement tout en maintenant certaines importants à l'échelle mondiale de verrouillage de sorte que la prochaine fois qu'un client tente d'accéder à la même information, il a également accrocher. Ainsi, vous finissent souvent le redémarrage de l'ensemble du cluster, qui je pense est quelque chose que vous essayez d'éviter normalement 😉
Moderne parallèle systèmes de fichiers comme FhGFS (http://www.fhgfs.com) sont plus robustes ici et vous permettent également de faire de belles choses comme la course de composants client et serveur sur la même machine (si intégré dans les fonctionnalités HA sont encore en cours de développement, comme quelqu'un de leur équipe m'a dit, mais leur mise en œuvre va être assez impressionnant de ce que j'ai entendu).
Lustre a travaillé pour nous. Il n'est pas parfait, mais c'est la seule chose que nous avons essayé et qui n'a pas brisé la charge. Nous obtenons toujours LBUGS de temps à autre, et de traiter avec 100 TO + les systèmes de fichiers n'est jamais facile, mais l'Éclat système a fonctionné et a augmenté à la fois les performances et la disponibilité.
Ceph semble être une nouvelle et prometteuse-ish entrée dans l'arène. Le site affirme qu'il n'est pas prêt pour une utilisation en production pour le moment.
J'ai lu beaucoup de choses sur les systèmes de fichiers distribués, et je pense que FhGFS est le meilleur.
http://www.fhgfs.com/
Il vaut la peine d'essayer. Voir plus à ce sujet à:
http://www.fhgfs.com/wiki/