Hadoop Vs Données De Lac
J'ai entendu un nouveau terme Données Lac. J'ai googlé et a obtenu que
De données, un lac est une grande référentiel de stockage et de traitement du moteur. Un data lake offre massive de stockage pour tout type de données, une énorme puissance de traitement et la capacité de gérer presque illimité de tâches simultanées ou des emplois"
Les données à long terme du lac est souvent associée avec Hadoop orientée objet de stockage. Dans un tel scénario, les données d'une entreprise est d'abord chargé dans la plate-forme Hadoop, et puis, business analytics et les outils d'exploration de données sont appliquées aux données où il réside sur Hadoop cluster de nœuds de produits de base des ordinateurs.
Même chose est faite par Hadoop. Nous avons HDFS pour le Stockage et MapReduce pour le Calcul.
Je suis un peu peu tromper sur Hadoop et les Données du lac. Quelle est la différence entre les deux. Si elles sont les mêmes que pourquoi ce terme surviennent. Ou comment définir un data lake.
pauvre de moi j'ai entendu parler d'elle aujourd'hui. LOL
OriginalL'auteur Kishore | 2016-03-14
Vous devez vous connecter pour publier un commentaire.
Données Lake est un résumé "idée". Hadoop est spécifique de la technologie/logiciel. Vous pouvez mettre en place un data lake en utilisant hadoop ou à l'aide de différents outils.
HDFS est juste un système de fichiers. Donc pas.
Selon Wikipédia , Oui. "Un exemple de données de lac est le système de fichiers distribués utilisé dans Apache Hadoop."
Wikipédia peut être édité par n'importe qui. FAT32 peut être utilisé pour stocker des trucs aussi.
OriginalL'auteur facha
Données de Lac est une méthode de stockage de données dans un système qui facilite la collecte de données dans la variante des schémas et des formes structurelles, généralement de l'objet blob ou des fichiers.
Le concept d'un lac est étroitement lié à Apache Hadoop et son écosystème de projets open source. Toutes les discussions portant sur les données le lac de rapidement mener à une description de la façon de construire un data lake en utilisant la puissance de l'Apache de l'écosystème Hadoop. Il est devenu très populaire car il offre un rapport coût-efficace et réalisable sur le plan technologique façon de rencontrer de gros problèmes de données. Les organisations
en découvrant les données du lac comme une évolution à partir de données existantes de l'architecture.
Livre blanc suivant sera un execellent exemple pour la construction de données de lac avec Hadoop.
OriginalL'auteur
La façon la plus simple de penser à des Données de Lac est de penser à ce grand récipient qui a comme un véritable lac avec des rivières à venir dans le fleuve vous ne savez jamais où les rivières sont à venir à partir de (ou ce "type" de la rivière).
Données Lac est capable de stockage de la masse des différents types de données (données Structurées, non structurées, données, fichiers journaux, en temps réel, des images, etc. ) et de mélange qui, ensemble, à corréler beaucoup de différents types de données. La clé, c'est ici que nous passons d'une façon traditionnelle pour les outils modernes (comme Hadoop, Cassandra, NoSQL, DB, etc).
Il y a tout un tas de données en cours, que l'on pourrait avoir quelque valeur si nous avons pu l'analyser. Nous pouvons utiliser le Nuage pour prendre des données, le faire ensemble dans un magasin, et de les analyser. Dans Azure, nous avons le Azure Data Lake Magasin. Et nous pouvons prendre toutes les données, et on peut la stocker dans Azure Data Lake Magasin. Azure Data Lake Magasin est comme un nuage de fichiers basé sur le service ou le système de fichiers que est quasiment illimité en taille.
Nous pouvons exécuter des services de données dans le magasin. Vous pouvez utiliser Hadoop ou une Étincelle dans un cluster HDInsight, ou vous pouvez utiliser l'Azur du Lac des Données analytiques de service, qui est un complément à l'Azur de Données Lake Magasin. Et ce que ce service vous permettra de faire est d'exécuter les tâches qui effectivement des requêtes sur les données que vous avez stockées dans l'Azur de Données Lac de stocker et de générer des résultats de sortie.
Azure Data Lake Magasin est quelque chose où l'on pouvait stocker toutes les données que nous voulons analyser. Azure Data Lake Analytics, un service où l'on peut exécuter les tâches qui requête de données pour générer une sorte de sortie pour l'analyse. Hadoop est spécifique de la technologie/(open source de traitement de données distribuées technologie de cluster). Vous pouvez mettre en place un data lake en utilisant hadoop ou à l'aide de différents outils.
OriginalL'auteur Nedzad G
Id de dire que la question est trop comme.
"Oracle vs Base de données".
De données est un lac de méthode de stocker des données dans un système ou d'un dépôt.
Hadoop de référence de la thecnology, Hadoop est un logiciel open-source-cadre pour le stockage des données.
Donc, un exemple d'un lac est le système de fichiers distribués utilisé dans Hadoop.
OriginalL'auteur Enrique Benito Casado