Pentaho vs Pile Microsoft BI
Mon entreprise est fortement investi dans le MS BI Pile (SQL Server Reporting Services, Analysis Services et d'Intégration de Services), mais je veux avoir un coup d'oeil à ce qu'apparemment les plus parlé de l'alternative open-source Pentaho est comme.
J'ai installé une version, et je l'ai eu et en cours d'exécution tout à fait sans douleur. Donc c'est bien. Mais je n'ai pas vraiment le temps de commencer à l'utiliser pour le travail réel pour obtenir une compréhension approfondie de l'emballage.
N'avez-vous obtenu un aperçu de ce que sont les avantages et les inconvénients de Pentaho vs MS BI, ou de liens vers de telles comparaisons?
Beaucoup apprécié!
Vous devez vous connecter pour publier un commentaire.
J'ai passé en revue plusieurs Bi piles alors que sur un chemin pour descendre de Business Objects. Beaucoup de mes commentaires sont de préférence. Les deux ensembles d'outils sont excellents. Certaines choses sont ce que je préfère le chocolat fudge brownie, glace à la crème sur le chocolat noir.
Pentaho a quelques très intelligent de gars qui travaillent avec eux, mais Microsoft a été sur un bien financé et bien trajectoire prévue. Gardez à l'esprit MS sont encore des inconnus dans la base de données du marché. Oracle est roi ici. Pour être compétitif MS a été loin de donner un tas de goodies lorsque vous achetez de la base de données et ont été contraints de réinventer leur plate-forme d'un couple de fois. Je sais que ce n'est pas sur la base de données, mais la DB bataille a cause MS à donner beaucoup de choses afin d'ajouter de la valeur à leur tapis.
1.) Plate-forme
SQL server ne fonctionne pas sur Unix ou Linux alors qu'ils sont automatiquement exclus de ce marché. Windows est environ le même prix que certaines versions ou Unix maintenant. Windows est assez bon marché et fonctionne faily bien maintenant. Il me donne autant de mal que Linux.
2.) OLAP
Les services d'analyse a été réinventé en 2005 (courant 2008) sur la version 2000. C'est un ordre de magnatude plus puissant par rapport à 2000. La pentaho (Mondrian) n'est pas aussi rapide une fois que vous obtenez de gros. Il a aussi quelques fonctionnalités. Il est assez bon, mais il y a de moins en moins en termes d'outils. À la fois le soutien d'Excel en tant que plate-forme qui est esscential. La MME version est plus robuste.
3.) ETL
MS - DTS a été remplacé avec SSIS. Encore une fois, afin de magnatude augmentation de la vitesse, de puissance et de capacité. Il contrôle tout et de tous les mouvements de données ou de programme de contrôle. Si il ne peut pas le faire, vous pouvez écrire un script en Powershell. Sur le pair avec Informatica dans la version 2008.
Pentaho - Beaucoup mieux que ce qui est utilisé pour être. Pas aussi vite que je le voudrais, mais je peux faire à peu près tout ce que je veux faire.
4.) tableau de bord
Pentaho a amélioré cette. Il est un peu mal à l'aise et hostile à développer, mais il n'est pas vraiment un réel equiv pour MME
5.) les rapports
MS rapports est vraiment puissant mais pas du tout difficile à utiliser. Je l'aime maintenant, mais détesté au début, jusqu'à ce que j'ai appris à la connaître un peu mieux. J'avais été à l'aide de crystal reports et le MS générateur de rapports est beaucoup plus puissant. Il est facile de faire des choses difficiles en MS, mais un peu plus difficile de faire des choses faciles.
Pentaho est un peu maladroit. Je n'aimais pas ça du tout, mais vous pourriez. Je l'ai trouvé trop complexe. Je voudrais qu'il était plus comme le Crystal report builder ou de la MS générateur de rapports, mais il est jasper comme. J'ai trouver est d'être dur. Que peut être une préférence.
6.) ad hoc
MS - c'était le vrai gagnant pour moi. Je l'ai testé avec mes utilisateurs et ils ont instantanément en amour avec le MS de l'utilisateur du générateur de rapports. Ce qui a fait la différence est la façon dont il n'était pas seulement facile à utiliser, mais aussi productive.
Pentaho - c'est bon, mais un peu old school. Il utilise le plus typique de l'assistant de base du modèle et dispose d'outils puissants, mais je déteste ça. C'est un excellent outil pour ce qu'il est, mais nous avons passé de ce style, et personne ne veut revenir en arrière. Même problème que j'avais avec logiXML. L'interface a bien fonctionné pour ce que c'était, mais n'est pas vraiment beaucoup de changement à partir de ce que nous avons utilisé 12 ans.
http://wiki.pentaho.com/display/PRESALESPORTAL/Methods+de+Interactif+Reporting
Il y a quelques personnes expérimentées qui peuvent faire Pentaho tourne vraiment bien, j'ai juste trouvé la suite MS pour être plus productif.
Avertissement, il existe de nombreux sites là-bas le listing de la de nombreuses lacunes, des bugs, et des ennuis avec SSIS. Je ne sais pas pourquoi SSIS est venu sur le dessus avec le post -- mais avant de miser votre projet sur celui-ci, regardez ce que les gens ont à dire dans la blogosphère. De mon expérience, de ses environ 20:1 rodomontades sur la façon horrible SSIS est de travailler avec--je peux concourir ainsi, actuellement à la recherche d'une alternative.
Informations grand ici? Je n'ai pas essayé Pentaho mais et de planification de la vérifier. Je suis un inconditionnel de MS BI consultant, l'utilisant depuis 1998. SSIS est très rapide et très puissant, mais les critiques sont justes. J'ai trouvé les questions suivantes avec SSIS:
(1) Il est difficile de débogage, vous obtenez cryptique des erreurs qui ne peuvent pas vous donner le moindre indice sur ce que et où le problème est vraiment.
(2) Par une remarque préalable, il est le plus pourri de l'environnement de développement jamais! Je n'ai aucune idée de ce qu'ils pensent.
(a) Créer une table avec un 100 ou plus de colonnes et de mettre une jointure de fusion sur elle. Allez maintenant, et essayez de faire une mise à jour de la jointure de fusion (comme tirer une nouvelle colonne à travers). Il peut prendre plusieurs minutes, même sur la machine la plus rapide lorsque vous cliquez sur ok dans la jointure de fusion pour enregistrer votre modification. J'ai un énorme flux de données, avec beaucoup de grande enregistrements et de nombreuses jointures de fusion. Ajouter une colonne pour le flux de données prend plus d'une demi-journée. - Je mettre à jour une jointure de fusion et d'avoir à aller faire autre chose et vérifier à nouveau 5 à 10 minutes plus tard pour voir si c'est fait. La réponse de Microsoft à cette question consiste à diviser votre colis en plusieurs packages, placer les données dans une table ou binaire entre eux. Eh bien, si vous allez sur le disque entre toutes les étapes, vous mai a été bien faire la même chose en SQL! L'un des buts principaux d'un outil ETL est à tous ces trucs en mémoire et éviter d'e/s de disque
(b) Le concepteur de carrément se bloque parfois, de perdre tout votre travail depuis la dernière sauvegarde (je fais ctrl-S dans mon sommeil maintenant, à cause de cela)
(c) j'ai dû trouver un hack et de générer des packages SSIS XML dans Excel pour une large enregistrements. J'ai un de soins de Santé, où le client 600+ colonne enregistrements sont monnaie courante. Si vous essayez de définir un format de fichier avec 600 colonnes dans SSIS, vous avez ce type de chaque colonne dans un à la fois!!! Même MS access vous permet de couper et de coller une mise en page à partir d'une feuille de calcul dans un fichier de mise en page, mais pas SSIS. J'ai donc dû générer du XML à partir de la mise en page et collez le code XML dans le bon endroit dans le package. Laid façon de le faire mais il a sauvé des journées entières de travail et beaucoup d'erreurs.
(d) Similaire à (c), si vous avez besoin de couper tous vos colonnes et vous avez à dire plus de 600 d'entre eux, devinez quoi? Dans la colonne dérivée de la composante, vous avez ce type de garniture(colonne1) 600+ fois! Je fais maintenant tous de simples transformations de ce genre dans la requête SQL pour obtenir les données, car cela peut facilement être généré à partir d'une feuille Excel.
(e) Il y a beaucoup de choses bizarres, des composants qui deviennent invisibles, parfois, vous ouvrez le paquet et tous les composants sont entièrement ré-agencé de façon incohérente.
(f) La fonction FTP, peut-être une des choses les plus courantes que vous avez besoin dans ETL, est faible et ne supporte plain vanilla FTP qui personne n'utilise. Tout le monde ces jours-ci utilise SFTP, FTPS, https, etc... Donc presque tous de la mise en œuvre nécessite l'aide d'un 3ème partie félicite en ligne de transfert de fichier app le paquet d'appel.
(g) en Essayant d'ACY, semblable au ridicule de la sécurité dans Windows Vista, Microsoft a rendu extrêmement difficile de réellement promouvoir un package SSIS d'un environnement à un autre. La valeur par défaut de cette chose stupide de "chiffrer les informations sensibles de l'utilisateur de la clé de sécurité" ce qui signifie qu'il doit s'exécuter sous le même compte dans l'environnement que vous vous déplacez à l'environnement, s'est développé, ce qui est rarement le cas. Il y a de meilleures façons de configurer, mais il essaie toujours de revenir à cette complètement inutile de protection de la sécurité.
(h), Enfin la plupart de ces problèmes sont maintenant dans la 3ème version, en indiquant clairement Microsoft n'a pas l'intention de les corriger.
(i) le Débogage n'est pas aussi facile que dans d'autres langues.
SSIS a encore un grand nombre d'avantages, mais non sans de graves douleurs.
J'ai commencé à l'aide de MS Reporting Services il y a plusieurs années et je l'adore. Je n'ai pas essayé Penaho de la solution de reporting donc je ne peux pas commenter. Je n'ai pas essayé soit de l'Analyse des Services ou Pentaho alternative.
Récemment, j'ai besoin d'une solution ETL et d'être familier avec MSSQL et les MSR, il semblait évident que je voudrais passer en revue et probablement choisir MS de Service de l'Intégration. Mais pour moi, MSI a été terrible. Surtout parce qu'il n'était pas intuitive. Après avoir passé quelques jours à essayer de comprendre l'outil, j'ai décidé de chercher une alternative, et est venu à travers Pentaho Data Integration, anciennement connu comme une Bouilloire. Je l'ai eu à fonctionner en quelques minutes et immédiatement créé ma première transformation. Il fonctionne, tout simplement.
Certes, mes besoins sont assez simples, mais la performance a été excellente et la communauté semble très utile.
J'ai utilisé SSIS et Pentaho Bouilloire, et je vous recommande fortement de l'aide de Pentaho Bouilloire pour votre outil ETL au lieu de SSIS.
Mes raisons:
-le flux de SSIS est une tâche à l'autre. Bouilloire vous fait penser à des lignes de données circulant à travers le système. Bouilloire approche semble beaucoup plus intuitive pour moi.
-SSIS est mal documentée. Ce qui se passe. Mais il semble y avoir beaucoup de coins et recoins cliquant et en définissant des variables. Très complexe. Pentaho est un forum communautaire qui est très utile.
-J'ai confiance en Pentaho à intégrer avec plusieurs types de bases de données, y compris SQL Server. Vous pouvez également utiliser JDBC qui est agréable. Aussi, je l'ai utilisé pour aller entre SQL Server et Oracle sur un côté et Vertica sur l'autre. Il possède un bloc chargeur sur Vertica. C'est assez agréable.
-Je l'ai trouvé très, très dur, relativement parlant d'obtenir un package SSIS pour s'exécuter sur un serveur. Il n'était tout simplement pas la peine de mon temps.
-Je l'ai trouvé assez facile pour Pentaho pour envoyer un avertissement ou un message d'erreur à une personne ou à une liste de personnes.
-Pentaho permet de tâches à faire en JavaScript pour les choses qui ont besoin d'un peu de logique. Simple et facile à faire avec une langue que la plupart d'entre nous ont rencontré.
Je ne peux pas proposer toute entrée sur le MS BI Pile mais lors de la plus récente Barcamp Orlando, les gens de Pentaho ont été là et ont parlé de leurs produits et c'était très impressionnant de démonstration.
Le fait que c'est un projet Open Source que vous pouvez développer vous-même ainsi que d'un forfait payé pour vraiment un bon service vous laisse avec un tas d'options. Ils l'ont démontré certains ont payé de travail qu'ils ont fait pour un client et ils ont certainement wow la foule.
J'ai également eu la chance de discuter un peu avec un développeur qui travaille sur l'entreposage de données côté des choses pour Pentaho et il a été très forte et a été très ouvert aux suggestions et n'avaient aucun problème à répondre à toutes les questions.
Pour autant que l'entreprise va, Pentaho m'a vraiment impressionné avec leur travail et la façon amicale et accessible l'ensemble de leurs développeurs.
un couple de points à ajouter
Outil de questions doivent être abordées en termes de grandes questions culturelles - dans quel genre de magasins d'utiliser des outils open source? dans mon expérience, j'ai constaté que althsough Microsoft magasins semblent de plus en plus rigide, lorsque vous avez des problèmes avec une chaîne de connexion dans Microsoft boutique, vous pouvez obtenir de l'aide.. dans Pentaho et Linux boutiques son plus DYI.
BTW, regarder dehors pour Pentaho ventes gars faire des démos - toutes les choses qui montrent qu'ils sont beaucoup plus difficile d'obtenir un travail qu'il n'y paraît! 🙂
Si vous êtes à la recherche pour un solide, alternative à faible coût pour les grands garçons LogiXML a tableaux de bord et de reporting ad hoc sur un .NET plate-forme. Nous avons été à l'aide de eux depuis la fin de 2006, lorsque Pentaho venait juste de commencer, mais je n'ai pas regardé de temps en temps.
Récemment, j'ai essayé open source pentaho BI. Je l'ai trouvé extrêmement maladroite. Il n'était pas très intuitive et le temps de développement a pris beaucoup plus de temps.
Il est tout à fait différent de la base de données Oracle ou ms solutions de BI. Peut-être l'édition enterprise est mieux.