android-activity - Quelle est la meilleure manière de mettre en œuvre une activité sociale stream?

143

J'ai créé un tel système et j'ai profité de cette approche:

Base de données de tableau avec les colonnes suivantes: id, nom d'utilisateur, de type, de données, de temps.
- userId est l'utilisateur qui a généré l'activité
- type est le type de l'activité (c'est à dire Écrit blog, a ajouté la photo, le commentaire de l'utilisateur de la photo)
- données est un objet sérialisé avec des méta-données pour l'activité où vous pouvez mettre ce que vous voulez
Cela limite les recherches/des recherches, vous pouvez le faire dans les flux rss, les utilisateurs, le temps et les types d'activité, mais dans un facebook-type de flux d'activités, ce n'est pas vraiment un facteur limitant. Et avec les bons indices sur la table, les recherches sont rapide.

Avec cette conception vous de décider ce que les métadonnées de chaque type d'événement devrait exiger. Par exemple un flux d'activité pour une nouvelle photo pourrait ressembler à quelque chose comme ceci:
```
{id:1, userId:1, type:PHOTO, time:2008-10-15 12:00:00, data:{photoId:2089, photoName:A trip to the beach}}
```
Vous pouvez voir que, bien que le nom de la photo est certainement plus stockés dans un autre tableau contenant les photos, et j'ai pu récupérer le nom à partir de là, je vais dupliquer le nom dans le champ de métadonnées, parce que vous ne voulez pas le faire toutes les jointures sur d'autres tables de base de données si vous voulez de la vitesse. Et afin d'afficher, de dire 200, différents événements de 50 utilisateurs, vous avez besoin de vitesse.

Puis j'ai des cours qui s'étend de base FeedActivity classe pour le rendu des différents types d'activité des entrées. Le regroupement des événements peut être intégré dans le code de rendu ainsi, pour conserver à l'écart de la complexité de la base de données.
- c'est vraiment un grand système. Je suppose que vous êtes la création de l'aliment de base de données entrées dans le même temps, vous avez réellement l'exécution de l'action, par exemple, la création d'un nouveau commentaire de l'événement d'entrée dans le flux de la table en même temps que l'utilisateur soumet le commentaire
- Yep, c'est correct. Dernièrement, j'ai été en utilisant MongoDB (mongodb.org) dans un petit nombre de projets, dont schemaless approche rend très adapté pour la création d'un spectacle sociales flux d'activité qui suit cette conception.
- Attendez, mais vous avez userID:1, vous aurez toujours besoin d'une jointure pour saisir le nom d'utilisateur?
- TheApprentice: Yep, vous pourriez jeter dans un champ nom d'utilisateur ainsi. Dans notre système, il affiche uniquement les événements générés par les amis d'un utilisateur, et je crois que nous avons déjà eu une carte de la amis' userid->nom d'utilisateur dans la mémoire, donc à la recherche des noms d'utilisateur n'a pas besoin d'une JOINTURE et ont été rapides.
- heyman je voulais ajouter de réponse aux commentaires de l'activité et de la montrer sous elle, comment est-il possible avec votre structure? dois-je ajouter une autre table ou tout simplement utiliser les mêmes, même si, ensuite, quelles sont vos suggestions?
- Je pense que la partie la plus intéressante de cette mise en œuvre est de "marquer" un dossier est en lecture. Comment, par exemple, vous remarquerez une activité qui est plus âgé ou déjà vu par l'utilisateur? Je ne suis pas sûr de savoir comment Facebook met en œuvre cette
- Si un utilisateur modifie son nom, cette approche ne fonctionne pas serait-il? Je voudrais voir mon avatar à jour dans mon flux quand je le fais.
- Basit: je voudrais créer un tableau distinct pour les commentaires, et probablement à l'époque de dénormaliser le nombre de commentaires dans l'alimentation de la table de sorte que le nombre de commentaires peuvent être indiqués pour chaque élément sans avoir besoin de faire une JOINTURE.
- asyncwait: Lorsqu'un utilisateur affiche le flux de l'activité que vous pourriez économiser l'heure actuelle à l'utilisateur ou l'utilisateur de la session. Puis, quand vous allez chercher les éléments de flux, la prochaine fois, vous pouvez facilement déterminer les éléments qui sont nouveaux.
- Mike Flynn: cela dépend. Si vous dénormaliser les infos de l'utilisateur dans le flux des articles, une modification des données de l'utilisateur ne serait pas reflétée dans l'alimentation. Comment jamais, dans notre cas, nous avons eu une carte de l'ami du nom d'utilisateur->user des objets que nous avons utilisé lorsque nous avons rendu nom d'utilisateur et avatar, donc les infos de l'utilisateur des modifications a été reflété dans l'alimentation.
- cela ne fonctionne que dans un document de la base de données à droite? pas quelque chose comme mysql ou postgresql.
- est-il un bijou ou un plugin qui utilise cette architecture?
- Omniprésent: Nope, cette approche serait de travailler avec une base de données relationnelle ainsi. Cependant, vous avez besoin de sérialiser les méta-données dans le champ de données vous-même. Depuis les méta-données sont sérialisées, vous ne seriez pas en mesure de faire des requêtes sur quoi que ce soit mis dans le champ de données.
- Angela: C'est un langage agnostique solution. Je ne sais pas s'il y a des gems ruby sociales flux d'activité des caractéristiques qui sont mis en œuvre en utilisant une approche similaire à ce.
- Comment feriez-vous pour l'ajout de confidentialité à un flux d'activité de ce genre? Aussi, comment une activité record d'être jetés sur une base par utilisateur?
- Intresting chose à lire même quand il a été posté il y a longtemps, je peux voir comment cela fonctionne avec de petits ensembles de données, mais il va commencer à ralentir le temps passe très vite et a besoin d'un lifting pour lui donner de la vitesse réelle.
- Je comprends parfaitement pourquoi vous devriez avoir la colonne de données, mais le seul problème que je pense de ce genre de dénormalisation est ce qui se passerait si la photo 2089 a été supprimé ou le nom a été changé?
- Vous aurez à gérer ce cas manuellement. Il est probablement préférable de le faire lorsque la photo est supprimé (trouver l'alimentation de l'élément dans le flux de l'utilisateur, et de supprimer/mettre à jour).
- Si une photo a changé de nom, je vais récupérer toutes les activités pour les données": {photoId:2089}" et de modifier un par un? Merci
- Je sais que c'est un vieux post. Mais je voudrais demander à @heyman sur les consommateurs. Avec vous approche, avez-vous encore ActivityStreamUser (ou similaire) tableau de savoir quel est l'usage de consommer ces flux?
- Je n'ai pas tout à fait comprendre ce qui est si grand au sujet de cette réponse? Comment créer un tableau simple de traduire à la pondération de l'activité d'alimentation similaire à facebook? Tous les hes a à faire est de stocker l'ensemble de l'activité . Qui laisse tout de même la question de comment transformer une table de données dans une dynamique pondérée des flux d'activité?
- vous utilisez les objets sérialisés, que faire si le nom de la photo a changé. de cette façon, vous affichez l'ancien nom...
- Si je me souviens bien, en 2008, quand j'ai écrit la réponse, le Facebook d'alimentation n'est pas pondérée à tous. C'était juste un flux chronologique avec l'ensemble de l'activité de vos amis.
- Bien des indices sur la façon de faire de telles pondéré d'alimentation dans le 21e siècle?
- lien brisé
InformationsquelleAutor heyman
116

C'est une très bonne présentation sur la façon Etsy.com l'architecture de leurs flux d'activité. C'est le meilleur exemple que j'ai trouvé sur le sujet, si ce n'est pas les rails spécifiques.

http://www.slideshare.net/danmckinley/etsy-activity-feeds-architecture
- ^^ Parce que vous avez à revenir à DONC après la visite du site. lol
- Belle présentation qui explique en détail comment le système fonctionne sur un véritable haut-le trafic de site web.
InformationsquelleAutor Mark Kennedy
43

Nous avons open source de notre approche:
https://github.com/tschellenbach/Stream-Framework
C'est actuellement la plus grande bibliothèque open source visant à résoudre ce problème.

La même équipe qui construit des Flux de Cadre offre également hébergé API, qui gère la complexité pour vous. Jetez un oeil à getstream.io Il y a des clients disponibles pour le Nœud, Python, Rails et PHP.

En outre jeter un oeil à cette grande évolutivité post ont nous expliquer certaines décisions de conception impliqués:
http://highscalability.com/blog/2013/10/28/design-decisions-for-scaling-your-high-traffic-feeds.html

Ce tutoriel vous aidera à configurer un système comme Pinterest flux à l'aide de Redis. C'est assez facile à prendre en main.

Pour en savoir plus à propos de nourrir design, je recommande fortement la lecture de certains articles dans lesquels nous avons basé Feedly sur:
- Document De Recherche De Yahoo
- Twitter 2013 Redis base, avec reprise
- Cassandra à Instagram
- Etsy flux de mise à l'échelle
- Facebook histoire
- Projet Django, avec de bonnes conventions de nommage. (Mais la base de données uniquement)
- http://activitystrea.ms/specs/atom/1.0/ (acteur, verbe, objet, cible)
- Quora post sur les meilleures pratiques
- Quora de mise à l'échelle d'un réseau social d'alimentation
- Redis ruby exemple
- FriendFeed approche
- Thoonk d'installation
- Twitter Approche
Bien que les Flux de Cadre est basé sur Python, il ne serait pas trop difficile à utiliser à partir d'une application Ruby. Vous pouvez simplement exécuter en tant que service et coller un petit http API en face d'elle. Nous envisageons d'ajouter une API pour accéder à Feedly à partir d'autres langues. En ce moment, vous aurez pour rôle de votre propre bien.

InformationsquelleAutor Thierry
19

Plus grands problèmes avec les flux d'événements sont la visibilité et la performance; vous avez besoin de restreindre les activités indiquées à l'intéressantes pour cet utilisateur particulier, et vous avez besoin de garder la quantité de temps qu'il faut pour trier et identifier les événements gérable. J'ai construit un petit réseau social; j'ai trouvé qu'à de très petites échelles, gardant les "événements" de la table dans une base de données fonctionne, mais qu'il arrive à être un problème de performances sous charge modérée.

Avec un plus grand flux de messages et les utilisateurs, il est préférable d'aller avec un système de messagerie, où les événements sont envoyés sous forme de messages à des profils individuels. Cela signifie que vous ne pouvez pas facilement s'abonner à des gens du flux d'événements et de voir les événements précédents très facilement, mais vous êtes tout simplement rendu un petit groupe de messages lorsque vous avez besoin pour rendre le flux d'un utilisateur particulier.

Je crois que c'était de Twitter à l'origine de défauts de conception - je me souviens avoir lu qu'ils étaient de frapper la base de données pour récupérer et filtrer les événements. Cela a tout à voir avec l'architecture et rien à voir avec les Rails, qui (malheureusement) a donné naissance à la "ruby n'a pas d'échelle de" mème. J'ai vu récemment une présentation où le développeur a utilisé Amazon Simple File D'Attente De Service que leur messagerie backend pour un twitter-like que la demande n'ont de loin le plus élevé de mise à l'échelle des capacités - c'est peut-être intéressant de regarder dans SQS dans le cadre de votre système, si vos charges sont assez élevés.
- Tim, pensez-vous, par hasard, rappelez-vous le nom de la présentation ou de l'presentator?
- c'est à Oreilly et Associé Enflammer Boston présentation, soit le numéro 3 ou 4 je crois que le présentateur avait un livre sur la mise à l'échelle RoR avec Oreilly. Désolé je ne peux pas être plus précis!
- Merci Tim 🙂 d'ailleurs, qu'avez-vous dire par "petit réseau social"? Combien d'utilisateurs ou des utilisateurs actifs à un moment donné?
- Dans le cas où quelqu'un en a besoin, je pense que c'est la présentation de Tim parle: "Dan Chak -- mise à l'Échelle à la Taille de vos Problèmes" radar.oreilly.com/2008/09/ignite-boston-4----videos-uplo.html
- Smallish dans ce cas, est tel qu' "select * from événements où de l'événement.est visible pour l'utilisateur" renvoie un résultat en moins d'une seconde ou deux de figure de quelques centaines de milliers de lignes de la valeur des événements.
InformationsquelleAutor Tim Howland
12

Si vous êtes prêt à utiliser un autre logiciel, je suggère la Graphity serveur qui résout le problème pour les flux de l'activité (bâtiment sur le dessus de neo4j graphique de la base de données).

Les algorithmes ont été mis en œuvre en tant qu'unité autonome de REPOS serveur, de sorte que vous pouvez héberger votre propre serveur pour fournir des flux de l'activité: http://www.rene-pickhardt.de/graphity-server-for-social-activity-streams-released-gplv3/

Dans le document de référence et j'ai montré que la récupération des news flux ne dépend que linéaire sur le nombre d'objets que vous souhaitez récupérer sans aucune redondance de la dénormalisation des données:

http://www.rene-pickhardt.de/graphity-an-efficient-graph-model-for-retrieving-the-top-k-news-feeds-for-users-in-social-networks/

Sur le lien ci-dessus vous trouverez des screencasts et une référence de cette approche (montrant que graphity est capable de récupérer plus de 10k de flux par seconde).

InformationsquelleAutor Rene Pickhardt
10

J'ai commencé à mettre en œuvre un système de ce type hier, voici où j'en ai eu pour...

J'ai créé un StreamEvent classe avec les propriétés Id, ActorId, TypeId, Date, ObjectId et une table de hachage de supplémentaires Détails paires clé/valeur. Ceci est représenté dans la base de données par un StreamEvent table (Id, ActorId, TypeId, Date, ObjectId) et un StreamEventDetails table (StreamEventId, DetailKey, DetailValue).

La ActorId, TypeId et ObjectId permettre un Sujet-Verbe-Objet événement pour être capturé (et, plus tard, interrogé). Chaque action peut entraîner plusieurs StreamEvent instances en cours de création.

J'ai ensuite créé une sous-classe pour de StreamEvent chaque type d'événement, par exemple LoginEvent, PictureCommentEvent. Chacun de ces sous-classes a plus le contexte spécifique des propriétés telles que PictureId, Vignette, CommenText, etc (tout ce qui est nécessaire pour l'événement), qui sont en fait stockées comme des paires clé/valeur dans la table de hachage/StreamEventDetail table.

Lors de l'extraction de ces événements de la base de données j'utilise une méthode de fabrique (basé sur le TypeId) pour créer le bon StreamEvent classe.

Chaque sous-classe de StreamEvent a un Rendu(contexte Comme StreamContext), une méthode de sorties de l'événement à l'écran basé sur le passé StreamContext classe. Le StreamContext classe permet d'options à définir en fonction du contexte de la vue. Si vous regardez Facebook par exemple votre flux d'actualités sur la page d'accueil répertorie les fullnames (et des liens vers leur profil) de toutes les personnes impliquées dans chaque action, alors que la recherche d'un ami d'alimentation vous ne voyez que son prénom (mais les noms et prénoms des autres acteurs).

Je n'ai pas mis en œuvre un total de l'alimentation (de Facebook à la maison) mais j'imagine que je vais créer une AggregateFeed table qui a les champs UserId, StreamEventId qui est renseigné sur une sorte de " Hmmm, vous pourriez trouver cela intéressant d'algorithme.

Tout commentaire serait très apprécié.
- Je suis en train de travailler sur un système de ce type en suis très intéressé par tout savoir sur elle, avez-vous jamais terminer la vôtre?
- Super réponse! Excellente séparation des préoccupations, propre et élégant!
- C'est un bon début! Il est très similaire à la façon dont j'ai commencé la mise en œuvre de mon premier flux. Une fois que vous obtenez à la somme du flux, cependant, les choses commencent à se compliquer rapidement. Vous avez raison, vous avez besoin d'un algorithme robuste. Ma recherche m'a conduit à René Pickhardt de l'algorithme (il en parle dans sa réponse ici), que j'ai ensuite mis en œuvre dans mon propre service, qui est commercial (voir collabinate.com et ma réponse sur cette question pour plus de détails).
InformationsquelleAutor jammus
10
```
//une entrée par un événement réel 
les événements { 
id, l'horodatage, le type de données 
} 

//une entrée par un événement, par la consommation d'aliments contenant cet événement 
events_feeds { 
event_id, feed_id 
} 
```
Lors de la création de l'évènement, choisissez les aliments qu'il apparaît dans et les ajouter à events_feeds.
Pour obtenir un flux, sélectionnez à partir de events_feeds, à participer à des événements, order by timestamp.
Le filtrage et l'agrégation peut alors être effectuée sur les résultats de cette requête.
Avec ce modèle, vous pouvez modifier les propriétés de l'événement après la création, aucun travail supplémentaire.
- Supposons que quelqu'un d'autre est ajouté comme ami après l'événement est ajouté, qui doit voir cet événement dans leur alimentation? alors, ceci ne fonctionnerait pas
InformationsquelleAutor jedediah
8

Si vous décidez que vous allez mettre en œuvre dans les Rails, peut-être que vous trouverez le plugin utile:

ActivityStreams: http://github.com/face/activity_streams/tree/master

Si rien d'autre, vous aurez à regarder de mise en œuvre, à la fois en termes de modèle de données, ainsi que l'API fournie pour pousser et tirer des activités.

InformationsquelleAutor Alderete
6

J'ai eu une approche similaire à celle de heyman - un dénormalisée tableau contenant toutes les données à afficher dans un flux d'activité. Il fonctionne très bien pour un petit site avec une activité limitée.

Comme mentionné ci-dessus, il est susceptible de faire face à des problèmes d'évolutivité que le site grandit. Personnellement, je ne suis pas inquiet au sujet de la mise à l'échelle questions dès maintenant. Je vais vous inquiéter à ce sujet à une date ultérieure.

Facebook a évidemment fait un excellent travail de mise à l'échelle, donc je vous recommande de lire leur blog, car il a une tonne de contenu -> http://www.facebook.com/notes.php?id=9445547199

J'ai été à la recherche dans de meilleures solutions que la table dénormalisée je l'ai mentionné ci-dessus. Une autre façon que j'ai trouvé pour arriver à ce résultat est de condenser l'ensemble du contenu qui serait dans une activité donnée flux dans une seule ligne. Il pourrait être stockées en XML, JSON, ou certains sérialisé format qui peut être lu par votre application. Le processus de mise à jour serait trop simple. Lors de l'activité, de la place de la nouvelle activité dans une file d'attente (peut-être l'aide d'Amazon SQS ou autre chose) et ensuite continuellement sondage la file d'attente pour le prochain article. Prenez cet élément, l'analyser, et de placer son contenu dans le flux approprié objet stocké dans la base de données.

La bonne chose à propos de cette méthode est que vous avez seulement besoin de lire une seule table de base de données chaque fois que le flux est demandé, plutôt que de prendre une série de tableaux. Aussi, il vous permet de maintenir une liste restreinte d'activités que vous pouvez faire apparaître le plus ancien de l'activité point à chaque fois que vous mettez à jour la liste.

Espérons que cette aide! 🙂
- Exactement mes pensées, j'avais juste besoin d'une validation de mes pensées que j'ai probablement obtenu maintenant, cheers!
InformationsquelleAutor
5

Il y a deux railscasts sur un tel flux d'activité:
- http://railscasts.com/episodes/406-public-activity (Un flux d'activités avec la gemme public_activity)
- http://railscasts.com/episodes/407-activity-feed-from-scratch (La même chose à partir de zéro)
Ces solutions ne tient pas compte de toutes vos exigences, mais il devrait vous donner quelques idées.
- PublicActivity est grand, et peut gérer tous les cas d'utilisation dans la question.
InformationsquelleAutor Benjamin Crouzier
3

Je pense que Plurk de l' approche est intéressante: ils approvisionnement de l'ensemble de votre montage dans un format qui ressemble beaucoup à Google Finance les graphiques boursiers.

Il peut être intéressant de regarder Ning de voir comment un réseau social réseau fonctionne. Le développeur pages look particulièrement utile.

InformationsquelleAutor warren

J'ai résolu ce problème il y a quelques mois, mais je pense que mon application est trop basique.

J'ai créé les modèles suivants:

HISTORY_TYPE

ID           - The id of the history type
NAME         - The name (type of the history)
DESCRIPTION  - A description

HISTORY_MESSAGES

ID
HISTORY_TYPE - A message of history belongs to a history type
MESSAGE      - The message to print, I put variables to be replaced by the actual values

HISTORY_ACTIVITY

ID
MESSAGE_ID    - The message ID to use
VALUES        - The data to use

Exemple

MESSAGE_ID_1 => "User %{user} created a new entry"
ACTIVITY_ID_1 => MESSAGE_ID = 1, VALUES = {user: "Rodrigo"}

InformationsquelleAutor Rodrigo

2

Après la mise en œuvre de flux d'activité pour permettre les flux de réseaux sociaux, micro-blogging, et les fonctionnalités de collaboration dans plusieurs applications, j'ai réalisé que la fonctionnalité de base est assez simple et pourrait être transformé en un service externe que vous utilisez via une API. Si vous êtes à la construction du flux dans une application de production et ne sont pas uniques ou profondément besoins complexes, en utilisant un service éprouvé, peut-être la meilleure façon d'aller. Je recommanderais ceci pour des applications de production de plus de roulement de votre propre solution simple sur le dessus d'une base de données relationnelle.

Mon entreprise Collabinate (http://www.collabinate.com) est née de cette prise de conscience, et nous avons mis en place une solution évolutive, de haute performance de l'activité de moteur de flux en haut d'un graphique de la base de données pour l'atteindre. Nous avons utilisé une variante de la Graphity algorithme (adapté à partir du début des travaux de @RenePickhardt qui a également fourni une réponse ici) pour construire le moteur.

Si vous souhaitez héberger le moteur vous-même ou d'exiger des fonctionnalités spécialisées, le code de base est en fait de l'open source à des fins non commerciales, vous êtes les bienvenus pour prendre un coup d'oeil.

InformationsquelleAutor Mafuba

Vous devez vous connecter pour publier un commentaire.