Comment la somme de pandas par l'index unique en plusieurs colonnes?

J'ai une pandas DataFrame qui détaille les activités en ligne en termes de "clics" au cours d'une session utilisateur. Il y a 50 000 utilisateurs uniques, et le dataframe a environ 1,5 millions d'échantillons. Évidemment, la plupart des utilisateurs ont de multiples dossiers.

Les quatre colonnes sont un id utilisateur unique, la date à laquelle l'utilisateur a commencé le service "Inscription", la date à laquelle l'utilisateur a utilisé le service "Session", le nombre total de clics.

L'organisation de la dataframe est comme suit:

User_ID    Registration  Session      clicks
2349876    2012-02-22    2014-04-24   2 
1987293    2011-02-01    2013-05-03   1 
2234214    2012-07-22    2014-01-22   7 
9874452    2010-12-22    2014-08-22   2 
...

(Il y a aussi un index ci-dessus à partir de 0, mais on pourrait définir User_ID que l'index.)

Je voudrais total le nombre total de clics par l'utilisateur depuis la date d'Enregistrement. Le dataframe (ou les pandas objet de Série) la liste User_ID et "Total_Number_Clicks".

User_ID    Total_Clicks
2349876    722 
1987293    341
2234214    220 
9874452    1405 
...

Comment faire dans les pandas? Est-ce fait par .agg()? Chaque User_ID doit être résumées individuellement.

Comme il y a 1,5 millions de disques, est ce que cette échelle?

OriginalL'auteur ShanZhengYang | 2016-02-10