Tag: dataframe

Une trame de données est un tableau de structure de données. Il contient généralement des données où les lignes sont les observations et les colonnes sont des variables de différents types. Tandis que le « bloc de données » ou « dataframe » est le terme utilisé pour ce concept dans plusieurs langues (R, Apache Spark, deedle, l’Érable, les pandas de la bibliothèque en Python et la DataFrames bibliothèque de Julia), « table » est le terme utilisé dans MATLAB et SQL.

Réduire les lignes dans un bloc de données en utilisant R

Convertir les séries Pandas en DateTime dans un DataFrame

Python Pandas Group par date à l'aide de données datetime

Comment diviser une base de données en données avec les mêmes valeurs de colonne?

fusionner par row.name et column

Apache Spark, ajoutez une colonne calculée "CASE WHEN ... ELSE ..." à un DataFrame existant

pandas drop row basé sur l'indice vs ix

dply: ordonner les colonnes par ordre alphabétique dans R

Les Pandas fusionnent deux dataframes avec des colonnes différentes

appliquer une fonction sur des groupes de colonnes

Supprime les colonnes de la base de données où certaines valeurs sont NA

Soustraire les valeurs d'une base de données d'une autre

liste tous les niveaux de facteur d'un data.frame

Python Pandas: Comment définir la valeur de la colonne Dataframe en tant qu'étiquettes de l'axe X

Comment utiliser dplyr pour générer une table de fréquences

Moins l'exploitation des trames de données

Chaîne d'animaux partielle correspondant à R

Comment convertir des données entières en numérique tout en préservant les décimales?

Comment initialiser un vecteur avec une longueur fixe dans R

renvoie la valeur maximale de l'ensemble de données Panda, non basé sur les colonnes ou les lignes

Est-il possible d'ajouter Series à des lignes de DataFrame sans faire une liste en premier?

Moyenne par ligne pour un sous-ensemble des colonnes tout en tenant compte des valeurs manquantes

regrouper les données pandas par deux colonnes (ou plus)?

Comment calculer le taux de croissance dans le cadre de données de format long?

Pandas Dataframe ValueError: La forme des valeurs passées est (X,), les indices impliquent (X, Y)

Erreur _corrupt_record lors de la lecture d'un fichier JSON dans Spark

Python pandas groupby agréger sur plusieurs colonnes, puis pivoter

comment convertir une chaîne JSON en données sur une étincelle

L'objet 'module' n'a pas d'attribut 'DataFrame'

Agréger plusieurs lignes du même data.frame dans R en fonction des valeurs communes dans des colonnes données

Py Pandas .format (fichier de données)

pandas - comment accéder à la cellule chez les pandas, équivalent de df [3,4] en R

Supprimer les colonnes avec des valeurs nulles d'une base de données

Renommez une colonne nommée dans R

écrire dans une trame de données à partir d'une boucle forcée dans R

Comment trier et filtrer data.frame dans R?

trouver l'indice d'une valeur max en R

Erreur lors de l'utilisation de Corrplot

Ajouter des caractères à une colonne numérique dans les données

Compter le nombre de zéros par ligne et supprimer les lignes de plus de n zéros

ligne de jeu de données efficace pandas

Création d'une nouvelle colonne dans un bloc de données à l'aide d'une formule provenant d'une autre variable

Création d'un tableau statistique récapitulatif à partir d'une trame de données

Sélectionnez les lignes de data.frame se terminant par une chaîne de caractères spécifique dans R

Quelle est la bonne façon de multiplier la trame de données par vecteur?

Comment supprimer des lignes avec inf à partir d'une image de données dans R

Ajout de trames de données en tant qu'éléments de liste (en utilisant pour la boucle)