R Identifing chaîne de texte dans la colonne de dataframe
Une colonne de mon bloc de données a des mots et des phrases. Je suis en train de créer une variable muette pour les champs à l'intérieur de cette colonne ont des chaînes de texte n'importe où dans.
Par exemple:
- cerf-volant
- voitures
- boîte de cerfs-volants
- modèles de voitures
- j'aime les cerfs-volants qui volent
- voitures du monde
myvector<-c("kite","cars","box kites","model cars","i like kites that fly", "cars of the world")
Je voudrais identifier tous les champs avec la chaîne "cerf-volant"
J'ai essayé quelques choses comme any()
, which()
et %in%
mais rien n'a fonctionné jusqu'à présent.
Toute aide grandement appréciée
OriginalL'auteur Will Phillips | 2012-09-13
Vous devez vous connecter pour publier un commentaire.
Vous n'avez pas fourni aucun exemple reproductible. Mais votre réponse sera grepl.
Il sera de retour une logique de vecteur si le mot est dans la ligne.
Si vous voulez correspondre à plusieurs mots ou logique
|
à l'intérieur de la chaîne de matchJ'ai mis à jour ma réponse, vous avez été très proches.
créer 1 variable binaire (1 ou 0), mais il y a quelques mots à rechercher sur qui serait un "1". Je peux faire grepl() pour chaque mot séparément, la somme des vecteurs résultants et ifelse un vecteur final, si la somme est 0 alors 0 sinon 1. Mais si elle pouvait travailler dans un seul grepl() c'est plus efficace.
oh, le | est à l'intérieur de la cite. génial! Merci
OriginalL'auteur Luciano Selzer