Comment puis-je vérifier si une chaîne contient un mot en particulier?

Considérer:

$a = 'How are you?';

if ($a contains 'are')
    echo 'true';

Supposons que j'ai le code ci-dessus, quelle est la bonne manière d'écrire l'instruction if ($a contains 'are')?

InformationsquelleAutor |

6204

Vous pouvez utiliser le strpos() fonction qui est utilisée pour trouver l'occurrence d'une chaîne à l'intérieur d'une autre:
```
$a = 'How are you?';

if (strpos($a, 'are') !== false) {
    echo 'true';
}
```
Noter que l'utilisation de !== false est délibérée; strpos() retourne l'offset à laquelle l'aiguille début de la chaîne dans la botte de foin de la ficelle ou de la boolean false si l'aiguille n'est pas trouvé. Depuis que 0 est une valeur de décalage et 0 est "falsey", on ne peut pas utiliser plus simple des constructions comme les !strpos($a, 'are').
- une chose que j'ai trouvé était que, si "sont" est le premier mot, puis le code ci-dessus échoue, car il renvoie "0", ce qui peut être considéré comme faux! Pour éviter cela, il doit lire if(strpos("x".$a,'sont') !== false) .....
- n'est pas considéré comme "faux" quand vous utilisez !==. Il est considéré seulement si vous utilisez !=.
- Très en retard à la fête, mais être prudent avec ce. Ce sera aussi le retour véritable de la chaîne 'en Faire?'
- eh bien oui, bien sûr, il sera de retour vrai parce que la chaîne contient 'sont'. Si vous êtes à la recherche spécifiquement pour la parole, alors vous aurez besoin de faire plus de contrôles, comme, par exemple, vérifier si il y a un caractère ou un espace avant et Un après l'E.
- De très bons commentaires ci-dessus! Je n'ai jamais utiliser != ou ==, après tout !== et === est la meilleure option (à mon avis) de tous les aspects considérés (vitesse, précision, etc).
- Pourquoi ne pas regexes, alors? Quelque chose comme " être ".
- la meilleure façon est if ((strpos($form_email,'@') === false) || (strpos($form_email,'.') === false)) { $error = 'Invalid email<br>'; }
- Regex est plus lent 🙂 Si vous avez uniquement besoin de vérifier s'il existe, en aucune façon ( si "sont" ou "care" n'importe pas), puis utiliser les fonctions de base pour de meilleures performances
- Comme pour ne pas l'attraper "care" et de telles choses, il est préférable de vérifier (strpos(' ' . strtolower($a) . '', ' sont ') !== false)
- Je voulais vérifier si une chaîne n' pas contient un mot. J'ai essayé de changer la valeur false à true if (strpos($a,'are')!==true) {...} mais il ne fonctionne pas. Au lieu de cela je me sers maintenant: if(! (strpos($a,'are')!==false)) { ... } qui a l'air gêné. N'importe qui?
- cette fonction retourne toujours false ou la position, mais jamais de vrai
- essayez strpos($a,'are')===false. === est le complémentaire de l'opérateur de !==.
- A quelle vitesse a à voir avec le fait, si vous utilisez comparer avec (===) ou sans (==) type de vérification? Suggérez-vous, que === est plus rapide que ==? Je doute donc...
- J'ai tendance à éviter ce problème en utilisant toujours strpos($a, 'are') > -1 de tester pour de vrai. À partir d'une perspective débogage, j'ai trouver mon cerveau déchets de moins en moins de cycles d'horloge de déterminer si la ligne est écrite correctement lorsque je n'ai pas à compter contiguë signes "égal".
- Rembourrage avec des espaces et de la recherche pour " are " n'est pas la solution, car il n'est pas nécessairement suivi d'un espace (par exemple. " You are. ")
- il a travaillé comme un magique..j'ai essayé de convertir la distance de km en fonction de l'entrée,qu'il s'agisse d'un pied ou des miles..vérifier si la chaîne d'entrée contient ft ou mi,selon que la valeur est convertie...merci beaucoup.. 🙂
- Comment peut le faire pour plusieurs mots?
- est un peu de droit. Je ne veux pas être "ce gars-là", mais cette réponse est incomplète ou question devrait être reformulée de ne pas préciser qu'il est à la recherche de "mots" ^^U
- l'utilisation de multiples vérifications! 😉
- Je voudrais vous demander, est-il possible d'utiliser de la manière suivante : if (stripos($_GET['all'],"TOUS") === 0) echo 'vrai'; ?
- serait-ce de travailler avec un tableau comme la variable $a?
- pourquoi ne pas tout simplement if (strpos($a, 'are') > -1) {//found}else{//not found}
- J'ai atterri sur cette réponse spécifique des centaines de fois dans ma carrière, et à chaque fois que je l'ai lu, mon cerveau fait mal. Seeings que cette question a été vue de 2,5 millions de fois pouvons-nous changer l'exemple de quelque chose comme $subject = 'How are you?';$query = 'are';if (strpos($subject, $query) !== false).... Pas de soucis si pas, le fait qu'il a été vu de 2,5 millions de fois est probablement aussi une bonne raison de ne pas la modifier. Je voudrais aussi opter pour return true plutôt que echo 'true' mais je comprends que c'est vraiment commencer à s'écarter de la question.
- si vous voulez avoir de faux pour la chaîne "vous intéressez-vous?" et vrai pour les "Comment allez-vous", puis utiliser: if (strpos($a, ' sont ') !== false) {echo 'vrai';} avec des espaces avant et après: "sont "
- Oui, à l'aide de '===' est plus rapide que le '==', car il n'y a pas de contrainte de type nécessaire.
- Notez que parce que de nombreux cadres d'accord c'est idiot, la plupart d'entre eux ont des fonctions d'assistance disponibles. Par exemple, Laravel a str_contains($a, 'are'); comme on le voit ici: laravel.com/docs/5.5/helpers#method-str-contains.
- Si je reçois de 1 $à chaque fois que je visite cette page, veuillez copier-coller de cette solution, j'aurais acheté des nouilles ramen pour une semaine entière
- Si vous êtes intéressé par des mots plutôt que des octets, utilisez grapheme_strpos(). Ou, si vraiment vous ne pouvez pas utiliser International, utilisez mb_strpos() à la place.
- Je souhaite que je pourrais le score de 5 000 points à chaque fois que je l'ai laissé une mauvaise réponse! 😀 (Voir le premier commentaire ci-dessus.)
- pourquoi ne pas utiliser if (strpos($a, 'are') === true)
- vous ne pouvez pas faire cela, parce que la fonction strpos ne sera jamais retourner un booléen vrai, il renvoie une valeur booléenne false ou un décalage d'avoir un type entier. Donc, en d'autres termes, si (strpos($a, 'sont') !== false) signifie: "si l'offset où la chaîne est supérieur ou égal à 0". Si vous insistez sur l'utilisation de l' ===vraie déclaration, le code u écrire à l'intérieur de la si le bloc ne sera jamais exécutée 🙂 Cependant, ==true peut être exécutée que si le décalage était '1', ici, true, 1, parce que nous ne nous soucions pas de l'être de type booléen ou int
- c'est la pratique
- Cette réponse est fausse. Désolé @Breezer réponse est correcte
- lien utile liées à la question: tecadmin.net/check-string-contains-substring-in-php
- if ( is_int(strpos(...)) )
- en ce qui concerne la modification de l'ajout de la barre oblique inverse, vous avez dit qu'il "l'augmentation de la productivité", qu'est que cela veut dire?
- voici une explication comment les espaces de nuire à la performance: veewee.github.io/blog/...
- Bonne réponse de l'homme, merci
InformationsquelleAutor
540

Vous pouvez utiliser des expressions régulières, c'est mieux pour le mot correspondant par rapport à strpos comme mentionné par d'autres utilisateurs, il reviendra également vrai pour les chaînes de caractères comme tarif, de soins, de stare, etc. Cela peut simplement être évitée dans l'expression régulière en utilisant les limites de mot.

Un match simple pour le pourrait ressembler à quelque chose comme ceci:
```
$a = 'How are you?';

if (preg_match('/\bare\b/', $a)) {
    echo 'true';
}
```
Du côté de la performance, strpos est environ trois fois plus vite et avoir à l'esprit, quand j'ai fait un million compare à la fois, il a fallu preg_match de 1,5 secondes pour terminer et pour strpos il a pris de 0,5 secondes.

Edit:
Pour la recherche d'une quelconque partie de la chaîne, et pas seulement de mot en mot, je vous conseille d'utiliser une expression régulière comme
```
$a = 'How are you?';
$search 'are y';
if(preg_match("/{$search}/i", $a)) {
    echo 'true';
}
```
La i à la fin de l'expression régulière des modifications de l'expression régulière pour être sensible à la casse, si vous ne voulez pas, vous pouvez les laisser.

Maintenant, cela peut être très problématique dans certains cas, comme l' $chaîne de recherche n'est pas aseptisé de toute façon, je veux dire, il pourrait ne pas passer le vérifier dans certains cas, comme s' $search est une entrée de l'utilisateur, ils peuvent ajouter une chaîne de caractères qui peuvent se comporter comme des exemples de différents expression régulière...

Aussi, voici un excellent outil pour tester et voir les explications des différentes expressions régulières Regex101

De combiner les deux ensembles de fonctionnalités dans un seul multi-usage de la fonction (y compris avec une sélection sensible à la casse"), vous pouvez utiliser quelque chose comme ceci:
```
function FindString($needle,$haystack,$i,$word)
{   //$i should be "" or "i" for case insensitive
    if (strtoupper($word)=="W")
    {   //if $word is "W" then word search instead of string in string search.
        if (preg_match("/\b{$needle}\b/{$i}", $haystack)) 
        {
            return true;
        }
    }
    else
    {
        if(preg_match("/{$needle}/{$i}", $haystack)) 
        {
            return true;
        }
    }
    return false;
    //Put quotes around true and false above to return them as strings instead of as bools/ints.
}
```
- J'en doute. Les docs de l'état int preg_match ( string $pattern , string $subject [, array &$matches [, int $flags = 0 [, int $offset = 0 ]]] ).
- Je dirais que je trouve que c'est tout le contraire, c'est mauvais pour l'utiliser pour une opération compliquée si une alternative est présent, mais pour vraiment simple mot correspondant, c'est très bien, vous pouvez définir différents séparateurs pour le rendre insensible à la casse et ce n'est pas
- deuxième de tous, vous me donnez un -1 et non pas la question ? cmon il faut 2 secondes pour google la réponse google.com/...
- +1, d'une horrible façon de rechercher une chaîne simple, mais de nombreux visiteurs sont DONC à la recherche de toute façon pour la recherche pour l'un de leurs propres sous-chaînes, et il est utile que la suggestion a été mis en place. Même les OP pourraient avoir simplifié à l'extrême - laissez-lui savoir de ses alternatives.
- Techniquement, la question demande comment trouver mots ce n'est pas une sous-chaîne. En fait, cela m'a aidé car je peux l'utiliser avec cette regex word limites. Les Alternatives sont toujours utiles.
- Ne pas utiliser preg_match() si vous voulez seulement de vérifier si une chaîne est contenue dans une autre chaîne. Utilisation strpos() ou strstr() au lieu de cela, car ils seront plus rapide.
- Alors que la question ne se poser la question, cette réponse n'est pas réellement montrer une solution qui vérifie uniquement les mots entiers. S'aurait été une bien meilleure réponse si elle avait.
- +1 pour la réponse et -1 pour le @plutov.by commentaire car , strpos est juste un seul chèque en attendant regexp vous pouvez vérifier le nombre de mots dans le même temps, ex: preg_match(/sont|vous|ne/)
- Les Expressions régulières doit être le dernier recours de la méthode. Leur utilisation dans des tâches insignifiantes devrait être découragé. J'insiste sur ce à partir de la hauteur de plusieurs années de creuser un mauvais code.
- Ce commentaire est totalement perdu dans nulle part, mais de toute façon: preg_match fonctionne lorsque vous avez besoin pour vérifier le résultat de json demande (qui ne contient pas de error mot?) avant json_decode. strpos ne fonctionne pas pour moi.
- Si $a='Computer hardware', je veux qu'il revienne false lors de la recherche pour are. Néanmoins, dans ce cas, elle renvoie la valeur true. Comment faites-vous pour ne recherchez que des mots entiers???
- L'expression régulière doit être '/\bare\b/'. Le \b est un marqueur de limite de mot, de sorte que cette expression régulière ne correspond pas 'matériel'.
- À l'aide d'une regex pour faire une opération simple, c'est du matraquage. Utilisation strpos au lieu
InformationsquelleAutor
230

Ici est un peu la fonction d'utilité qui est utile dans des situations de ce genre
```
//returns true if $needle is a substring of $haystack
function contains($needle, $haystack)
{
    return strpos($haystack, $needle) !== false;
}
```
- Peut-être à sa place une classe utilitaire bien et permettrait d'améliorer la lisibilité.
- En fait, il peut améliore la lisibilité du code. Aussi, downvotes sont censés être pour les (très) mauvaises réponses, pas pour "neutre" ceux.
- À mon avis, c'est très mauvais pour écrire des fonctions qui en fait ne font rien d'autre que d'améliorer la lisibilité. Par conséquent, la valeur -1.
- les fonctions sont presque par définition, pour des raisons de lisibilité (pour communiquer l'idée de ce que vous faites). Comparer ce qui est plus lisible: if ($email->contains("@") && $email->endsWith(".com)) { ... ou if (strpos($email, "@") !== false && substr($email, -strlen(".com")) == ".com") { ...
- très mauvaise pour écrire des fonctions qui en fait ne font rien d'autre que l'amélioration de la lisibilité" Ça dépend. Ce n'est pas le meilleur des exemples, mais si vous êtes le maintien de quelqu'un d'autre code, il peut être utile.
- n'oubliez pas de citer le "à mon avis" la partie s'il vous plaît. Après tout, il est juste mon avis et je ne suis jamais ce qui suggère que c'est une règle d'or. Cela étant dit, vous êtes complètement à droite qu'il pourrait y avoir certains cas utiles pour cela. Mais même alors, à mon avis, c'est toujours une mauvaise pratique.
- à la fin, les règles sont faites pour être transgressées. Sinon, les gens ne sont pas venus avec les nouveaux moyens inventifs de faire les choses 🙂 . Plus dois admettre que j'ai de la difficulté d'emballage de l'esprit autour des trucs comme sur martinfowler.com. Deviner la bonne chose à faire est d'essayer des choses vous-même et de savoir quelles sont les approches les plus pratiques.
- Un autre avis: Ayant une fonction utilitaire qui vous pouvez facilement enrouler peut aider le débogage. Aussi il loundens le cri de la bonne optimiseurs qui éliminer ces frais généraux dans les services de production. Donc, toutes les opinions ont des points valides. 😉
- Pour ceux d'entre nous aussi écrit en C# cette fonction est une belle addition. Remarque: il doit être codé comme retour (strpos($haystack, $aiguille) !== false);
- Vous ne savez jamais si l'aiguille vient avant ou après le haystace. Cette fonction d'assistance changements de l'aiguille la plus commune de la position. +1
- Comme beaucoup avant moi ont dit cela améliore la lisibilité, mais disons que plus tard dans votre projet, vous réalisez cette fonction retourne false dans tous les sens. Peut-être parce qu'un mot a commencé avec une majuscule quand il normalement démarré avec un
- Bien sûr, cela est utile. Vous devriez encourager cette. Qu'advient-il si dans 100 PHP il y a une nouvelle et plus rapide pour trouver chaîne endroits ? Voulez-vous changer tous les lieux où vous appelez strpos ? Ou voulez-vous changer seulement le contient à l'intérieur de la fonction ??
InformationsquelleAutor
129

Alors que la plupart de ces réponses pourront vous dire si une sous-chaîne apparaît dans votre chaîne, ce n'est généralement pas ce que vous voulez si vous êtes à la recherche pour un particulier mot, et pas un sous-chaîne.

Quelle est la différence? Les chaînes peuvent apparaître dans d'autres mots:
- Le "sont" au début de la "zone"
- Le "sont" à la fin de "lièvre"
- Le "sont" au milieu de "tarifs"
Une façon d'atténuer ce serait d'utiliser une expression régulière couplée avec les limites de mot (\b):
```
function containsWord($str, $word)
{
    return !!preg_match('#\\b' . preg_quote($word, '#') . '\\b#i', $str);
}
```
Cette méthode n'a pas le même faux positifs indiqué ci-dessus, mais elle a quelques cas de bord de son propre. Les limites de mot de match sur la non-caractères de mot (\W), qui vont être quelque chose qui n'est pas a-z, A-Z, 0-9, ou _. Cela signifie que des chiffres et des caractères de soulignement sont va être compté comme la parole des personnages et des scénarios de ce genre de fail:
- Le "sont" dans "Ce _are_ pensez-vous?"
- Le "sont" dans "lol u ne sais pas wut ceux are4?"
Si vous voulez quelque chose de plus précis que cela, vous avez pour commencer à faire de l'anglais la langue de vérification de syntaxe, et c'est une assez grosse boîte de pandore (et suppose la bonne utilisation de la syntaxe, de toute façon, ce qui n'est pas toujours une donnée).
- cela devrait être la réponse canonique. Parce que nous sommes à la recherche pour mots et pas sous-chaînes, la regex est approprié. Je vais aussi ajouter que \b correspond à deux choses qui \W ne le fait pas, qui le rend idéal pour trouver mots est une chaîne de caractères: Elle correspond au début de la chaîne (^) et la fin de la chaîne ($)
- Cela ne fonctionne pas: 3v4l.org/vPk2V
- cela devrait être la bonne réponse.. le reste des réponses trouverez "sont" dans une chaîne comme "avez-vous des soins".. Comme mentionné par @Dtest
- Est-ce si mauvais? Si vous m'avez demandé si la chaîne de caractères "prendre soin" contient le mot "sont", je dirais "oui". Le mot "sont" est clairement une sous-chaîne d'une chaîne. C'est une question distincte de """Est "sont" l'un des mots dans la chaîne "avez-vous des soins"""".
- Bien que l'OP n'a pas de spécifier la variable $a est une phrase, je suis sûr que c'était implicite. Si sa question était de savoir comment détecter la Parole à l'intérieur de la Phrase. Pas si un Mot contient un Mot à l'intérieur d'elle, qui je suppose ne serait pas plus souvent que les autres.
- il ne fonctionne, il vous manque juste le `\` 3v4l.org/ZRpYi
InformationsquelleAutor
112

Pour déterminer si une chaîne contient une autre chaîne de caractères, vous pouvez utiliser la fonction PHP strpos().

int strpos ( string $haystack , mixed $needle [, int $offset = 0 ] )
```
<?php

$haystack = 'how are you';
$needle = 'are';

if (strpos($haystack,$needle) !== false) {
    echo "$haystack contains $needle";
}

?>
```
ATTENTION:

Si l'aiguille que vous recherchez est au début de la botte de foin, il sera de retour en position 0, si vous faites un == comparez cela ne fonctionnera pas, vous aurez besoin de faire un ===

Un == signe est une comparaison et teste si la variable /expression /constante de la gauche a la même valeur que la variable /expression /constante pour la droite.

Un === signe est une comparaison pour voir si deux variables /expressions /constantes sont égaux AND ont le même type c'est à dire les deux sont des chaînes de caractères, ou les deux, sont des nombres entiers.
- citer la source? maxi-pedia.com/string+contient+chaîne+PHP
InformationsquelleAutor

Regardez strpos():

<?php
    $mystring = 'abc';
    $findme   = 'a';
    $pos = strpos($mystring, $findme);

    //Note our use of ===. Simply, == would not work as expected
    //because the position of 'a' was the 0th (first) character.
    if ($pos === false) {
        echo "The string '$findme' was not found in the string '$mystring'.";
    }
    else {
        echo "The string '$findme' was found in the string '$mystring',";
        echo " and exists at position $pos.";
    }
?>

InformationsquelleAutor

58

À l'aide de strstr() ou stristr() si votre recherche devrait être sensible à la casse serait une autre option.
- Une note sur la php.net/manual/en/function.strstr.php de la page: Remarque: Si vous ne souhaitez afin de déterminer si un particulier aiguille se produit à l'intérieur de la botte de foin, l'utilisation la plus rapide et moins gourmande en mémoire la fonction strpos() à la place.
- Existe-il des repères de bonne réputation à ce sujet?
- Cela peut être plus lent, mais à mon humble avis strstr($a, 'are') est beaucoup plus élégant que le laid strpos($a, 'are') !== false. PHP a vraiment besoin d'une str_contains() fonction.
InformationsquelleAutor

Peer to SamGoody et Lego Stormtroopr commentaires.

Si vous êtes à la recherche pour un PHP algorithme de rang des résultats de recherche basés sur la proximité et de la pertinence de plusieurs mots
voici un moyen facile et rapide de générer des résultats de recherche avec PHP seulement:

Questions avec l'autre les méthodes de recherche booléenne comme strpos(), preg_match(), strstr() ou stristr()

ne pouvez pas rechercher plusieurs mots
les résultats sont non-classé

PHP méthode basée sur Modèle Vectoriel et tf-idf (term frequency–inverse document frequency):

Il semble difficile mais il est étonnamment facile.

Si nous voulons rechercher plusieurs mots dans une chaîne, le problème central est de savoir comment nous attribuer un poids à chacun d'eux?

Si nous pouvions poids des termes dans une chaîne de caractères basé sur la façon dont ils sont représentatifs de la chaîne dans son ensemble,
nous pourrions commander nos résultats par ceux qui correspondent le mieux à la requête.

C'est l'idée du modèle vectoriel, non loin de la façon dont SQL de recherche de texte intégral d'œuvres:

function get_corpus_index($corpus = array(), $separator=' ') {
$dictionary = array();
$doc_count = array();
foreach($corpus as $doc_id => $doc) {
$terms = explode($separator, $doc);
$doc_count[$doc_id] = count($terms);
//tf–idf, short for term frequency–inverse document frequency, 
//according to wikipedia is a numerical statistic that is intended to reflect 
//how important a word is to a document in a corpus
foreach($terms as $term) {
if(!isset($dictionary[$term])) {
$dictionary[$term] = array('document_frequency' => 0, 'postings' => array());
}
if(!isset($dictionary[$term]['postings'][$doc_id])) {
$dictionary[$term]['document_frequency']++;
$dictionary[$term]['postings'][$doc_id] = array('term_frequency' => 0);
}
$dictionary[$term]['postings'][$doc_id]['term_frequency']++;
}
//from http://phpir.com/simple-search-the-vector-space-model/
}
return array('doc_count' => $doc_count, 'dictionary' => $dictionary);
}
function get_similar_documents($query='', $corpus=array(), $separator=' '){
$similar_documents=array();
if($query!=''&&!empty($corpus)){
$words=explode($separator,$query);
$corpus=get_corpus_index($corpus, $separator);
$doc_count=count($corpus['doc_count']);
foreach($words as $word) {
if(isset($corpus['dictionary'][$word])){
$entry = $corpus['dictionary'][$word];
foreach($entry['postings'] as $doc_id => $posting) {
//get term frequency–inverse document frequency
$score=$posting['term_frequency'] * log($doc_count + 1 / $entry['document_frequency'] + 1, 2);
if(isset($similar_documents[$doc_id])){
$similar_documents[$doc_id]+=$score;
}
else{
$similar_documents[$doc_id]=$score;
}
}
}
}
//length normalise
foreach($similar_documents as $doc_id => $score) {
$similar_documents[$doc_id] = $score/$corpus['doc_count'][$doc_id];
}
//sort from  high to low
arsort($similar_documents);
}   
return $similar_documents;
}

CAS 1

$query = 'are';
$corpus = array(
1 => 'How are you?',
);
$match_results=get_similar_documents($query,$corpus);
echo '<pre>';
print_r($match_results);
echo '</pre>';

RÉSULTAT

Array
(
[1] => 0.52832083357372
)

CAS 2

$query = 'are';
$corpus = array(
1 => 'how are you today?',
2 => 'how do you do',
3 => 'here you are! how are you? Are we done yet?'
);
$match_results=get_similar_documents($query,$corpus);
echo '<pre>';
print_r($match_results);
echo '</pre>';

RÉSULTATS

Array
(
[1] => 0.54248125036058
[3] => 0.21699250014423
)

CAS 3

$query = 'we are done';
$corpus = array(
1 => 'how are you today?',
2 => 'how do you do',
3 => 'here you are! how are you? Are we done yet?'
);
$match_results=get_similar_documents($query,$corpus);
echo '<pre>';
print_r($match_results);
echo '</pre>';

RÉSULTATS

Array
(
[3] => 0.6813781191217
[1] => 0.54248125036058
)

Il y a beaucoup d'améliorations à apporter
mais le modèle fournit un moyen d'obtenir de bons résultats naturels des requêtes,
qui n'ont pas les opérateurs booléens tels que strpos(), preg_match(), strstr() ou stristr().

NOTA BENE

Éventuellement éliminer la redondance avant de rechercher les mots

réduisant ainsi la taille de l'index et résultant en moins de besoins de stockage
moins d'I/O disque
la rapidité d'indexation et, par conséquent, une recherche plus rapide.

1. Normalisation

Convertir tout le texte en minuscules

2. Ignoré élimination

Éliminer les mots du texte qui ne transportent pas de sens réel (comme 'et', 'ou', 'la', 'pour', etc.)

3. Dictionnaire de substitution

Remplacer des mots par d'autres qui ont un produit identique ou similaire sens.
(ex:remplacer les occurrences de "avidement" et "faim" avec la "faim")
Plus d'algorithmique mesures (boule de neige) peuvent être effectuées pour réduire les mots à leur signification essentielle.
Le remplacement des noms de couleur avec leurs équivalents hexadécimaux
La réduction de valeurs numériques en réduisant la précision sont d'autres façons de normaliser le texte.

RESSOURCES

InformationsquelleAutor

42

Faire usage de cas insensitve correspondant à l'aide de stripos():
```
if (stripos($string,$stringToSearch) !== false) {
echo 'true';
}
```
InformationsquelleAutor
40

Si vous voulez éviter les "falsey" et "truthy" problème, vous pouvez utiliser substr_count:
```
if (substr_count($a, 'are') > 0) {
echo "at least one 'are' is present!";
}
```
C'est un peu plus lent que strpos mais évite de la comparaison de problèmes.

InformationsquelleAutor
31

Une autre option est d'utiliser le strstr() fonction. Quelque chose comme:
```
if (strlen(strstr($haystack,$needle))>0) {
//Needle Found
}
```
Point à noter: Le strstr() la fonction est sensible à la casse. Pour la casse de la recherche, utilisez la stristr() fonction.
- strstr() retourne FALSE si l'aiguille n'a pas été trouvé. Ainsi, un strlen n'est pas nécessaire.
- bon travail pour la casse avec stristr()
InformationsquelleAutor
28

Je suis un peu impressionnée par le fait qu'aucune des réponses ici strpos, strstr et des fonctions similaires mentionnés Fonctions De Chaînes De Caractères Multi-Octets encore (2015-05-08).

En gros, si vous êtes avoir de la difficulté à trouver des mots avec des caractères spécifiques à certaines langues, comme l'allemand, le français, le portugais, l'espagnol, etc. (par exemple: ä, é, ô, ç, º, ñ), vous pouvez faire précéder les fonctions avec mb_. Par conséquent, l'on a accepté la réponse serait d'utiliser mb_strpos ou mb_stripos (comparaison insensible à la casse) à la place:
```
if (mb_strpos($a,'are') !== false) {
echo 'true';
}
```
Si vous ne pouvez pas garantir que l'ensemble de vos données est de 100% en UTF-8, vous pouvez utiliser le mb_ fonctions.

Un bon article pour comprendre pourquoi Le Minimum Absolu que Tout Développeur Doit Absolument, Positivement Savoir Sur Unicode et les Jeux de Caractères (Pas d'Excuses!) par Joel Spolsky.

InformationsquelleAutor
28
```
if (preg_match('/(are)/', $a)) {
echo 'true';
}
```
- c'est le droit. mieux utiliser "preg_match()"
- Je reçois le message d'avertissement suivant: WARNING preg_match(): Delimiter must not be alphanumeric or backslash
InformationsquelleAutor

La fonction ci-dessous qui fonctionne et ne dépend pas d'une autre fonction; il n'utilise que PHP natif de manipulation de chaîne. Personnellement, je ne recommande pas cela, mais vous pouvez voir comment cela fonctionne:

<?php
if (!function_exists('is_str_contain')) {
function is_str_contain($string, $keyword)
{
if (empty($string) || empty($keyword)) return false;
$keyword_first_char = $keyword[0];
$keyword_length = strlen($keyword);
$string_length = strlen($string);
//case 1
if ($string_length < $keyword_length) return false;
//case 2
if ($string_length == $keyword_length) {
if ($string == $keyword) return true;
else return false;
}
//case 3
if ($keyword_length == 1) {
for ($i = 0; $i < $string_length; $i++) {
//Check if keyword's first char == string's first char
if ($keyword_first_char == $string[$i]) {
return true;
}
}
}
//case 4
if ($keyword_length > 1) {
for ($i = 0; $i < $string_length; $i++) {
/*
the remaining part of the string is equal or greater than the keyword
*/
if (($string_length + 1 - $i) >= $keyword_length) {
//Check if keyword's first char == string's first char
if ($keyword_first_char == $string[$i]) {
$match = 1;
for ($j = 1; $j < $keyword_length; $j++) {
if (($i + $j < $string_length) && $keyword[$j] == $string[$i + $j]) {
$match++;
}
else {
return false;
}
}
if ($match == $keyword_length) {
return true;
}
//end if first match found
}
//end if remaining part
}
else {
return false;
}
//end for loop
}
//end case4
}
return false;
}
}

Test:

var_dump(is_str_contain("test", "t")); //true
var_dump(is_str_contain("test", "")); //false
var_dump(is_str_contain("test", "test")); //true
var_dump(is_str_contain("test", "testa")); //flase
var_dump(is_str_contain("a----z", "a")); //true
var_dump(is_str_contain("a----z", "z")); //true 
var_dump(is_str_contain("mystringss", "strings")); //true

Pourriez-vous me dire pourquoi dans le monde, vous devez utiliser une fonction comme celle-ci, lorsque strpos est une solution parfaitement viable?...
vous avez entièrement raison, cependant, strpos également basé sur quelque chose comme ça, aussi, je n'ai pas posté pour rep, juste pour partager un peu de connaissance
dernière var_dump est faux
c'était de la faute de frappe: var_dump(is_str_contain("mystringss", "chaînes")); //true

InformationsquelleAutor

En PHP, la meilleure façon de vérifier si une chaîne contient un certain sous-chaîne, est d'utiliser une simple fonction d'assistance comme ceci:

function contains($haystack, $needle, $caseSensitive = false) {
return $caseSensitive ?
(strpos($haystack, $needle) === FALSE ? FALSE : TRUE):
(stripos($haystack, $needle) === FALSE ? FALSE : TRUE);
}

Explication:

strpos trouve la position de la première occurrence d'un cas sensible à la sous-chaîne dans une chaîne.
stripos trouve la position de la première occurrence d'un casse sous-chaîne dans une chaîne.
myFunction($haystack, $needle) === FALSE ? FALSE : TRUE assure que myFunction retourne toujours une valeur booléenne et résout un comportement inattendu lorsque l'index de la sous-chaîne est de 0.
$caseSensitive ? A : B sélectionne soit strpos ou stripos pour faire le travail, en fonction de la valeur de $caseSensitive.

De sortie:

var_dump(contains('bare','are'));            //Outputs: bool(true)
var_dump(contains('stare', 'are'));          //Outputs: bool(true)
var_dump(contains('stare', 'Are'));          //Outputs: bool(true)
var_dump(contains('stare', 'Are', true));    //Outputs: bool(false)
var_dump(contains('hair', 'are'));           //Outputs: bool(false)
var_dump(contains('aren\'t', 'are'));        //Outputs: bool(true)
var_dump(contains('Aren\'t', 'are'));        //Outputs: bool(true)
var_dump(contains('Aren\'t', 'are', true));  //Outputs: bool(false)
var_dump(contains('aren\'t', 'Are'));        //Outputs: bool(true)
var_dump(contains('aren\'t', 'Are', true));  //Outputs: bool(false)
var_dump(contains('broad', 'are'));          //Outputs: bool(false)
var_dump(contains('border', 'are'));         //Outputs: bool(false)

InformationsquelleAutor

21

J'ai eu quelques difficultés avec cela, et finalement j'ai choisi de créer ma propre solution. Sans l'aide de expression régulière moteur:
```
function contains($text, $word)
{
$found = false;
$spaceArray = explode(' ', $text);
$nonBreakingSpaceArray = explode(chr(160), $text);
if (in_array($word, $spaceArray) ||
in_array($word, $nonBreakingSpaceArray)
) {
$found = true;
}
return $found;
}
```
Vous pouvez remarquer que les solutions précédentes ne sont pas une réponse pour le mot étant utilisé comme préfixe pour l'autre. Afin d'utiliser votre exemple:
```
$a = 'How are you?';
$b = "a skirt that flares from the waist";
$c = "are";
```
Avec les exemples ci-dessus, les deux $a et $b contient $c, mais vous pourriez voulez que votre fonction pour vous dire que seuls les $a contient $c.
- vous avez probablement dire: $found = false au début
- votre fonction peut ne pas fonctionner si le mot est lié avec la virgule, point d'interrogation ou un point. par exemple, "ce que vous voyez est ce que vous obtenez." et que vous souhaitez afin de déterminer si "get" est dans la phrase. Avis de l'arrêt complet à côté de "get". Dans ce cas, la fonction renvoie la valeur false. il est recommandé d'utiliser l'expression régulière ou substr(je crois qu'il utilise l'expression régulière de toute façon) pour rechercher/remplacer des chaînes de caractères.
- vous ne pourriez pas être plus de mal avec votre recommandation, que signifie pour vous "il est recommandé" ? il n'y a pas de suprême de la personne qui recommande ou aproves. C'est à propos de l'utilisation du moteur d'expression régulière en php qui est un blocage dans la langue elle-même, vous pouvez essayer de mettre une regex match dans une boucle et de comparer les résultats.
InformationsquelleAutor

Vous pouvez utiliser le strstr fonction:

$haystack = "I know programming";
$needle   = "know";
$flag = strstr($haystack, $needle);
if ($flag){
echo "true";
}

Sans l'aide d'une fonction intégrée de fonction:

$haystack  = "hello world";
$needle = "llo";
$i = $j = 0;
while (isset($needle[$i])) {
while (isset($haystack[$j]) && ($needle[$i] != $haystack[$j])) {
$j++;
$i = 0;
}
if (!isset($haystack[$j])) {
break;
}
$i++;
$j++;
}
if (!isset($needle[$i])) {
echo "YES";
}
else{
echo "NO ";
}

Plantages si vous cherchez la première parole.

InformationsquelleAutor

17

Une autre option pour trouver les occurrences d'un mot à partir d'une chaîne à l'aide de strstr() et stristr() est comme suit:
```
<?php
$a = 'How are you?';
if (strstr($a,'are'))  //Case sensitive
echo 'true';
if (stristr($a,'are'))  //Case insensitive
echo 'true';
?>
```
- C'est à l'envers. Le i dans stristr signifie insensible.
InformationsquelleAutor

Il peut être fait de trois façons différentes:

 $a = 'How are you?';

1 - stristr()

 if (strlen(stristr($a,"are"))>0) {
echo "true"; //are Found
}

2 - strpos()

 if (strpos($a, "are") !== false) {
echo "true"; //are Found
}

3 - preg_match()

 if( preg_match("are",$a) === 1) {
echo "true"; //are Found
}

bon, mais preg_match est risqué car il peut retourner false ou 0. Vous devriez être à l'essai pour l' ===1 à n ° 3

InformationsquelleAutor

14

Court-version
```
$result = false!==strpos($a, 'are');
```
- Alors que cet extrait de code, peut-être de résoudre la question, y compris une explication aide vraiment à améliorer la qualité de votre post. Rappelez-vous que vous répondez à la question pour les lecteurs dans l'avenir, et ces personnes pourraient ne pas connaître les raisons de votre code suggestion.
InformationsquelleAutor
14

Afin de trouver un "mot", plutôt que de la survenance d'une série de lettres qui pourraient en fait être une partie d'un autre mot, le suivant serait une bonne solution.
```
$string = 'How are you?';
$array = explode(" ", $string);
if (in_array('are', $array) ) {
echo 'Found the word';
}
```
- ce sera un échec si $string est Are are, are?
InformationsquelleAutor

Vous devez utiliser la casse de format,de sorte que si la valeur saisie est en small ou caps il l'habitude de la matière.

<?php
$grass = "This is pratik joshi";
$needle = "pratik";
if (stripos($grass,$needle) !== false) { 
/*If i EXCLUDE : !== false then if string is found at 0th location, 
still it will say STRING NOT FOUND as it will return '0' and it      
will goto else and will say NOT Found though it is found at 0th location.*/
echo 'Contains word';
}else{
echo "does NOT contain word";
}
?>

Ici stripos trouve aiguille dans heystack sans considérant cas (petit/caps).

PHPCode Échantillon avec sortie

ne fonctionne pas si $needle = "this"; => codepad.org/wUIKQ0A8

InformationsquelleAutor

13

Beaucoup de réponses qui utilisent substr_count vérifie si le résultat est >0. Mais depuis le if instruction estime zéro le même en tant que faux, vous pouvez éviter que de vérifier et de les écrire directement:
```
if (substr_count($a, 'are')) {
```
Pour vérifier si pas présent, ajoutez l' ! opérateur:
```
if (!substr_count($a, 'are')) {
```
- Eh bien... en partie vrai, en php 0 == false est vrai, mais 0 === faux est faux
InformationsquelleAutor

Peut-être vous pouvez utiliser quelque chose comme ceci:

<?php
findWord('Test all OK');
function findWord($text) {
if (strstr($text, 'ok')) {
echo 'Found a word';
}
else
{
echo 'Did not find a word';
}
}
?>

InformationsquelleAutor

11

Ne pas utiliser preg_match() si vous voulez seulement de vérifier si une chaîne est contenue dans une autre chaîne. Utilisation strpos() ou strstr() au lieu de cela, car ils seront plus rapide. (http://in2.php.net/preg_match)
```
if (strpos($text, 'string_name') !== false){
echo 'get the string';
}
```
InformationsquelleAutor

Si vous voulez vérifier si la chaîne contient plusieurs spécificités mots, vous pouvez le faire:

$badWords = array("dette", "capitale", "rembourser", "ivoire", "mandat");
$string = "a string with the word ivoire";
$matchFound = preg_match_all("/\b(" . implode($badWords,"|") . ")\b/i", $string, $matches);
if ($matchFound) {
echo "a bad word has been found";
}
else {
echo "your string is okay";
}

C'est utile pour éviter les spams, lors de l'envoi d'e-mails par exemple.

InformationsquelleAutor

10

La fonction strpos fonctionne très bien, mais si vous voulez faire case-insensitive la vérification d'un mot dans un paragraphe, vous pouvez faire usage de la stripos fonction de PHP.

Par exemple,
```
$result = stripos("I love PHP, I love PHP too!", "php");
if ($result === false) {
//Word does not exist
}
else {
//Word exists
}
```
Trouver la position de la première occurrence de la casse sous-chaîne dans une chaîne.

Si le mot n'existe pas dans la chaîne puis il retournera false sinon elle retourne la position de la parole.

InformationsquelleAutor
9

Vous devez utiliser identiques ou pas identiques opérateurs parce que strpos peut retourner 0 comme valeur de l'indice. Si vous aimez les opérateurs ternaires, l'utilisation de la suite (il semble un peu en arrière, je l'admets):
```
echo FALSE === strpos($a,'are') ? 'false': 'true';
```
InformationsquelleAutor
8

Vérifier si la chaîne contient des mots spécifiques?

Cela signifie que la chaîne doit être résolu en mots (voir la note ci-dessous).

Une façon de le faire et de spécifier le séparateur est à l'aide de preg_split (doc):
```
<?php
function contains_word($str, $word) {
//split string into words
//separators are substrings of at least one non-word character
$arr = preg_split('/\W+/', $str, NULL, PREG_SPLIT_NO_EMPTY);
//now the words can be examined each
foreach ($arr as $value) {
if ($value === $word) {
return true;
}
}
return false;
}
function test($str, $word) {
if (contains_word($str, $word)) {
echo "string '" . $str . "' contains word '" . $word . "'\n";
} else {
echo "string '" . $str . "' does not contain word '" . $word . "'\n" ;
}
}
$a = 'How are you?';
test($a, 'are');
test($a, 'ar');
test($a, 'hare');
?>
```
Une course donne
```
$ php -f test.php                   
string 'How are you?' contains word 'are' 
string 'How are you?' does not contain word 'ar'
string 'How are you?' does not contain word 'hare'
```
Remarque: Ici on ne parle pas de mot pour chaque séquence de symboles.

Une définition pratique de la parole est dans le sens le moteur d'expression régulière PCRE, où les mots sont des sous-chaînes composé de caractères de mot seulement, étant séparés par des non-caractères de mot.

Un "mot" de caractère est une lettre ou un chiffre ou le caractère de soulignement,
c'est-à-dire un caractère qui peut être partie d'un Perl " mot ". L'
définition de lettres et de chiffres est contrôlée par PCRE du caractère
les tables, et peuvent varier si les paramètres régionaux en correspondance est en cours (..)

InformationsquelleAutor
7

Une chaîne de caractères peut être vérifié avec le dessous de la fonction:
```
function either_String_existor_not($str, $character) {
if (strpos($str, $character) !== false) {
return true;
}
return false;
}
```
- peut être simplifié à return strpos($str, $character) !== false
- ce abt si la chaîne est "avez-vous des soins", puis
InformationsquelleAutor

Une autre solution pour une chaîne spécifique:

$subject = 'How are you?';
$pattern = '/are/';
preg_match($pattern, $subject, $match);
if ($match[0] == 'are') {
echo true;
}

Vous pouvez également utiliser strpos() fonction.

InformationsquelleAutor

Utilisation:

$text = 'This is a test';
echo substr_count($text, 'is'); //2
//So if you want to check if is exists in the text just put
//in a condition like this:
if (substr_count($text, 'is') > 0) {
echo "is exists";
}

InformationsquelleAutor

Une option plus simple:

return ( ! empty($a) && strpos($a, 'are'))? true : false;

InformationsquelleAutor

4

Je pense qu'une bonne idée est d'utiliser mb_stpos:
```
$haystack = 'How are you?';
$needle = 'are';
if (mb_strpos($haystack, $needle) !== false) {
echo 'true';
}
```
Parce que cette solution est sensible à la casse et sans danger pour tous les caractères Unicode.

Mais vous pouvez aussi faire comme ceci (sauch réponse n'était pas encore):
```
if (count(explode($needle, $haystack)) > 1) {
echo 'true';
}
```
Cette solution est également sensible à la casse et sûr pour les caractères Unicode.

En outre, vous ne pas utiliser la négation de l'expression, qui augmente la lisibilité du code.

Ici est d'autre solution à l'aide de la fonction:
```
function isContainsStr($haystack, $needle) {
return count(explode($needle, $haystack)) > 1;
}
if (isContainsStr($haystack, $needle)) {
echo 'true';
}
```
InformationsquelleAutor
3

Utilisation:
```
$a = 'How are you?';
if (mb_strpos($a, 'are')) {
echo 'true';
}
```
Il effectue un multi-octets sûr strpos() de l'opération.
- Ce n'est pas une bonne réponse. Si la chaîne de recherche sera au début de la chaîne recherchée, alors la fonction mb_strpos(...) retour à zéro, ce qui évolue dans le faux.
InformationsquelleAutor
3

Vous pouvez également utiliser les fonctions intégrées strchr() et strrchr() et des extensions pour les chaînes de caractères multi-octets mb_strchr() et mb_strrchr().
Ces fonctions retournent des parties de cordes, et FALSE si rien n'est trouvé.
- strchr() - Trouver la première occurrence d'une chaîne (qui est un alias de strstr()).
- strrchr() - Trouver la dernière occurrence d'un caractère dans une chaîne.
InformationsquelleAutor

Vous devez vous connecter pour publier un commentaire.