Comment Tronquer une chaîne de caractères en PHP pour le terme le plus proche pour un certain nombre de caractères?

J'ai un extrait de code écrit en PHP qui tire un bloc de texte à partir d'une base de données et les envoie à un widget sur une page web. L'original de bloc de texte peut être un long article ou une courte phrase ou deux, mais pour ce widget je ne peux pas afficher plus de, disons, 200 caractères. Je pourrais utiliser substr() pour couper le texte à 200 caractères, mais le résultat serait de couper dans le milieu des mots, ce que je veux est de hacher le texte à la fin de la dernière mot avant de 200 caractères.

La question à l'intention de dire que le texte tronqué, sera adapté en un nombre fixe de pixels sur une page web. Dans ce cas, en fonction de police, l'espace requis par char n'est pas constante. Et donc nous ne pouvons pas supposer que 200 caractères vont s'intégrer au mieux dans pixels disponibles. Jusqu'à présent (jusqu'02-Mar-2011), tous ci-dessous les réponses sont manquantes ce point et donc aucun d'entre eux offrent une solution fiable. -:(
Non, pas vraiment. Vous pouvez définir la police dans un moyen fiable, et ensuite mesurer le scénario du pire cas aka combien de large personnages serait de les intégrer. Et si vous avez besoin d'être à 100% sûr de savoir comment navigateur rendu, ce n'est pas un problème PHP plus de toute façon.
Essayez Ce Lien, Peut Vous aider stackoverflow.com/a/26098951/3944217
Vous pouvez trouver s($str)->truncateSafely(200) utile, que l'on trouve dans cette bibliothèque autonome.

InformationsquelleAutor Brian | 2008-09-17

217

À l'aide de la wordwrap fonction. Il scinde les textes en lignes multiples, tels que la largeur maximale est celui que vous avez spécifié, la rupture aux limites des mots. Après la séparation, il vous suffit de prendre la première ligne:
```
substr($string, 0, strpos(wordwrap($string, $your_desired_width), "\n"));
```
Une chose de cette oneliner ne gère pas le cas où le texte lui-même est plus courte que la largeur désirée. Pour gérer ce bord-cas, on doit faire quelque chose comme:
```
if (strlen($string) > $your_desired_width) 
{
    $string = wordwrap($string, $your_desired_width);
    $string = substr($string, 0, strpos($string, "\n"));
}
```
La solution ci-dessus a le problème de l'prématurément de la coupe de la texte si elle contient un saut de ligne avant le cutpoint. Ici, une version qui permet de résoudre ce problème:
```
function tokenTruncate($string, $your_desired_width) {
  $parts = preg_split('/([\s\n\r]+)/', $string, null, PREG_SPLIT_DELIM_CAPTURE);
  $parts_count = count($parts);

  $length = 0;
  $last_part = 0;
  for (; $last_part < $parts_count; ++$last_part) {
    $length += strlen($parts[$last_part]);
    if ($length > $your_desired_width) { break; }
  }

  return implode(array_slice($parts, 0, $last_part));
}
```
Aussi, ici, est le PHPUnit testclass utilisé pour tester la mise en œuvre:
```
class TokenTruncateTest extends PHPUnit_Framework_TestCase {
  public function testBasic() {
    $this->assertEquals("1 3 5 7 9 ",
      tokenTruncate("1 3 5 7 9 11 14", 10));
  }

  public function testEmptyString() {
    $this->assertEquals("",
      tokenTruncate("", 10));
  }

  public function testShortString() {
    $this->assertEquals("1 3",
      tokenTruncate("1 3", 10));
  }

  public function testStringTooLong() {
    $this->assertEquals("",
      tokenTruncate("toooooooooooolooooong", 10));
  }

  public function testContainingNewline() {
    $this->assertEquals("1 3\n5 7 9 ",
      tokenTruncate("1 3\n5 7 9 11 14", 10));
  }
}
```
EDIT :

Spécial des caractères UTF8 comme 'à' ne sont pas traitées. Ajouter en " u " à la fin de la REGEX pour le manipuler:

$parts = preg_split('/([\s\n\r]+)/u', $string, null, PREG_SPLIT_DELIM_CAPTURE);
- Cela semble comme il l'aurait fait prématurément couper le texte s'il y a un \n avant de la largeur désirée.
- vrai, il y a effectivement un problème. J'ai mis à jour la réponse à une alternative qui permet de résoudre le problème donné.
- Serait-ce exemple, le travail pour une chaîne qui contient des balises html comme une des étiquettes de paragraphe?
- c'est vraiment utile pour moi, mon mal de tête était long Arabic des lettres et de la réduction de son afin de corriger les mots maintenant, avec l'aide de tokenTruncate fonction.. tnx un million 🙂
- Pourquoi ne pas ajouter: if(strlen($string) <= $your_desired_width) return $string; comme première instruction?
- Pour un liner tokenTruncate(), utilisez le caractère ascii unit seperator qui est ce à quoi il est destiné: substr($content, 0, strpos(wordwrap($content, 350, chr(31)), chr(31)))
- Le Code est mauvais, et sera de retour supérieur à la longueur désirée.
- C'est l'amour! J'ai ajouté un trim() autour de la finale de la valeur retournée. Sinon, vous finirez avec un espace de fin.
InformationsquelleAutor Grey Panther
136

Revenir les 200 premiers caractères de mots:
```
preg_replace('/\s+?(\S+)?$/', '', substr($string, 0, 201));
```
- Presque. Il me semble qu'il supprime le dernier mot de la phrase, pour moi, n'importe quoi.
- fonctionne très bien mais j'ai trouvé la même erreur que ReX357. Quand il n'y a plus de 1 mot, il supprime le dernier.
- Juste envelopper dans un assurez-vous que la chaîne est plus longue que ce que vous testez (de même que pour la accepté de répondre) if (strlen($string) > $your_desired_width) { preg_replace(...); }
- J'ai édité la réponse à inclure @BlairMcMillan conseils
- IL SUPPRIME LE DERNIER MOT TOUJOURS 😛
- De minuscules amélioration de la regex: les parenthèses final \S+ en option pour le match, mais ils ont aussi de saisir ces caractères. Depuis nous n'avons pas besoin de la capture de ces personnages, de faire les parenthèses non-capture de la sorte: /\s+?(?:\S+)?$/
- ne peux pas le voir en quoi elle peut aider. Ne pas le résultat de substr() être la même considérer que la chaîne est coupée à une longueur définie?
- ouais, je n'ai aucune idée de ce à quoi je pensais quand j'ai posté ce commentaire.
InformationsquelleAutor mattmac
45
```
$WidgetText = substr($string, 0, strrpos(substr($string, 0, 200), ' '));
```
Et là vous l'avez — un moyen fiable de les tronquer une chaîne à l'entier le plus proche parole, tout en restant sous la longueur maximale de la chaîne.

J'ai essayé d'autres exemples ci-dessus et elles n'ont pas produit les résultats escomptés.
- Si la longueur de la chaîne est inférieure à la longueur maximale, cela couper tout jusqu'à ce que le dernier espace. Pour éviter cela, il faut mettre cela à l'intérieur d'un if déclaration: if (strlen($str) > 200) { ... }
- Simple et probablement beaucoup plus rapide que les autres solutions.
- Un problème, c'est qu'elle renvoie une chaîne vide si la chaîne ne contient pas d'espace.
- Peut être simplifiée: $WidgetText = substr($string, 0, strpos($string, ' ', 200));
InformationsquelleAutor Dave
36

La solution suivante est né lorsque j'ai remarqué un $pause paramètre de wordwrap fonction:

chaîne wordwrap ( string $str [, int $largeur = 75 [, string $break =
"\n" [, bool $taille = false ]]] )

Ici est la solution:
```
/**
 * Truncates the given string at the specified length.
 *
 * @param string $str The input string.
 * @param int $width The number of chars at which the string will be truncated.
 * @return string
 */
function truncate($str, $width) {
    return strtok(wordwrap($str, $width, "...\n"), "\n");
}
```
Exemple #1.
```
print truncate("This is very long string with many chars.", 25);
```
L'exemple ci-dessus va afficher:
```
This is very long string...
```
Exemple #2.
```
print truncate("This is short string.", 25);
```
L'exemple ci-dessus va afficher:
```
This is short string.
```
- cela ne fonctionne pas si la chaîne a déjà un caractère de nouvelle ligne (par exemple, si vous essayez d'extraire un description d'un billet de blog)
- Pouvez toujours pré-traiter avec preg_replace('/\s+/', ' ', $description) à remplacer tous les espaces par un espace simple 😉
InformationsquelleAutor Sergiy Sokolenko
9

Garder à l'esprit chaque fois que vous êtes fractionnement par "mot" n'importe où que certaines langues, comme le Chinois et le Japonais n'utilisez pas un caractère d'espace pour fractionner les mots. Aussi, un utilisateur malveillant pourrait simplement saisir du texte sans espaces, ou à l'aide de certains Unicode qui se ressemblent à l'espace standard, auquel cas, toute solution que vous utilisez peut finir par afficher l'intégralité du texte, de toute façon. Un moyen de contourner cela peut être de vérifier la longueur de la corde après le fractionnement sur des espaces comme d'habitude, puis, si la chaîne est encore au-dessus une anomalie de la limite peut-être à 225 caractères dans ce cas - aller de l'avant et de le diviser dumbly à cette limite.

Encore une mise en garde avec ce genre de choses quand il s'agit de caractères non-ASCII; les chaînes contenant peut être interprété par PHP standard strlen() comme étant plus qu'ils ne le sont, parce qu'un seul caractère peut prendre deux ou plus de deux octets au lieu d'un seul. Si vous venez d'utiliser la strlen()/substr() des fonctions split chaînes, vous pouvez diviser une chaîne au milieu d'un personnage! En cas de doute, mb_strlen()/mb_substr() sont un peu plus infaillible.

InformationsquelleAutor Garrett Albright
8

Utilisation strpos et substr:
```
<?php

$longString = "I have a code snippet written in PHP that pulls a block of text.";
$truncated = substr($longString,0,strpos($longString,' ',30));

echo $truncated;
```
Cela vous donnera une chaîne tronquée à la première place au bout de 30 caractères.
- Salut, si la longueur de la chaîne sans les espaces seront moins puis 30, puis il sera de retour d'erreur. et Voici le résultat sera de 31 premiers caractères de pas 30..
InformationsquelleAutor Lucas Oman

Voici ma fonction sur la base d' @Cd-Homme approche.

function shorten($string, $width) {
  if(strlen($string) > $width) {
    $string = wordwrap($string, $width);
    $string = substr($string, 0, strpos($string, "\n"));
  }

  return $string;
}

InformationsquelleAutor Camsoft

Ici, vous allez:

function neat_trim($str, $n, $delim='…') {
   $len = strlen($str);
   if ($len > $n) {
       preg_match('/(.{' . $n . '}.*?)\b/', $str, $matches);
       return rtrim($matches[1]) . $delim;
   }
   else {
       return $str;
   }
}

InformationsquelleAutor UnkwnTech

3

Il est surprenant de constater combien il est difficile est de trouver la solution parfaite à ce problème. Je n'ai pas encore trouvé la réponse sur cette page qui n'a pas manqué, au moins dans certaines situations (en particulier si la chaîne contient des retours à la ligne ou des tabulations, ou si le mot rupture n'est rien d'autre qu'un espace, ou si la chaîne a de l'UTF-8 caractères multioctets).

Voici une solution simple qui fonctionne dans tous les cas. Il y avait le même genre de réponses ici, mais le "s" modificateur est important si vous voulez qu'il fonctionne avec multi-ligne d'entrée, et le "u" modificateur rend évaluer correctement l'UTF-8, les caractères multioctets.
```
function wholeWordTruncate($s, $characterCount) 
{
    if (preg_match("/^.{1,$characterCount}\b/su", $s, $match)) return $match[0];
    return $s;
}
```
Un possible cas de bord avec ce... si la chaîne n'a pas d'espaces dans la première tranche de characterCount caractères, il sera de retour l'ensemble de la chaîne. Si vous préférez, il force un saut à $characterCount même si elle n'est pas une limite de mot, vous pouvez utiliser ceci:
```
function wholeWordTruncate($s, $characterCount) 
{
    if (preg_match("/^.{1,$characterCount}\b/su", $s, $match)) return $match[0];
    return mb_substr($return, 0, $characterCount);
}
```
Une dernière option, si vous voulez l'avoir ajouter des points de suspension s'il tronque la chaîne...
```
function wholeWordTruncate($s, $characterCount, $addEllipsis = ' …') 
{
    $return = $s;
    if (preg_match("/^.{1,$characterCount}\b/su", $s, $match)) 
        $return = $match[0];
    else
        $return = mb_substr($return, 0, $characterCount);
    if (strlen($s) > strlen($return)) $return .= $addEllipsis;
    return $return;
}
```
InformationsquelleAutor orrd
3
```
$shorttext = preg_replace('/^([\s\S]{1,200})[\s]+?[\s\S]+/', '$1', $fulltext);
```
Description:
- ^ - début de début de chaîne
- ([\s\S]{1,200}) - get de 1 à 200 de n'importe quel caractère
- [\s]+? - de ne pas inclure d'espaces à la fin d'un court texte afin que nous puissions éviter word ... au lieu de word...
- [\s\S]+ - match, tous les autres contenus
Tests:
1. regex101.com ajoutons à or quelques autres r
2. regex101.com orrrr exactement 200 caractères.
3. regex101.com après la cinquième r orrrrr exclus.
Profiter.
- je ne comprends pas la documentation de PHP. je sais que le $1 est un "remplacement", mais dans ce contexte précis, qu'est ce qu'il parle?? une variable vide?
- référencement pour correspondre à l'intérieur des crochets ([\s\S]{1,200}). $2 sera de référencement de deux deuxième paire de crochets s'il y a un motif.
InformationsquelleAutor hlcs
2

Je voudrais utiliser la fonction preg_match pour ce faire, comme ce que vous voulez est assez simple expression.
```
$matches = array();
$result = preg_match("/^(.{1,199})[\s]/i", $text, $matches);
```
L'expression signifie "correspond à un sous-chaîne commençant à partir du début de la longueur de 1-200 qui se termine par un espace." Le résultat est dans $result, et le match est dans $matches. Qui prend soin de votre question initiale, qui est spécifiquement se terminant sur tout l'espace. Si vous souhaitez faire la fin sur les retours à la ligne, modifier l'expression régulière à:
```
$result = preg_match("/^(.{1,199})[\n]/i", $text, $matches);
```
InformationsquelleAutor Justin Poliey

Ok, donc j'ai eu une autre version de cette base sur les réponses ci-dessus, mais en prenant plus de choses en compte(utf-8, \n et &nbsp ; ), également une ligne de décapage de la shortcodes wordpress commenté si utilisé avec wp.

function neatest_trim($content, $chars) 
  if (strlen($content) > $chars) 
  {
    $content = str_replace('&nbsp;', ' ', $content);
    $content = str_replace("\n", '', $content);
    //use with wordpress    
    //$content = strip_tags(strip_shortcodes(trim($content)));
    $content = strip_tags(trim($content));
    $content = preg_replace('/\s+?(\S+)?$/', '', mb_substr($content, 0, $chars));

    $content = trim($content) . '...';
    return $content;
  }

InformationsquelleAutor Yo-L

2

C'est un petit correctif pour mattmac réponse:
```
preg_replace('/\s+?(\S+)?$/', '', substr($string . ' ', 0, 201));
```
La seule différence est d'ajouter un espace à la fin de $chaine. Cela garantit que le dernier mot n'est pas coupé comme par ReX357 commentaire.

Je n'ai pas assez de points de rep pour ajouter un commentaire.

InformationsquelleAutor tanc
2
```
/*
Cut the string without breaking any words, UTF-8 aware 
* param string $str The text string to split
* param integer $start The start position, defaults to 0
* param integer $words The number of words to extract, defaults to 15
*/
function wordCutString($str, $start = 0, $words = 15 ) {
    $arr = preg_split("/[\s]+/",  $str, $words+1);
    $arr = array_slice($arr, $start, $words);
    return join(' ', $arr);
}
```
Utilisation:
```
$input = 'Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna liqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.';
echo wordCutString($input, 0, 10); 
```
Ce sera de sortie 10 premiers mots.

La preg_split fonction est utilisée pour découper une chaîne en sous-chaînes. Les limites le long de laquelle la chaîne est à diviser, sont spécifiés à l'aide d'une des expressions régulières modèle.

preg_split fonction prend 4 paramètres, mais seulement les 3 premiers sont pertinents pour nous maintenant.

Premier Paramètre De Modèle
Le premier paramètre est les expressions régulières motif le long de laquelle la chaîne est fendue. Dans notre cas, nous voulons diviser la chaîne à travers les limites des mots. Par conséquent, nous utilisons une classe de caractères prédéfinis \s ce qui correspond à des caractères blancs (espace, tabulation, retour chariot et saut de ligne.

Deuxième Paramètre D'Entrée De La Chaîne
Le deuxième paramètre est le long de la chaîne de texte que nous voulons partager.

Troisième Paramètre De Limite De
Le troisième paramètre indique le nombre de sous-chaînes qui doivent être renvoyés. Si vous définissez la limite de n, preg_split retournera un tableau de n éléments. La première n-1 éléments contiennent les sous-chaînes. La dernière (n th) élément contiendra le reste de la chaîne.

InformationsquelleAutor bodi0

Basé sur @Justin Poliey de la regex:

//Trim very long text to 120 characters. Add an ellipsis if the text is trimmed.
if(strlen($very_long_text) > 120) {
  $matches = array();
  preg_match("/^(.{1,120})[\s]/i", $very_long_text, $matches);
  $trimmed_text = $matches[0]. '...';
}

InformationsquelleAutor amateur barista

J'ai une fonction qui fait à peu près ce que vous voulez, si vous allez faire quelques modifications, il fit exactement:

<?php
function stripByWords($string,$length,$delimiter = '<br>') {
    $words_array = explode(" ",$string);
    $strlen = 0;
    $return = '';
    foreach($words_array as $word) {
        $strlen += mb_strlen($word,'utf8');
        $return .= $word." ";
        if($strlen >= $length) {
            $strlen = 0;
            $return .= $delimiter;
        }
    }
    return $return;
}
?>

InformationsquelleAutor Rikudou_Sennin

C'est la façon dont je l'ai fait:

$string = "I appreciate your service & idea to provide the branded toys at a fair rent price. This is really a wonderful to watch the kid not just playing with variety of toys but learning faster compare to the other kids who are not using the BooksandBeyond service. We wish you all the best";

print_r(substr($string, 0, strpos(wordwrap($string, 250), "\n")));

InformationsquelleAutor Shashank Saxena

Je sais que c'est vieux, mais...

function _truncate($str, $limit) {
    if(strlen($str) < $limit)
        return $str;
    $uid = uniqid();
    return array_shift(explode($uid, wordwrap($str, $limit, $uid)));
}

InformationsquelleAutor gosukiwi

J'ai utilisé ce avant

<?php
    $your_desired_width = 200;
    $string = $var->content;
    if (strlen($string) > $your_desired_width) {
        $string = wordwrap($string, $your_desired_width);
        $string = substr($string, 0, strpos($string, "\n")) . " More...";
    }
    echo $string;
?>

InformationsquelleAutor Yousef Altaf

J'ai créer une fonction de plus en plus semblables à substr, et en utilisant l'idée de @Dave.

function substr_full_word($str, $start, $end){
    $pos_ini = ($start == 0) ? $start : stripos(substr($str, $start, $end), ' ') + $start;
    if(strlen($str) > $end){ $pos_end = strrpos(substr($str, 0, ($end + 1)), ' '); } //IF STRING SIZE IS LESSER THAN END
    if(empty($pos_end)){ $pos_end = $end; } //FALLBACK
    return substr($str, $pos_ini, $pos_end);
}

Ps.: Toute la longueur de coupe peut être moins de substr.

InformationsquelleAutor evandro777

Ajouté if/ELSEIF déclarations du code de Dave et AmalMurali pour la manipulation de chaînes de caractères sans espaces

if ((strpos($string, ' ') !== false) && (strlen($string) > 200)) { 
    $WidgetText = substr($string, 0, strrpos(substr($string, 0, 200), ' ')); 
} 
elseif (strlen($string) > 200) {
    $WidgetText = substr($string, 0, 200);
}

InformationsquelleAutor jdorenbush

Je trouve que cela fonctionne:

fonction abbreviate_string_to_whole_word($string,$max_length,$buffer) {

if (strlen($string)>$max_length) {
    $string_cropped=substr($string,0,$max_length-$buffer);
    $last_space=strrpos($string_cropped, " ");
    if ($last_space>0) {
        $string_cropped=substr($string_cropped,0,$last_space);
    }
    $abbreviated_string=$string_cropped."&nbsp;...";
}
else {
    $abbreviated_string=$string;
}

return $abbreviated_string;

}

La mémoire tampon vous permet d'ajuster la longueur de la chaîne de retour.

InformationsquelleAutor Mat Barnett

0

Utiliser ceci:

le code suivant supprime ','. Si vous avez n'importe quelle autre caractère ou une sous-chaîne de caractères, vous pouvez utiliser à la place de ','
```
substr($string, 0, strrpos(substr($string, 0, $comparingLength), ','))
```
//si vous avez une autre chaîne de compte pour
```
substr($string, 0, strrpos(substr($string, 0, $comparingLength-strlen($currentString)), ','))
```
InformationsquelleAutor Mahbub Alam
-1

Ici, vous pouvez essayer ce
```
substr( $str, 0, strpos($str, ' ', 200) ); 
```
- Cette solution a été déjà mentionné dans d'autres réponses. Le problème c'est qu'il échoue si la chaîne est de moins de 200 caractères, ou si elle ne contient pas d'espaces. Il ne limite pas la chaîne à 200 caractères, au lieu de cela, il rompt la chaîne à l'espace après 200 caractères, ce qui n'est généralement pas ce que vous voulez.
InformationsquelleAutor Abhijeet kumar sharma
-1

Je crois que c'est la meilleure façon de le faire:
```
$lines = explode('♦♣♠',wordwrap($string, $length, '♦♣♠'));
$newstring = $lines[0] . ' &bull; &bull; &bull;';
```
Je suis en utilisant les caractères spéciaux de scinder le texte et de le couper.

InformationsquelleAutor Namida

-2

Peut-être cela va aider quelqu'un:

<?php

    $string = "Your line of text";
    $spl = preg_match("/([, \.\d\-''\"\"_()]*\w+[, \.\d\-''\"\"_()]*){50}/", $string, $matches);
    if (isset($matches[0])) {
        $matches[0] .= "...";
        echo "<br />" . $matches[0];
    } else {
        echo "<br />" . $string;
    }

?>

InformationsquelleAutor slash3b

Vous devez vous connecter pour publier un commentaire.

EDIT :