Supprimer/remplacer les balises html dans bash
J'ai un fichier avec les lignes qui contiennent:
<li><b> Some Text:</b> More Text </li>
Je veux supprimer les balises html et remplacer le </b>
balise avec un tableau de bord de sorte qu'il devient comme ça:
Du Texte:- Plus De Texte
Je suis en train d'utiliser sed cependant je ne trouve pas la bonne regex combinaison.
OriginalL'auteur thisiscrazy4 | 2012-10-04
Vous devez vous connecter pour publier un commentaire.
Si vous strictement voulez retirer toutes les balises HTML, mais en même temps seulement remplacer le
</b>
balise avec un-
, vous pouvez enchaîner deux simplessed
commandes avec un tuyau:Cela va passer tout le contenu du fichier pour la première
sed
commande de poignée de remplacement de la</b>
à un-
. Ensuite, la sortie de ce que sera transmise à unsed
qui va remplacer toutes les balises HTML avec des chaînes vides. Le résultat final sera enregistré dans le nouveau fichierstripped_file
.À l'aide d'une méthode similaire à la réponse de @Steve, vous pouvez également utiliser
sed
's-e
option de la chaîne d'expressions dans un seul (et non les canalisations de commande); en ajoutant-i
, vous pouvez également lire les et remplacez le contenu de votre fichier original, sans la nécessité pourcat
, ou un nouveau fichier:Cela va faire le remplacement tout comme les enchaînés-commande ci-dessus, mais cette fois, il va remplacer directement le contenu du fichier d'entrée. Pour enregistrer un nouveau fichier au lieu de cela, retirez le
-i
et ajouter> stripped_file
à la fin (ou autre nom de fichier que vous choisissez).variable="x"
type de texte. Utilisés/' variable="'[^\"]*\"//
de faire correspondre le nom de la balise et tout entre les deux guillemets doubles. (ignorer le funky mix unique et s'est échappé des guillemets)Recommander
cat | sed | sed
et ensuite de mentionner au passage que, en fait, tous vous avez besoin estsed
semble pas justifié. "Vous pouvez également n'être" pas à recommander l'approche erronée.OriginalL'auteur newfurniturey
Un chemin à l'aide
GNU sed
:Exemple:
Résultat:
OriginalL'auteur Steve