Quels sont les caractères doivent être échappés en HTML 5?

HTML 4 états jolie quels sont les personnages devrait être échappé:

Quatre entité de caractère références méritent une mention spéciale car ils
sont fréquemment utilisés pour échapper les caractères spéciaux:

  • "&lt;" représente le < signe.
  • "&gt;" représente le > signe.
  • "&amp;" représente le & signe.
  • "&quot; représente la " marque.

Les auteurs souhaitant
pour mettre le "<" caractère dans le texte devraient utiliser "&lt;" (ASCII décimal 60)
pour éviter la confusion possible avec le début d'un tag (balise de début de l'
ouvrir délimiteur). De même, les auteurs devraient utiliser "&gt;" (ASCII décimal
62) dans le texte au lieu de ">" pour éviter les problèmes avec les anciens agents d'utilisateur
mal perçoivent cela comme la fin d'une balise (tag fermer
séparateur) lorsqu'il apparaît dans la cité des valeurs d'attribut.

Les auteurs devraient utiliser "&amp;" (ASCII décimal 38) au lieu de "&" pour éviter
la confusion avec le début d'un personnage de référence (entité
référence ouvert délimiteur). Les auteurs doivent également utiliser des "&amp;" dans
les valeurs d'attribut depuis références sont admis à l'intérieur CDATA
les valeurs d'attribut.

Certains auteurs utilisent le caractère de l'entité de référence "&quot;" pour coder
les instances de la double guillemet (") étant donné que le caractère peut être
utilisé pour délimiter les valeurs d'attribut.

Je suis surpris, je ne peux pas trouver quelque chose comme cela en HTML 5. Avec l'aide de grep le seul non-XML mentionner que j'ai pu trouver se présente comme une réserve pour le obsolète XMP élément:

De l'utilisation de pré et de code au lieu de cela, et d'échapper à la "<" et "&" caractères "&lt;" et "&amp;", respectivement.

Pourrait quelque peu le point de la source officielle sur cette question?

Les caractères doivent être échappés lors de l'ambigu. Donc, " en double-cité des attributs et des ' dans une seule cité attributs (évidemment ambigu), plus < dans le texte en dehors des attributs (seulement ambigu parfois, mais provoque toujours des erreurs de validation). <b>2 > 1</b> est valide HTML5. & est aussi une erreur lors de l'ambigu.
Merci, mais... je me sens encore tout cela fait sens, mais il n'est pas normatif de l'article le concernant. HTML n'est pas, après tout, très invitant pour le "sens" de l'orientation. (Dire, <p> pourrait sans ambiguïté fermer tous les <em> et <strong> balises de l'alinéa précédent, etc.) Pourquoi cette omission, tout en consacrant du temps à "moins que la première chose de l'élément est un commentaire". Il se sent comme une erreur majeure.
Je ne suis pas sûr de ce que cela a à voir avec s'échapper des règles, mais la correction automatique des balises non fermées à une sorte d'reconnaissable arbre a besoin d'exister pour des raisons historiques.
Je voulais dire avec mon exemple que je n'étais pas à la recherche pour des raisons convaincantes ou le sens commun, puisque le HTML (par exemple, à la différence de XML) un haut degré d'arbitraire. Au lieu de cela, j'étais à la recherche d'une source, qui vous aimablement fourni. Merci encore.

OriginalL'auteur ezequiel-garzon | 2014-09-01