Comment puis-je correctement préfixe d'un mot avec un “a” et “un”?

J'ai un .NET application où, étant donné un nom, je veux qu'elle correctement préfixe de ce mot avec "un" ou "une". Comment dois-je procéder?

Avant que vous pensez que la réponse est tout simplement de vérifier si la première lettre est une voyelle, d'envisager des phrases comme:

une erreur honnête
une voiture d'occasion

Vous avez également à considérer les abréviations qui peuvent également conduire à certaines confusions sur tha "a" ou "an" comme "de la LNH", qui sort également une lettre de son commence par une voyelle mais pas si l'abréviation peut être prononcé comme un mot comme "un périphérique NAS" ou "un événement NASCAR"
Aussi garder à l'esprit que l'utilisation de l'un ou l'une peut varier en fonction de la prononciation dans la variété de l'anglais parlé. Les Britanniques et les Américains de la prononciation de l'herbe en est un exemple.
En effet, mon exemple préféré de cette (trop ringard) est "SQL". Certaines personnes disent que les lettres "SQL", certaines personnes le prononcer comme le mot "suite". Chacun reçoit un autre "un" ou "une". par exemple, c'est "une suite à la déclaration de" versets "c'est un S-Q-L instruction"
Encore plus difficile est que les opinions même varier dans le même dialecte de l'anglais! Ainsi, par exemple, officiel (royaume-UNI) anglais nous dit "un hôtel" est la structure correcte, mais la plupart des gens serait d'utiliser "un hôtel" dans la conversation courante. Si vous écrivez un, il serait très utile pour le reste d'entre nous!
Ah... le "aspirant H". Je me souviens de ma première rencontre avec elle. Une deuxième année d'études sociales livre intitulé "Historique de la Société", un livre sur la ville coloniale de Williamsburg.
Il semble donc qu'il n'y a pas une seule "bonne" façon, et la règle dépend de votre accent. Il suffit donc de choisir un simple hurestic, et de réclamer tout bizarreries sont en raison du programme de l'accent.
comment vérifier l'orthographe de gérer cela? Gardent-ils de grandes listes d'exceptions?

InformationsquelleAutor ryeguy | 2009-08-17

c#linguistics nlp

134
1. Télécharger Wikipédia
2. Décompressez-le et écrivez un filtre rapide programme qui crache seul texte de l'article (le téléchargement est généralement au format XML, avec non-article métadonnées trop).
3. Trouver toutes les occurrences de a(n).... et de faire un indice sur le mot suivant et l'ensemble de ses préfixes (vous pouvez utiliser un simple suffixtrie pour cela). Cela devrait être sensible à la casse, et vous aurez besoin d'un maximum de mots de longueur 15 lettres?
4. (facultatif) Jeter tous ces préfixes qui se produisent à moins de 5 fois ou de, où "a" et "un" atteint moins de la majorité des 2/3 (ou certains autres threshholds - tweak ici). De préférence, gardez le vide préfixe pour éviter coin-cas.
5. Vous pouvez optimiser votre préfixe de la base de données en supprimant tous ces préfixes dont le parent partage la même "un" ou "une" annotation.
6. Au moment de déterminer si l'utilisation de "Un" ou "UNE" trouver le plus long préfixe correspondant, et de suivre son exemple. Si vous n'avez pas jeter le vide préfixe à l'étape 4, puis il y aura toujours être un préfixe correspondant (à savoir le vide préfixe), sinon vous pourriez avoir besoin d'un cas particulier pour un tout-non correspondance de chaîne (par exemple entrée doit être très rare).
Vous ne pourrez probablement pas obtenir beaucoup mieux que cela - et il va certainement battre plus la règle pour les systèmes.

Edit: j'ai mis en œuvre dans ce JS/C#. Vous pouvez essayez-la dans votre navigateur, ou le télécharger à la petite, réutilisable javascript mise en œuvre qu'il utilise. L' .NET de la mise en œuvre est forfait AvsAn sur nuget. Les implémentations sont triviales, il devrait donc être facile de port pour toute autre langue si nécessaire.

Il s'avère que les "règles" sont un peu plus complexes que ce que je pensais:
- c'est un résultat imprévu mais c'est un l'unanimité
- c'est un honnête décision mais un chèvrefeuille arbuste
- Symboles: C'est un numéro 0800, ou un ∞ de l'origan.
- Acronymes: C'est un scientifique de la NASA, mais un analyste de la NSA; un FIAT voiture, mais un FAA politique.
...qui va juste pour souligner qu'une règle de base du système serait difficile de construire!
- Et si un nom est absent de cette sortie, vous pouvez certainement revenir à la règle simple du moteur.
- Ne pouvait utiliser que comme un grand corpus pour une approche Bayésienne.
- Le Corpus of Contemporary American English (americancorpus.org) est probablement un meilleur choix que Wikipédia pour les tests individuels, si ce n'est pas dans un formulaire que vous pouvez télécharger.
- Étant donné que la Wikipédia télécharger décompresse à (actuellement) 2.8 Téraoctets, ce serait génial si quelqu'un qui utilise cette méthode post les données publiques, afin que le processus n'a pas à être répété beaucoup.
- Vous n'avez pas besoin d'une règle basée sur le moteur comme une solution de repli - vous gratuit avec la "plus longue correspondance de préfixe" approche.
- Cette réponse n'était pas tout à fait sérieux, mais j'ai fait quelque chose comme ça, et wikipedia .fichier xml avec raw wikimarkup est juste de l'ordre de 40 GO (le plus récent est toujours un peu plus grand), pas de 2,8 TB - tout en un-fichier - ne pas télécharger l'élargissement .version html ou des images, c'est peut-être la version 2.8 de la TUBERCULOSE? En tout cas, c'est effectivement tout à fait possible d'analyser, aussi longtemps que vous êtes de ne pas pointilleux sur le balisage.
- Est Wikipedia la meilleure source pour être en s'appuyant sur?
- C'est l'un des plus grands facilement disponibles, jusqu'à ce jour, le langage naturel de l'ensemble de données que je pouvais penser. Cependant, tout autre source de données est bien aussi, bien sûr - l'algorithme ne dépend pas de wikipédia, après tout. Vous pouvez essayer la mise en ligne à l'adresse home.nerbonne.org/A-vs-An ou mon blog
- Toute assez grand corpus des grammaticalement correct en anglais va faire. Cette solution est un cas très particulier de ce que la PNL gens appeler répartition de la sémantique.
- J'ai été au-delà de impressionné par cette solution. Honnêtement, je pensais que ce serait beaucoup plus simple que téléchargement de Wikipédia dans son ensemble. Bien fait, monsieur. +1
InformationsquelleAutor Eamon Nerbonne
15

Vous avez besoin d'utiliser une liste d'exceptions. Je ne pense pas que toutes les exceptions sont bien définis, car il dépend parfois de l'accent de la personne en disant le mot.

Une façon stupide est de demander à Google pour les deux possibilités (à l'aide de l'un de la recherche Api) et l'utilisation les plus populaires:
- http://www.google.co.uk/search?q=%22a+europe%22 - 841,000 hits
- http://www.google.co.uk/search?q=%22an+europe%22 - 25 000 résultats
Ou:
- http://www.google.co.uk/search?q=%22a+honnête%22 - 797,000 hits
- http://www.google.co.uk/search?q=%22an+honnête%22 - 8,220,000 hits
Donc une "europe" et "honnête" sont les versions correctes.
- C'est qu'en réalité l'utilisation autorisée ou est-ce pour demander à être interdit? Régulière une telle utilisation est certainement désapprouvé l'IIRC.
- Point intéressant. Que faire si la demande a conservé un dossier de tous les mots qu'il a déjà googlé, elle n'a donc qu'à google une fois pour chaque nouveau mot qu'il rencontre? Serait-ce encore un doute de l'utilisation de Google?
- Outre les évidentes difficultés techniques (utilisation d'un moteur de recherche de sortie de manière automatisée, comme ce n'est pas autorisé et sera bloqué assez rapidement), cela ne résout pas le problème dans le bon sens -, au pire, elle permet de dupliquer des courants de mauvaise utilisation de la syntaxe.
- Au pire? Il y a de très fortes chances que la duplication de "commun " abus", c'est exactement ce qu'est un langage naturel système devrait s'efforcer d'atteindre. Voir David Foster Wallace, son essai "de l'Autorité et de l'Usage Américain", dans de Considérer le Homard. Il y a de mieux corpus à utiliser que Google, mais c'est une autre question.
- Pourriez-vous demander googlefight, plutôt que de google?
- Cela ne fonctionne pas pour de nombreux exemples d'un "hôtel" et "un hôtel" dit "un hôtel" a plus de succès, lors de l'utilisation de l'une est correcte. De même pour "une héroïne" et "une héroïne" - un a plus de coups, mais une est correcte.
- "un hôtel" et "une héroïne" semblent tous deux le droit de me. Je suppose que vous venez d'un peu cockney accent perspective. Des accents différents à dire qu'il n'y a pas de bonne réponse à certains de ces mots.
- "un hôtel" est particulier, à l'utilisation, à un stade très haut statut RP utilisateurs (et un peu toujours le faire) ne se prononce pas aitch au début de certains mots d'origine étrangère: vous pouvez toujours l'entendre dans "hommage" qui se prononce de deux façons. L'utilisation de "un" en anglais a toujours été de faire avec la suite de son, "un hommage"/"un hommage" est correct en fonction de ce que vous dites. Mais il a grandi d'un mode à utiliser (et même - à Dieu ne plaise - à-dire) "un hôtel" et "historique" et un petit ensemble de ces mots, bien que le jeu n'est pas bien définie. Tenir à "l'hôtel".
InformationsquelleAutor rjmunro
14

Si vous pourriez trouver une source de la parole de l'orthographe de word prononciations, comme:
```
"honest":"on-ist"
"horrible":"hawr-uh-buhl, hor-"
```
Vous pourriez vous baser votre décision sur le premier caractère de la orthographié de la prononciation de la chaîne.
Pour la performance, vous pourriez peut-être utiliser une telle recherche de pré-générer exception des ensembles et l'utilisation de ces plus petits de recherche en cours d'exécution à la place.

Modifiées afin d'ajouter:

!!! - Je pense que vous pouvez l'utiliser pour générer vos exceptions:
http://www.speech.cs.cmu.edu/cgi-bin/cmudict

Tout ne sera pas dans le dictionnaire, bien sûr - ce qui signifie pas chaque exception serait le vent dans vos exceptions ensembles - mais dans ce cas, vous pourriez juste valeur par défaut à un pour les voyelles/a pour les consonnes ou utilisez une autre heuristique avec la meilleure cote.

(À la recherche par le biais de la CMU dictionnaire, j'ai été heureux de voir qu'il comprend les noms propres de pays et de quelques autres lieux - de sorte qu'il sera hande exemples comme "un ukrainien", "USA Today", un "Oural-inspiré de la peinture".)

D'édition une fois de plus à ajouter: La CMU dictionnaire ne contient pas d'acronymes les plus courants, et vous avez à vous soucier de ceux commençant par s,f,l,m,n,u,x et. Mais il y a beaucoup de acronyme listes, comme dans le cas de Wikipédia, qui vous pouvez utiliser pour ajouter des exceptions.
- Ne peut pas aider moi-même, mais le hawr-uh-buhl m'a toujours fait rire.
InformationsquelleAutor Anon
9

Vous avez mis en œuvre manuellement et ajouter les exceptions que vous voulez comme par exemple si la première lettre est " H "et suivi par un" O " comme honnête, heure ... et à l'inverse, comme l'europe, l'université, utilisé ...
- Mais des mots comme "trémie", va briser cette règle...
- ouais un vrai homme. Je suppose que je me trompais dans que. Il n'a pas de règle à tous les
InformationsquelleAutor Ahmad Farid
8

Depuis "un" et "une" est déterminé par les règles phonétiques et non pas de l'orthographe des conventions, je serais probablement faire comme ceci:
1. Si la première lettre du mot est une consonne -> 'a'
2. Si la première lettre du mot est une voyelle-> 'une'
3. Garder une liste d'exceptions (cœur, x-ray, maison) comme rjumnro dit.
InformationsquelleAutor Patrik Svensson
4

Vous avez besoin de regarder les règles grammaticales pour les articles indéfinis (il y a seulement deux articles indéfinis en anglais grammaire - "un" et"). Vous ne pouvez pas accepter ces sons corrects, mais les règles de La grammaire anglaise sont très claires:

"Les mots un et un sont de durée indéterminée
articles. Nous utilisons le indéfinie
article un devant les mots qui commencent
avec une voyelle (a, e, i, o, u) et
l'article indéfini un, avant les mots
qui commencent par une consonne sonore (tous les
d'autres lettres)."

Remarque cela signifie une voyelle son, et pas une voyelle lettre. Par exemple, les mots commençant par un silence "h", comme "l'honneur" ou "héritier" sont traités comme des voyelles une sont donc procédé à "un" - par exemple, "C'est un honneur de vous rencontrer". Les mots commençant par une consonne sonore avec le préfixe a - et c'est pourquoi vous dire une "voiture d'occasion" plutôt qu'une "voiture d'occasion" parce que "utilisé" a une "yoose" son plutôt qu'un "ouf" de son.

Donc, en tant que programmeur, ce sont les règles à suivre. Vous avez juste besoin d'un moyen de déterminer ce qu'est le son d'un mot commence avec, plutôt que la lettre. J'ai vu des exemples, tels que celui-ci en PHP par Jaimie Sirovich :
```
function aOrAn($next_word) 
{ 
    $_an = array('hour', 'honest', 'heir', 'heirloom'); 
    $_a = array('use', 'useless', 'user'); 
    $_vowels = array('a','e','i','o','u'); 

    $_endings = array('ly', 'ness', 'less', 'lessly', 'ing', 'ally', 'ially'); 
    $_endings_regex = implode('|', $_endings); 

    $tmp = preg_match('#(.*?)(-| |$)#', $next_word, $captures); 
    $the_word = trim($captures[1]); 
    //$the_word = Format::trimString(Utils::pregGet('#(.*?)(-| |$)#', $next_word, 1)); 

    $_an_regex = implode('|', $_an); 
    if (preg_match("#($_an_regex)($_endings_regex)#i", $the_word)) { 
        return 'an'; 
    } 

    $_a_regex = implode('|', $_a); 
    if (preg_match("#($_a_regex)($_endings_regex)#i", $the_word)) { 
        return 'a'; 
    } 

    if (in_array(strtolower($the_word{0}), $_vowels)) { 
        return 'an';     
    } 

    return 'a'; 
}
```
Il est probablement plus facile de créer la règle et puis créer une liste d'exceptions et de les utiliser. Je n'imagine pas il n'y aura que de nombreux.

InformationsquelleAutor Dan Diplo
3

@Nathan Long:
Le téléchargement de wikipédia est effectivement pas une mauvaise idée. Toutes les images, vidéos et autres médias n'est pas nécessaire.

J'ai écrit un (de merde) programme en php et javascript(!) pour lire l'intégralité du suédois wikipédia (ou au moins tous les aricles qui pourrait être atteint à partir de l'article sur les mathématiques, qui a été le début de mon araignée.)

J'ai recueilli tous les mots et les liens internes dans une base de données, et également gardé la trace de la fréquence de chaque mot. J'ai maintenant l'utiliser comme une base de données de mots pour les différentes tâches:
* Recherche de tous les mots qui peuvent être créés à partir d'un ensemble donné de lettres (y compris les génériques)
* De créer un simple fichier de syntaxe pour le suédois (tous les mots qui ne sont pas dans la base de données sont considérés comme incorrects).

Oh, et le téléchargement de l'intégralité wiki a pris environ une semaine, à l'aide de mon ordinateur portable exécutant la plupart du temps, avec 10Mbit connexion.

Lorsque vous y êtes, journal de tous les événements qui sont incompatibles avec la langue anglaise et de voir si certains d'entre eux sont des erreurs. Allez résoudre 'em et de donner quelque chose en retour à la communauté.

InformationsquelleAutor Per Alexandersson
3

Homme, je me rends compte que c'est probablement une constante argument, mais je pense qu'il peut être réglé plus facile que d'utiliser ad hoc des règles de grammaire à partir de Wikipedia, qui dériverait vernaculaire de la grammaire, au mieux.

La meilleure solution, paraît-il, est d'avoir l'utilisation d'un ou de déclencher un phonème à base de concordance du mot suivant, avec certains phonèmes toujours associée à la "une" et le reste appartenant à la "une".

L'Université de Carnegie Mellon a un excellent outil en ligne pour ce genre de vérifications - http://www.speech.cs.cmu.edu/cgi-bin/cmudict - et à 125k mots avec la mise en correspondance 39 phonèmes. Branchement d'un mot en fournit l'ensemble du phonémique ensemble, dont seule la première est importante.

Si le mot n'apparaît pas dans le dictionnaire, comme la "NSA" et c'est tout en majuscule, alors le système peut supposer que le mot est un Acronyme et utilisez la première lettre de déterminer quel article indéfini à utiliser basée sur les mêmes règles d'origine définies.
- En termes de ressources, de l'économie, c'est la meilleure réponse, et je ne vois pas pourquoi ce serait d'effectuer tout pire que de très loin la plus forte intensité de données et des méthodes proposées.
InformationsquelleAutor user2241013
2

Noter qu'il existe des différences entre les Américains et les Britanniques dialectes, comme la Grammaire Fille l'a souligné dans son épisode Un Contre Un.

Une complication, c'est quand les mots sont prononcés différemment en anglais Britannique et Américain. Par exemple, le mot pour un certain type de plante est prononcé “erb” en anglais Américain et “herbe” en anglais Britannique. Dans les rares cas où c'est un problème, utilisez le formulaire qui sera prévu dans votre pays ou par la majorité de vos lecteurs.

InformationsquelleAutor Jan Aagaard
2

Prendre un coup d'oeil à Perl Lingua::FR::Infléchir. Voir sub _indef_article dans le code source.
- Les exceptions sont situés dans des flexions.t. Il me semble que la liste est plutôt incomplète.
InformationsquelleAutor Sinan Ünür
2

J'ai porté une fonction de Python (à l'origine du CPAN paquet Lingua-FR-Infléchir) qui détermine correctement des sons de voyelles en C# et affiché comme une réponse à la question Déterminer par programme si pour décrire un objet avec un ou une?. Vous pouvez voir l'extrait de code ici.

InformationsquelleAutor Stuart
1

Pourriez-vous obtenir un dictionnaire d'anglais qui stocke les mots écrits dans notre alphabet, et la International Phoenetic Alphabet?

Puis utilisez le phoenetics de comprendre le début sons de la parole, et donc de savoir si “un” ou “une” est-il approprié?

Pas sûr que ce serait plus facile que d' (ou autant de plaisir que de) la statistique de Wikipédia approche.

InformationsquelleAutor Paul D. Waite
0

Je voudrais utiliser une règle de base de l'algorithme de couvrir autant que je le pouvais, puis utiliser une liste d'exceptions. Si vous vouliez obtenir la fantaisie, vous pourriez essayer de déterminer certaines des nouvelles "règles" à partir de votre liste d'exception.

InformationsquelleAutor A. L. Flanagan
0

Je ressemble à un ensemble d'heuristiques. Il doit être un peu plus compliqué et de répondre à certaines des choses que je n'ai jamais eu une bonne réponse pour, par exemple, comment traitez-vous les abréviations ("RPM" ou "RPM"? J'ai toujours pensé que ce dernier a plus de sens).

Une recherche rapide sur les résultats en matière linguistique, les bibliothèques de parler de la façon de gérer les anglais singulier préfixe, mais vous pouvez probablement trouver quelque chose si vous creusez dip assez. Et si non, vous pouvez toujours écrire votre propre inflexion de la bibliothèque et d'acquérir une renommée mondiale 🙂 .
- Abréviations comme le RPM ne sont pas un problème. Comme vous dites qu'ils peuvent être traités de toute façon. Donc la solution est évidente: les ignorer.
- Je ne serais pas d'accord parce que les causes incompatible préfixant. Juste l'ignorer serait la cause de "RPM" et d'un "UGC", qui est manifestement erronée.
InformationsquelleAutor Guss
0

Je ne suppose pas que vous pouvez simplement remplir quelques chaudière plaque des trucs comme "un/une", comme une étape fourre-tout. Sinon vous allez vous retrouver avec des erreurs dans les hypothèses comme tous les mots, avec le 'h' passer par 'o' obtenir " un "au lieu de" a "comme" à la maison " - (un à la maison?). Fondamentalement, vous finirez par y compris la logique de la langue anglaise ou de temps en temps trouver de rares cas que vous ridiculiser.

InformationsquelleAutor
0

Vérifier si un mot commence par une voyelle ou une consonne. Un "u" est généralement une consonne et une voyelle ("yu"), donc appartient à la consonne du groupe pour vos besoins.

La lettre "h" correspond à un gottal arrêter (une consonne) en français et dans les mots français utilisés en anglais. Vous pouvez faire une liste de ceux-là (en fait, y compris "l'honneur", "honneur", et "heure" pourrait être suffisant) et de les compter comme commençant par les voyelles (depuis l'anglais ne reconnaît pas une glottale).

Également compter "de l'ue" comme une consonne etc.

Il n'est pas trop difficile.

InformationsquelleAutor Andrew J. Brehm
0

choix de l'une ou de l'une dépend de la façon dont le mot est prononcé. En regardant le mot que vous ne pouvez pas nécessairement dire sa prononciation correcte par exemple, un Jargon ou l'abréviation etc.
L'une des façons dont nous pouvons disposer d'un dictionnaire, avec le soutien de phonèmes et d'utiliser les phonèmes de l'information associée avec le mot de déterminer si un "a" ou un "un" doit être utilisé.

InformationsquelleAutor Rohin
0

Je ne peux pas être certain qu'il a suffisamment d'informations pour se différencier "un" et "une", mais Princeton WordNet base de données existe dans le but précisément de semblable sortes de tâches, donc je pense qu'il est probable que les données sont là. Il a quelques dizaines de milliers de mots et des centaines de milliers de relations entre les mots (IIRC; je ne peux pas trouver les statistiques actuelles sur le site). Lui donner un look. Il est librement téléchargeable.

InformationsquelleAutor rmeador
0

Comment? Comment savoir quand? Obtenir le nom de l'article ci-joint. Demandez un formulaire spécifique.

Demander le nom de l'article. Beaucoup de BOUE code de stocker des objets comme des informations composée de:
- un ou plusieurs mots-clés
- un court formulaire
- une forme longue
Le mot-clé le formulaire peut être "courte épée rouillée". La forme courte sera "une épée". La version longue sera la "rouille épée courte".

Êtes-vous d'écrire un "un contre un" Web service? Prenez du recul et regardez si vous pouvez vous attaquer à cette fuite en amont. Vous pouvez construire un barrage, mais à moins que vous arrêter de couler, il fera au cours de la suite.

Déterminer le degré d'importance de tout cela, et comme d'autres l'ont suggéré, aller pour "rapide mais brut", ou "cher mais solide".

InformationsquelleAutor maxwellb
0

La règle est très simple. Si le mot suivant commence par une voyelle, puis utiliser "un", si elle commence par une consonne puis utilisez "a". Le plus difficile, c'est que notre école de classification des voyelles et des consonnes qui ne fonctionne pas. Le " h "dans l '"honneur" est une voyelle, mais le " h "dans un" hôpital " est une consonne.

Pire encore, certains mots comme "honnête" commencent par une voyelle ou une consonne en fonction de qui est les dire. Pire encore, certains mots changent selon les mots autour d'eux pour certains intervenants.

Le problème n'est limité que par la façon dont beaucoup de temps et d'effort que vous voulez mettre. Vous pouvez écrire quelque chose dans un couple en utilisant "aeiou", comme les voyelles dans un couple de minutes, ou vous pouvez passe des mois à faire l'analyse linguistique de votre public cible. Entre eux se trouvent un grand nombre d'heuristiques qui sera bon pour certains haut-parleurs et le mal pour les autres -, mais parce que les différents orateurs ont différentes décisions pour le même mot, il n'est tout simplement pas possible d'avoir raison tout le temps, peu importe comment vous le faites.

InformationsquelleAutor KayEss
0

L'idéal serait de trouver un endroit en ligne qui peuvent vous donner les réponses, de façon dynamique les interroger et de mettre en cache les réponses. Vous pouvez amorcer le système avec quelques centaines de mots pour commencer.

(Je ne sais pas d'une source en ligne, mais je ne serais pas surpris s'il y en a un.)

InformationsquelleAutor Hot Licks
0

Donc, une solution raisonnable est possible sans avoir à télécharger l'ensemble de l'internet. Voici ce que j'ai fait:

Je me suis souvenu que Google a publié leurs données brutes pour Google Books N-Gramme fréquences ici. J'ai donc téléchargé le 2 grammes de fichiers pour "a_" et "un". C'est à propos de 26 concerts si je me souviens bien. Depuis que j'ai rédigé une liste de chaînes de caractères où ils ont été massivement précédée par la face de l'article que vous attendez (si nous devions attendre les voyelles prendre un "un"). Que la liste finale des mots, j'ai pu stocker en moins de 7 kilo-octets.

InformationsquelleAutor IngisKahn
-2

Vous utilisez "a" à chaque fois que le mot suivant n'est pas une voyelle? Et vous utilisez "une" chaque fois qu'il y est une voyelle?

Avec cela dit, ne pourriez-vous pas tout simplement faire une expression régulière du type "\s[a,e,i,o,u].*"? Et puis le remplacer par un"?"
- Non, parce que la règle est d'environ voyelle son, pas de voyelle lettres. "Utilisateur" commence par une voyelle, mais la prononciation n'est pas.
InformationsquelleAutor Daniel

Vous devez vous connecter pour publier un commentaire.