La ruche - regexp_replace fonction de plusieurs chaînes de caractères

Je suis l'aide de la ruche 0.13! Je veux trouver de multiples jetons comme le "hip hop" et "musique rock" dans mes données et de les remplacer par "hip-hop" et "rockmusic" - essentiellement les remplacer sans espace blanc. J'ai utilisé le regexp_replace fonction dans la ruche. Voici ma requête et il fonctionne très bien pour les 2 exemples ci-dessus.

drop table vp_hiphop;
create table vp_hiphop as
select userid, ntext,
       regexp_replace(regexp_replace(ntext, 'hip hop', 'hiphop'), 'rock music', 'rockmusic') as ntext1
from  vp_nlp_protext_males
;

Mais j'ai 100 bigrams/ngrams et que vous voulez être en mesure de le faire remplacer efficacement où je viens de supprimer l'espace blanc. Je peux en correspondance du modèle de la phrase de hip - hop et de la musique rock, mais de la remplacer, je veux simplement couper les espaces blancs. Ci-dessous est ce que j'ai essayé. J'ai aussi essayé d'utiliser la garniture avec regexp_replace mais il veut que le troisième argument dans le regexp_replace fonction.

drop table vp_hiphop;
create table vp_hiphop as
select  userid, ntext,
        regexp_replace(ntext, '(hip hop)|(rock music)') as ntext1
from  vp_nlp_protext_males
;

OriginalL'auteur VP10 | 2015-02-03