La taille de la fenêtre vs longueur de données pour la FFT

Je suis en train de faire une rapide analyse spectrale sur le streaming audio de la saisie des données sur les voyelles (quelque chose comme JLip-sync). À l'aide de PyAudio à capter la voix de données en petits morceaux (1024) pour de courtes durées (de 0,0625 sec.). Utilisation de numpy.fft pour l'analyse, et de se débarrasser de fuite à l'aide de numpy.fenêtre de hanning. Je suis à l'aide de 4096*4 comme le taux d'échantillonnage (pas 44100 ou 22050, et ouvert à la discussion ainsi; 4096*4 étant le plus proche de 22050).

Considérant les fréquences je suis intéressé (allant de 300 Hz à 3000 hz) comment l'idéal de la taille de la fenêtre sera calculée en utilisant les données de longueur et min/max fréquences, je suis à la recherche d'?

Grâce.

Kadir