Comment télécharger de 100 millions de lignes à partir d'Azure Table Storage RAPIDE

J'ai été chargé avec le téléchargement d'environ 100 millions de lignes de données à partir d'Azure Table Storage. L'important ici étant de vitesse.

Le processus que nous utilisons est le téléchargement de 10 000 lignes de Azure Table storage. Processus dans une instance locale de Sql Server. Pendant le traitement de l'lignes, il supprime les 100 lignes à la fois dans l'Azur du tableau. Ce processus est filetée pour avoir 8 threads de téléchargement de 10 000 lignes à la fois.

Le seul problème avec ceci est que, selon nos calculs. Il faudra environ 40 jours pour le télécharger et le processus de l'ordre de 100 millions de lignes que nous avons enregistrées. Quelqu'un sait-il un moyen plus rapide pour accomplir cette tâche?

Un côté de la question: Pendant le processus de téléchargement d'Azur renverra le code xml qui juste n'ont pas toutes les données. Il ne renvoie pas une erreur. Mais il envoie ceci:

<?xml version="1.0" encoding="utf-8" standalone="yes"?>
<feed xml:base="azure-url/" xmlns:d="http://schemas.microsoft.com/ado/2007/08/dataservices" xmlns:m="http://schemas.microsoft.com/ado/2007/08/dataservices/metadata" xmlns="http://www.w3.org/2005/Atom">
  <title type="text">CommandLogTable</title>
  <id>azure-url/CommandLogTable</id>
  <updated>2010-07-12T19:50:55Z</updated>
  <link  title="CommandLogTable" href="CommandLogTable" />
</feed>
0

Quelqu'un d'autre a ce problème et avez une solution pour elle?

La quantité de données par ligne? 400 octets, 400kb, meg?
Dans la plupart de chaque ligne est de 1k.
Je n'ai pas travaillé avec Azure, donc je suis le seul à essayer de dépanner à partir de SQL / réseau; cependant, je suis en train de lire à travers certains blogs, et ils sont tous disent la même chose - à l'aide de l'ATOME est très détaillé et inefficace pour les grands ensembles de données. Maintenant, je ne suis pas sûr de savoir comment il est difficile de changer cela; mais voici un exemple de vitesse / différences entre les données weblogs.asp.net/rgillen/archive/2009/08/20/...

OriginalL'auteur jWoose | 2010-07-12