Comment puis-je remplir une colonne de nombres aléatoires dans SQL? J'obtiens la même valeur dans chaque ligne

UPDATE CattleProds
SET SheepTherapy=(ROUND((RAND()* 10000),0))
WHERE SheepTherapy IS NULL

Si je puis faire un SELECT je vois que mon nombre aléatoire est identique dans chaque ligne. Toutes les idées sur la façon de générer des nombres aléatoires?

InformationsquelleAutor NibblyPig | 2011-02-15

sql-server

153

Au lieu de rand(), utilisez newid(), qui est recalculé pour chaque ligne du résultat. La méthode habituelle consiste à utiliser le modulo de la somme de contrôle. Notez que checksum(newid()) peut produire de -2 147 483 648 et provoquer de débordement d'entier sur abs(), donc nous avons besoin d'utiliser le modulo sur la somme de contrôle valeur de retour avant de le convertir à une valeur absolue.
```
UPDATE CattleProds
SET    SheepTherapy = abs(checksum(NewId()) % 10000)
WHERE  SheepTherapy IS NULL
```
Cela génère un nombre aléatoire entre 0 et 9999.
- Cette question/réponse peut également être utile: stackoverflow.com/a/9039661/47226
- Ce n'est pas de travail pour moi. La colonne doivent être de type INT? Erreur #1064 à chaque fois. Pour atteindre la folle pilules...
- C'est une chose de la beauté! Bien fait. L'amour c'. Un petit peu de lenteur, mais encore une grande.
InformationsquelleAutor Andomar
23

Si vous êtes sur un Serveur SQL server 2008, vous pouvez également utiliser
```
 CRYPT_GEN_RANDOM(2) % 10000
```
Qui semble un peu plus simple (il est également évaluée une fois par ligne comme newid est - illustré ci-dessous)
```
DECLARE @foo TABLE (col1 FLOAT)

INSERT INTO @foo SELECT 1 UNION SELECT 2

UPDATE @foo
SET col1 =  CRYPT_GEN_RANDOM(2) % 10000

SELECT *  FROM @foo
```
Retourne (2 aléatoire probablement différents numéros)
```
col1
----------------------
9693
8573
```
Ressasser la inexpliquée downvote la seule raison légitime, je pense que, parce que le nombre aléatoire généré est entre 0-65535 qui n'est pas divisible par 10 000 certains numéros seront légèrement sur-représentées. Un moyen de contourner ce serait l'envelopper dans un scalaire de l'UDF, qui jette un nombre de plus de 60 000 personnes et appelle récursivement pour obtenir un nouveau numéro.
```
CREATE FUNCTION dbo.RandomNumber()
RETURNS INT
AS
  BEGIN
      DECLARE @Result INT

      SET @Result = CRYPT_GEN_RANDOM(2)

      RETURN CASE
               WHEN @Result < 60000
                     OR @@NESTLEVEL = 32 THEN @Result % 10000
               ELSE dbo.RandomNumber()
             END
  END  
```
- Une raison en particulier? Peut-être que vous voulait frapper la flèche vers le haut cette réponse fonctionne très bien!
- Ce que tout le monde semble être en manque, c'est que cette méthode est beaucoup beaucoup BEAUCOUP mieux pour la performance. J'ai été à la recherche d'une alternative à la fonction NEWID() et c'est parfait, merci!
- Toute gamme désirée est facilement traitée. Par exemple ABS(CAST(CRYPT_GEN_RANDOM(8) BIGINT)%10001) donne un certain nombre de 0-10000 qui correspond à la plage de l'OP du code aurait généré s'il avait travaillé à la façon dont ils espéraient.
- Qui 'même' problème? La formule ne fait pas de générer de nouvelles valeurs par ligne (op problème résolu), et le résultat est au sein de la gamme, mais ils ne seront pas faussés parce qu'il y a 64 bits de semences et seulement 14 bits de résultat, donc tout le potentiel de l'inclinaison serait indétectable. Même si vous avez généré 10^15 résultats d'inclinaison vous pensez que vous êtes la détection serait encore à l'intérieur de la marge d'erreur. Ce qui signifie que vous auriez besoin de générer des 2^19 résultats pour prouver que l'inclinaison réellement existé.
InformationsquelleAutor Martin Smith
6

Pendant que je fais l'amour à l'aide de la somme de contrôle, je pense qu'une meilleure façon d'aller de l'est à l'aide de NEWID(), juste parce que vous n'avez pas à passer par un complexe de mathématiques pour générer des nombres simples .
```
ROUND( 1000 *RAND(convert(varbinary, newid())), 0)
```
Vous pouvez remplacer le 1000 avec n'importe quel numéro que vous souhaitez définir comme la limite, et vous pouvez toujours utiliser un signe plus pour créer une gamme, disons que vous voulez un nombre aléatoire entre 100 et 200, vous pouvez faire quelque chose comme :
```
100 + ROUND( 100 *RAND(convert(varbinary, newid())), 0)
```
De les mettre ensemble dans votre requête :
```
UPDATE CattleProds 
SET SheepTherapy= ROUND( 1000 *RAND(convert(varbinary, newid())), 0)
WHERE SheepTherapy IS NULL
```
InformationsquelleAutor Segev -CJ- Shmueli

J'ai testé 2 définir en fonction des méthodes de randomisation contre RAND() par la génération de 100,000,000 lignes avec chaque. Au niveau de la sortie est un flottant entre 0 et 1 pour imiter RAND(). La plupart du code est l'infrastructure de test donc je résume les algorithmes ici:

-- Try #1 used
(CAST(CRYPT_GEN_RANDOM(8) AS BIGINT)%500000000000000000+500000000000000000.0)/1000000000000000000 AS Val
-- Try #2 used
RAND(Checksum(NewId()))
-- and to have a baseline to compare output with I used
RAND() -- this required executing 100000000 separate insert statements

À l'aide de CRYPT_GEN_RANDOM était clairement le plus aléatoire, car il n'existe qu'un .000000001% de chance de voir même 1 en double lors de la cueillette 10^8 numéros à PARTIR d'un ensemble de 10^18 numéros. OIE nous ne devrions pas avoir vu tous les doublons et ce n'en avaient pas! Ce jeu de 44 secondes pour générer sur mon ordinateur portable.

Cnt     Pct
-----   ----
 1      100.000000  --No duplicates

D'Exécution de SQL Server Fois:
Le temps CPU = 134795 ms, temps écoulé = 39274 ms.

IF OBJECT_ID('tempdb..#T0') IS NOT NULL DROP TABLE #T0;
GO
WITH L0   AS (SELECT c FROM (VALUES (1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1)) AS D(c))  -- 2^4  
    ,L1   AS (SELECT 1 AS c FROM L0 AS A CROSS JOIN L0 AS B)    -- 2^8  
    ,L2   AS (SELECT 1 AS c FROM L1 AS A CROSS JOIN L1 AS B)    -- 2^16  
    ,L3   AS (SELECT 1 AS c FROM L2 AS A CROSS JOIN L2 AS B)    -- 2^32  
SELECT TOP 100000000 (CAST(CRYPT_GEN_RANDOM(8) AS BIGINT)%500000000000000000+500000000000000000.0)/1000000000000000000 AS Val
  INTO #T0
  FROM L3;

 WITH x AS (
     SELECT Val,COUNT(*) Cnt
      FROM #T0
     GROUP BY Val
)
SELECT x.Cnt,COUNT(*)/(SELECT COUNT(*)/100 FROM #T0) Pct
  FROM X
 GROUP BY x.Cnt;

À près de 15 ordres de grandeur moins de hasard, cette méthode n'était pas tout à fait deux fois plus rapide, en seulement 23 secondes pour générer 100 M des nombres.

Cnt  Pct
---- ----
1    95.450254    -- only 95% unique is absolutely horrible
2    02.222167    -- If this line were the only problem I'd say DON'T USE THIS!
3    00.034582
4    00.000409    -- 409 numbers appeared 4 times
5    00.000006    -- 6 numbers actually appeared 5 times

D'Exécution de SQL Server Fois:
Le temps CPU = 77156 ms, temps écoulé = 24613 ms.

IF OBJECT_ID('tempdb..#T1') IS NOT NULL DROP TABLE #T1;
GO
WITH L0   AS (SELECT c FROM (VALUES (1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1),(1)) AS D(c))  -- 2^4  
    ,L1   AS (SELECT 1 AS c FROM L0 AS A CROSS JOIN L0 AS B)    -- 2^8  
    ,L2   AS (SELECT 1 AS c FROM L1 AS A CROSS JOIN L1 AS B)    -- 2^16  
    ,L3   AS (SELECT 1 AS c FROM L2 AS A CROSS JOIN L2 AS B)    -- 2^32  
SELECT TOP 100000000 RAND(Checksum(NewId())) AS Val
  INTO #T1
  FROM L3;

WITH x AS (
    SELECT Val,COUNT(*) Cnt
     FROM #T1
    GROUP BY Val
)
SELECT x.Cnt,COUNT(*)*1.0/(SELECT COUNT(*)/100 FROM #T1) Pct
  FROM X
 GROUP BY x.Cnt;

RAND() seul est inutile pour la génération de la création de la base de référence pour comparer l'aléatoire a pris plus de 6 heures et a dû être redémarré plusieurs fois pour enfin obtenir le bon nombre de lignes de sortie. Il semble également que l'aléatoire laisse beaucoup à désirer bien que c'est mieux que d'utiliser de la somme de contrôle(newid()) afin de réamorcer chaque ligne.

Cnt  Pct
---- ----
1    99.768020
2    00.115840
3    00.000100  -- at least there were comparitively few values returned 3 times

En raison de la redémarre, le temps d'exécution n'a pas pu être capturé.

IF OBJECT_ID('tempdb..#T2') IS NOT NULL DROP TABLE #T2;
GO
CREATE TABLE #T2 (Val FLOAT);
GO
SET NOCOUNT ON;
GO
INSERT INTO #T2(Val) VALUES(RAND());
GO 100000000

WITH x AS (
    SELECT Val,COUNT(*) Cnt
     FROM #T2
    GROUP BY Val
)
SELECT x.Cnt,COUNT(*)*1.0/(SELECT COUNT(*)/100 FROM #T2) Pct
  FROM X
 GROUP BY x.Cnt;

P. S. Pensant que le redémarre auraient pu expliquer certains des doublons, j'ai rapidement testé à peu 3M lignes qui a pris près de 6-1/2 minutes. J'ai eu 2101 dup et 2 valeurs est apparu 3 fois (.07% et .000067% respectivement), indiquant redémarre sans doute joué un rôle, mais le hasard est encore loin de stellar.
Ayant remarqué une autre réponse, juste ensemencées avec newid converti vers le type varbinary alors, j'ai essayé aussi. Non seulement est-il pas plus rapide que l'utilisation de la somme de contrôle, mais une valeur apparaît 8 fois dans ce test. Pour être juste, il était encore 95.447319% unique qui est à peine pire que RAND(somme de contrôle(NewId()))'s 95.450254% dans mon test. Une deuxième exécution a abouti à un pire des cas, de 3 numéros 5 fois et 95.452929% distinctes pour YMMV même lors de l'essai de 100M lignes.

InformationsquelleAutor bielawski

-2

require_once('db/connect.php');

//rand(1000000 , 9999999);

$products_query = "SELECT id FROM products";
$products_result = mysqli_query($conn, $products_query);
$products_row = mysqli_fetch_array($products_result);
$ids_array = [];

do
{
    array_push($ids_array, $products_row['id']);
}
while($products_row = mysqli_fetch_array($products_result));

/*
echo '<pre>';
print_r($ids_array);
echo '</pre>';
*/
$row_counter = count($ids_array);

for ($i=0; $i < $row_counter; $i++)
{ 
    $current_row = $ids_array[$i];
    $rand = rand(1000000 , 9999999);
    mysqli_query($conn , "UPDATE products SET code='$rand' WHERE id='$current_row'");
}

peut-être pas correct et easylest façon, mais il fonctionne )))
Veuillez lire attentivement la question avant de commencer à répondre. Par la manière, l'envoi d'une requête de mise à JOUR pour chaque ligne séparément est une TRÈS, TRÈS MAUVAISE IDÉE quand on a de mise à JOUR, même un petit nombre de lignes.

InformationsquelleAutor Vaso Nadiradze

Vous devez vous connecter pour publier un commentaire.