Enregistrement aléatoire dans ActiveRecord

Je suis dans le besoin d'obtenir un enregistrement aléatoire à partir d'une table via ActiveRecord. J'ai suivi l'exemple de Jamis Buck à partir de 2006.

Cependant, j'ai aussi trouver un autre moyen via une recherche Google (ne peut pas d'un attribut avec un lien grâce à de nouvelles restrictions de l'utilisateur):

 rand_id = rand(Model.count)
 rand_record = Model.first(:conditions => ["id >= ?", rand_id])

Je suis curieux de voir comment d'autres ici l'ont fait ou si quelqu'un sait de quelle manière, ce serait plus efficace.

2 points qui pourraient aider à une réponse. 1. Comment uniformément distribués sont vos identifiants, sont-ils séquentielle? 2. Comment aléatoire t-il besoin d'être? Bon assez aléatoires, réel ou aléatoire?
Ils sont séquentiels id généré automatiquement par activerecord et il a juste à être assez bon.
Ensuite, votre solution proposée est proche de l'idéal 🙂 j'aimerais utiliser "SELECT MAX(id) from table_name" au lieu de COUNT(*) comme il traitera de lignes supprimées un peu mieux, sinon, le reste est très bien. En bref, si "suffisamment bonne" est ok, alors vous avez juste à avoir une méthode qui suppose une distribution proche de ce que vous avez réellement. Si c'est uniforme, et même, comme vous l'avez dit, simple rand fonctionne très bien.
Cela ne fonctionne pas lorsque vous avez supprimé des lignes.

InformationsquelleAutor jyunderwood | 2010-05-02

130

Je n'ai pas trouvé un moyen idéal de le faire sans avoir au moins deux requêtes.

Celui-ci utilise un numéro généré de façon aléatoire (jusqu'à l'enregistrement en cours de comptage) comme un décalage.
```
offset = rand(Model.count)

# Rails 4
rand_record = Model.offset(offset).first

# Rails 3
rand_record = Model.first(:offset => offset)
```
Pour être honnête, je viens d'utiliser ORDER BY RAND() ou ALÉATOIRE() (selon la base de données). Ce n'est pas un problème de performances si vous n'avez pas de problème de performances.
- Le code Model.find(:offset => offset).first va jeter erreur. Je pense que Model.first(:offset => offset) pourrait faire mieux.
- ouais, j'ai travaillé avec Rails 3 et continuer à se confondre à propos de la requête de formats entre les versions.
- Notez que l'utilisation de décalage est très lent avec un vaste ensemble de données, car il a réellement besoin d'analyse d'index (ou de l'analyse de la table, dans le cas index cluster est utilisé comme InnoDB). En d'autres termes, il est O(N) opérations, mais aussi "where id >= #{rand_id} ORDER BY id ASC LIMIT 1" est O(log N), ce qui est beaucoup plus rapide.
- Sachez que le décalage approche seulement donne un seul de façon aléatoire trouvé de point de données (le premier, tous les après sont toujours triés par id). Si vous avez besoin de plusieurs sélectionnés au hasard des enregistrements, vous devez utiliser cette méthode plusieurs fois, ou utiliser le hasard de l'ordre de la méthode fournie par votre base de données, c'est à dire Thing.order("RANDOM()").limit(100) pour 100 inscriptions choisies au hasard. (Sachez que c'est RANDOM() dans PostgreSQL et RAND() dans MySQL ... pas aussi portable que vous le désirez.)
- Méfiez-vous de la bordure cas lorsque Model.count == 1.
- Je préfère cette approche. Si vous utilisez Active Record pour commencer, ensuite vous pouvez ainsi garder la randomisation logique dans Ruby plutôt que d'utiliser une construction qui est à la base de données dépendantes.
- Ne fonctionne pas pour moi sur Rails 4. Utilisation Model.offset(offset).first.
- il n'est pas censé semaine si l'id est l'UUID de droit?, quelqu'un sait comment le faire avec l'uuid?
InformationsquelleAutor Toby Hede
188

Dans Rails 4 et 5, à l'aide de Postgresql ou SQLite, à l'aide de RANDOM():
```
Model.order('RANDOM()').first
```
Sans doute le même travail pour MySQL avec RAND()
```
Model.order('RAND()').first
```
Ce est environ 2,5 fois plus rapide que l'approche de la accepté de répondre à.

Mise en garde: C'est lent pour les grands ensembles de données avec des millions d'enregistrements, de sorte que vous voudrez peut-être ajouter un limit clause.
- "Random()" fonctionne également dans sqlite, donc, pour ceux d'entre nous encore en développement sur sqlite et en cours d'exécution postgres en production de votre solution fonctionne dans les deux environnements.
- J'ai créé un cas pour ce contre la accepté de répondre. Postgresql 9.4 l'approche de cette réponse est environ deux fois plus vite.
- Regarde comme il n'est pas recommandé sur mysql webtrenches.com/post.cfm/avoid-rand-in-mysql
- C'est la solution la plus rapide
- Attention! La solution a l'air soigné, mais est très lent pour les grandes tables, car il a besoin de trier l'ensemble de la table. Plus ici et ici
- "Non-attribut arguments seront interdits dans les Rails 6.0. Cette méthode ne doit pas être appelée par l'utilisateur avec les valeurs fournies, telles que les paramètres de la demande ou les attributs de modèle. Connu-des valeurs sûres peuvent être transmis par les enveloppant dans Arel.sql()."
InformationsquelleAutor Mohamad
73

Votre exemple de code va commencer à se comporter de façon inexacte une fois que les dossiers sont supprimés (il va favoriser injustement les articles avec le plus faible ids)

Vous êtes probablement mieux d'utiliser l'aléatoire des méthodes à l'intérieur de votre base de données. Celles-ci varient selon la DB que vous utilisez, mais :commande => "RAND()" fonctionne pour mysql et :commande => "RANDOM()" fonctionne pour postgres
```
Model.first(:order => "RANDOM()") # postgres example
```
- ORDER BY RAND() de MySQL finit horrible exécution des données augmente. C'est difficile à maintenir (selon les exigences de temps), même à partir de milliers de lignes.
- Michael apporte un excellent point (ce qui est vrai pour d'autres DBs en tant que bien). Généralement, la sélection aléatoire des lignes à partir des tables de grande taille n'est pas quelque chose que vous voulez faire dans une dynamique d'action. La mise en cache est votre ami. Repenser ce que vous voulez accomplir peut-être pas une mauvaise idée non plus.
- La commande RAND() de mysql sur une table, avec environ un million de lignes est slooooooooooooooooooooow.
- Ne fonctionne plus. Utilisation Model.order("RANDOM()").first à la place.
- Lent et base de données spécifique. ActiveRecord est censé fonctionner de manière transparente entre les bases de données de sorte que vous ne devriez pas utiliser cette méthode.
- MySQL et .order("RAND()") exige "l'Aide temporaire; à l'Aide de filesort".
- Sur postgres: utilisation TABLESAMPLE. Dans un agnostique façon, le meilleur peut-être de créer une colonne de table random_bucket que vous remplissez avec un nombre aléatoire dans une plage de, disons, 0..999, puis lors de l'extraction de N % de données à partir de la table de vous choisir au hasard N% du nombre bteween 0..999, et correspondre à votre random_bucket colonne à l'encontre de ces nombres choisis au hasard. Cette habitude peut utiliser un index.
InformationsquelleAutor semanticart
29

Analyse comparative de ces deux méthodes sur MySQL 5.1.49, Ruby 1.9.2p180 sur les produits de la table avec +5 milliers d'enregistrements:
```
def random1
  rand_id = rand(Product.count)
  rand_record = Product.first(:conditions => [ "id >= ?", rand_id])
end

def random2
  if (c = Product.count) != 0
    Product.find(:first, :offset =>rand(c))
  end
end

n = 10
Benchmark.bm(7) do |x|
  x.report("next id:") { n.times {|i| random1 } }
  x.report("offset:")  { n.times {|i| random2 } }
end


             user     system      total        real
next id:  0.040000   0.000000   0.040000 (  0.225149)
offset :  0.020000   0.000000   0.020000 ( 35.234383)
```
Décalage dans MySQL semble être beaucoup plus lent.

MODIFIER
J'ai aussi essayé
```
Product.first(:order => "RAND()")
```
Mais j'ai dû le tuer après environ 60 secondes. MySQL a été "la Copie de tmp table sur le disque". Qui ne va pas au travail.
- Pour ceux qui recherchent plus des tests de combien de temps un véritable approche aléatoire prend: j'ai essayé Thing.order("RANDOM()").first sur une table avec 250k entrées - la requête a terminé en vertu d'une demi-seconde. (PostgreSQL 9.0, REE 1.8.7, 2 x 2,66 GHz cœurs) Qui est assez rapide pour moi, depuis que je suis en train de faire un "nettoyage".
- Ruby méthode rand retourne un de moins que le nombre spécifié de sorte que vous aurez envie rand_id = rand(Product.count) + 1 ou vous n'aurez jamais le dernier enregistrement.
- Note random1 ne fonctionnera pas si vous jamais supprimer une ligne dans la table. (Le comte sera de moins que le max id et vous ne serez jamais en mesure de sélectionner les lignes à haute id).
- À l'aide de random2 peut être améliorée par une #order à l'aide d'une colonne indexée.
InformationsquelleAutor dkam
17

Il n'a pas à être difficile.
```
ids = Model.pluck(:id)
random_model = Model.find(ids.sample)
```
pluck retourne un tableau de tous les id de la table. Le sample méthode sur le tableau, renvoie un id aléatoire à partir de la matrice.

Cela devrait bien fonctionner avec la même probabilité de sélection et de soutien pour les tables avec des lignes supprimées. Vous pouvez même mélanger avec contraintes.
```
User.where(favorite_day: "Friday").pluck(:id)
```
Et ainsi choisir aléatoirement utilisateur qui aime les vendredis plutôt que n'importe quel utilisateur.
- C'est propre et fonctionne pour une petite table ou un temps d'utilisation, il suffit de noter qu'il ne sera pas à l'échelle. Sur 3M de table, la pince à épiler Id prend environ 15 secondes pour moi sur MariaDB.
- C'est un bon point. Avez-vous trouvé une solution alternative qui est plus rapide, tout en conservant les mêmes qualités?
- N'est pas la accepté de compenser la solution de maintenir les mêmes qualités?
- Non, il ne prend pas en charge les conditions et n'ont pas la même probabilité de sélection des tableaux avec des enregistrements supprimés.
- Si vous définissez les conditions sur le comte, je ne comprends pas pourquoi vous ne pouvez pas avoir ces?
- Venez pour penser à elle, si vous appliquez les contraintes lorsque les deux comptage et de la sélection avec un décalage, la technique devrait fonctionner. J'imaginais seulement de l'appliquer sur le comte.
- Son possible, mais de toute évidence de la réponse, je n'acceptent que si elle vient avec un gros avertissement. Comme déjà mentionné, il ne fonctionne que tant que votre table ne contient que peu de dossiers, sur une légèrement plus grande échelle, cela fonctionne très très mal! Donc, juste ne pas l'utiliser pour obtenir des enregistrements aléatoires.
InformationsquelleAutor Niels B.
13

J'ai fait un rails 3 gem pour le gérer:

https://github.com/spilliton/randumb

Vous permettent de faire des trucs comme ça:
```
Model.where(:column => "value").random(10)
```
- Dans la documentation de ce joyau, ils expliquent "randumb simplement des petits clous supplémentaires ORDER BY RANDOM() (ou RAND() pour mysql) à votre requête." – donc, les commentaires sur les mauvaises performances mentionné dans les commentaires pour la réponse par @semanticart s'appliquent également lors de l'utilisation de ce joyau. Mais au moins, c'est DB indépendant.
InformationsquelleAutor spilliton
10

Il n'est pas conseillé que vous utilisez cette solution, mais si pour une raison quelconque vous vraiment voulez sélectionner au hasard un record alors que seulement faire une requête de base de données, vous pouvez utiliser le sample méthode de la Ruby classe Array, ce qui vous permet de sélectionner au hasard un élément d'un tableau.
```
Model.all.sample
```
Cette méthode ne nécessite qu'requête de base de données, mais c'est nettement plus lent que les autres alternatives comme Model.offset(rand(Model.count)).first qui exigent deux requêtes de base de données, si ce dernier est toujours préféré.
- Ne pas le faire. Jamais.
- Si vous avez 100k lignes dans votre base de données, l'ensemble de ces devrait être chargé dans la mémoire.
- Bien sûr, il n'est pas recommandé pour la production en temps réel le code, mais j'aime bien cette solution, il est très clair à utiliser pour des situations particulières, comme le semis la base de données avec des fausses valeurs.
- S'il vous plaît - ne jamais dire jamais. C'est une excellente solution pour le développement en temps de débogage si la table est petite. (Et si vous êtes à la prise d'échantillons, le débogage est très probablement le cas d'utilisation).
- Im en utilisant les travaux de semis et est bon pour moi. En outre, le Modèle.tous les.de l'échantillon(n) marche aussi 🙂
- D'accord avec @mahemoff, vous pouvez avoir un grand complexe de la table et vous voulez un échantillon de résultats, donc appeler quelque chose comme Toto.où("json_col -> 'foo' ->> 'bar' ILIKE ?", "%baz%").de l'échantillon(5) vous permettra d'inspecter vos résultats.
- Je suis à l'aide de Rails avec une petite série de luminaires, et parce que c'est simple, je préfère utiliser cette méthode dans des cas de test. Je n'aime pas l'optimisation prématurée.
- Je n'aime pas cette solution, mais vous devez être prudent avec elle. Si vous avez comme une immense table, et si vous avez besoin seulement d'un échantillon aléatoire, je serais probablement prendre cette logique et ajouter Model.last(100).sample ou quelque chose avec l'idée de minceur dossiers.
InformationsquelleAutor Ryan Atallah
8

- Je utiliser ce si souvent à partir de la console j'étends ActiveRecord dans un initialiseur - Rails 4 exemple:
```
class ActiveRecord::Base
  def self.random
    self.limit(1).offset(rand(self.count)).first
  end
end
```
Je peux alors appel Foo.random de ramener un enregistrement aléatoire.
- avez-vous besoin d' limit(1)? ActiveRecord#first devrait être assez intelligents pour le faire.
InformationsquelleAutor Knotty66

Une requête dans Postgres:

User.order('RANDOM()').limit(3).to_sql # Postgres example
=> "SELECT "users".* FROM "users" ORDER BY RANDOM() LIMIT 3"

L'aide d'un décalage, deux requêtes:

offset = rand(User.count) # returns an integer between 0 and (User.count - 1)
Model.offset(offset).limit(1)

Pas besoin de -1, rand compte num - 1
Merci, changé :+1:

InformationsquelleAutor Thomas Klemm

Lecture de l'ensemble de ces ne m'a pas donné beaucoup de confiance sur lequel de ces serait le mieux dans mon cas en particulier avec des Rails 5 et MySQL/Maria 5.5. Donc, j'ai testé quelques réponses sur ~ 65000 dossiers, et de disposer des deux la vente à emporter:

RAND() avec un limit est un gagnant clair.
Ne pas utiliser pluck + sample.

def random1
  Model.find(rand((Model.last.id + 1)))
end

def random2
  Model.order("RAND()").limit(1)
end

def random3
  Model.pluck(:id).sample
end

n = 100
Benchmark.bm(7) do |x|
  x.report("find:")    { n.times {|i| random1 } }
  x.report("order:")   { n.times {|i| random2 } }
  x.report("pluck:")   { n.times {|i| random3 } }
end

              user     system      total        real
find:     0.090000   0.000000   0.090000 (  0.127585)
order:    0.000000   0.000000   0.000000 (  0.002095)
pluck:    6.150000   0.000000   6.150000 (  8.292074)

Cette réponse synthétise, valide et met à jour Mohamed répondre, ainsi que Nami WANG commentaire sur le même et Florian Pilz commentaire de la accepté de répondre - veuillez envoyer un maximum de voix pour eux!

InformationsquelleAutor Sam

3

Vous pouvez utiliser le Array méthode sample, la méthode sample retourne un objet aléatoire à partir d'un tableau, pour l'utiliser il vous suffit de exec dans un simple ActiveRecord requête qui retourne une collection, par exemple:
```
User.all.sample
```
sera de retour à quelque chose comme ceci:
```
#<User id: 25, name: "John Doe", email: "[email protected]", created_at: "2018-04-16 19:31:12", updated_at: "2018-04-16 19:31:12">
```
- Je ne recommanderais pas de travail avec les méthodes de tableau lors de l'utilisation de l'AR. De cette manière prend presque 8 fois le temps order('rand()').limit(1) signifie "le même" travail (avec ~10K enregistrements).
InformationsquelleAutor trejo08

Si vous avez besoin de sélectionner certains des résultats aléatoires dans la portée:

scope :male_names, -> { where(sex: 'm') }
number_of_results = 10

rand = Names.male_names.pluck(:id).sample(number_of_results)
Names.where(id: rand)

InformationsquelleAutor Yuri Karpovich

2

Recommandons vivement ce petit bijou pour les enregistrements aléatoires, qui est spécialement conçu pour la table avec beaucoup de lignes de données:

https://github.com/haopingfan/quick_random_records

Toutes les autres réponses de mal fonctionner avec de grandes bases de données, à l'exception de ce bijou:
1. quick_random_records seul coût 4.6ms totalement.
1. la User.order('RAND()').limit(10) coût 733.0ms.
1. la accepté de répondre à offset approche coût 245.4ms totalement.
1. la User.all.sample(10) approche coût 573.4ms.
Note: Ma table n'a de 120 000 utilisateurs. Le plus de disques que vous avez, le plus énorme que la différence de performances.

InformationsquelleAutor Derek Fan
1

La méthode Ruby pour les choisissant au hasard un élément d'une liste est sample. Voulant créer un efficace sample pour ActiveRecord, et sur la base des réponses précédentes, j'ai utilisé:
```
module ActiveRecord
  class Base
    def self.sample
      offset(rand(size)).first
    end
  end
end
```
J'ai mis cela dans lib/ext/sample.rb et puis la charger avec cette config/initializers/monkey_patches.rb:
```
Dir[Rails.root.join('lib/ext/*.rb')].each { |file| require file }
```
Ce sera l'une requête si la taille du modèle est déjà dans le cache et deux sinon.

InformationsquelleAutor Dan Kohn
1

Rails 4.2 et Oracle:

Pour oracle, vous pouvez définir un champ d'application sur votre Modèle comme suit:
```
scope :random_order, -> {order('DBMS_RANDOM.RANDOM')}
```
ou
```
scope :random_order, -> {order('DBMS_RANDOM.VALUE')}
```
Et puis pour un exemple de l'appeler comme ceci:
```
Model.random_order.take(10)
```
ou
```
Model.random_order.limit(5)
```
bien sûr, vous pouvez également placer une commande sans portée comme ceci:
```
Model.all.order('DBMS_RANDOM.RANDOM') # or DBMS_RANDOM.VALUE respectively
```
- Vous pouvez faire cela avec postgres avec order('random()' et MySQL avec order('rand()') ainsi. C'est certainement la meilleure réponse.
InformationsquelleAutor mahatmanich
1

Pour base de données MySQL essayer: Modèle.commande("RAND()").première
- Cela ne fonctionne pas sur mysql.. vous devriez incloude au moins ce moteur DB est cela suppose de travailler avec
- Désolé, il n'y a de faute de frappe. Fixe maintenant. Devrait fonctionner mysql (uniquement)
InformationsquelleAutor Vadim Eremeev
1

Si vous utilisez PostgreSQL 9.5+, vous pouvez profiter de TABLESAMPLE pour sélectionner un enregistrement aléatoire.

Les deux par défaut les méthodes d'échantillonnage (SYSTEM et BERNOULLI) exiger que vous spécifiez le nombre de lignes à retourner en pourcentage du nombre total de lignes dans la table.
```
-- Fetch 10% of the rows in the customers table.
SELECT * FROM customers TABLESAMPLE BERNOULLI(10);
```
Cela nécessite de connaître le nombre d'enregistrements dans la table pour sélectionner le pourcentage approprié, qui peut ne pas être facile à trouver rapidement. Heureusement, il y a le tsm_system_rows module qui vous permet de spécifier le nombre de lignes à retourner directement.
```
CREATE EXTENSION tsm_system_rows;

-- Fetch a single row from the customers table.
SELECT * FROM customers TABLESAMPLE SYSTEM_ROWS(1);
```
Pour utiliser cette dans ActiveRecord, d'abord activer l'extension à l'intérieur d'une migration:
```
class EnableTsmSystemRowsExtension < ActiveRecord::Migration[5.0]
  def change
    enable_extension "tsm_system_rows"
  end
end
```
Ensuite modifier le from de la clause de la requête:
```
customer = Customer.from("customers TABLESAMPLE SYSTEM_ROWS(1)").first
```
Je ne sais pas si le SYSTEM_ROWS de la méthode d'échantillonnage sera entièrement aléatoire, ou si elle retourne la première ligne d'une page au hasard.

La plupart de ces informations ont été prises à partir d'un 2ndQuadrant billet de blog écrit par Gulcin Yildirim.

InformationsquelleAutor Adam Sheehan
1

Après avoir vu tant de réponses, j'ai décidé de comparer tous sur mon PostgreSQL(9.6.3) de la base de données. J'utilise une petite table de 100 000 et de s'en débarrasser le Modèle.commande("RANDOM()").en premier, car il était déjà deux ordres de grandeur plus lent.

L'aide d'une table avec de 2 500 000 entrées avec 10 colonnes les mains vers le bas le gagnant a été l'arracher d'une méthode de près de 8 fois plus rapide que le runner up(offset. J'ai seulement couru ce sur un serveur local, de sorte que le nombre peut être gonflé mais sa plus grande que l'arracher méthode est ce que je vais utiliser. Il est également intéressant de noter que cela pourrait poser des problèmes, c'est vous arracher plus de 1 résultat à la fois, parce que chacune de celles-ci sera unique aka moins aléatoire.

Arracher gagne 100 fois sur mon de 25 000 000 de lignes de la table
Edit: en fait ce temps comprend le cueillir dans la boucle si je la sors elle il fonctionne à peu près aussi rapide que simple itération sur l'id. Cependant, tout cela prend une bonne quantité de mémoire vive.
```
RandomModel                 user     system      total        real
Model.find_by(id: i)       0.050000   0.010000   0.060000 (  0.059878)
Model.offset(rand(offset)) 0.030000   0.000000   0.030000 ( 55.282410)
Model.find(ids.sample)     6.450000   0.050000   6.500000 (  7.902458)
```
Voici les données de l'exécution de 2000 fois sur mon de 100 000 de lignes de table de la règle de manière aléatoire et
```
RandomModel       user     system      total        real
find_by:iterate  0.010000   0.000000   0.010000 (  0.006973)
offset           0.000000   0.000000   0.000000 (  0.132614)
"RANDOM()"       0.000000   0.000000   0.000000 ( 24.645371)
pluck            0.110000   0.020000   0.130000 (  0.175932)
```
InformationsquelleAutor Mendoza
0

Je suis tout nouveau à RoR, mais j'ai eu que cela fonctionne pour moi:
```
 def random
    @cards = Card.all.sort_by { rand }
 end
```
Il est venu à partir de:

Comment au hasard de tri (scramble) un tableau en Ruby?
- La mauvaise chose, c'est qu'il va charger toutes les cartes de la base de données. Il est plus efficace de le faire à l'intérieur de la base de données.
- Vous pouvez également shuffle tableaux avec array.shuffle. De toute façon, méfiez-vous, comme Card.all charge tous les dossiers de carte en mémoire, ce qui devient de plus en plus inefficace, plus les objets dont nous parlons.
InformationsquelleAutor Aaron Pennington
0

Ce faire:
```
rand_record = Model.find(Model.pluck(:id).sample)
```
Pour moi, c'est bien clair

InformationsquelleAutor poramo

J'essaie ce de Sam exemple sur mon Application à l'aide de rails 4.2.8 de Référence( j'ai mis 1..Catégorie.le comte de hasard, parce que si le hasard prend un 0, il produira une erreur(ActiveRecord::RecordNotFound: impossible de trouver de la Catégorie avec 'id'=0)) et de la mine:

 def random1
2.4.1 :071?>   Category.find(rand(1..Category.count))
2.4.1 :072?>   end
=> :random1
2.4.1 :073 > def random2
2.4.1 :074?>    Category.offset(rand(1..Category.count))
2.4.1 :075?>   end
=> :random2
2.4.1 :076 > def random3
2.4.1 :077?>   Category.offset(rand(1..Category.count)).limit(rand(1..3))
2.4.1 :078?>   end
=> :random3
2.4.1 :079 > def random4
2.4.1 :080?>    Category.pluck(rand(1..Category.count))
2.4.1 :081?>
2.4.1 :082 >     end
=> :random4
2.4.1 :083 > n = 100
=> 100
2.4.1 :084 > Benchmark.bm(7) do |x|
2.4.1 :085 >     x.report("find") { n.times {|i| random1 } }
2.4.1 :086?>   x.report("offset") { n.times {|i| random2 } }
2.4.1 :087?>   x.report("offset_limit") { n.times {|i| random3 } }
2.4.1 :088?>   x.report("pluck") { n.times {|i| random4 } }
2.4.1 :089?>   end
user      system      total     real
find            0.070000   0.010000   0.080000 (0.118553)
offset          0.040000   0.010000   0.050000 (0.059276)
offset_limit    0.050000   0.000000   0.050000 (0.060849)
pluck           0.070000   0.020000   0.090000 (0.099065)

InformationsquelleAutor rld

0

.order('RANDOM()').limit(limit) l'air soigné, mais qui est lent pour les grandes tables, car il a besoin de récupérer et trier toutes les lignes, même si limit est 1 (en interne dans la base de données, mais pas dans les Rails). Je ne suis pas sûr à propos de MySQL, mais ce qui se passe dans Postgres. Plus d'explications dans ici et ici.

Une solution pour les grandes tables est .from("products TABLESAMPLE SYSTEM(0.5)") où 0.5 signifie 0.5%. Cependant, je trouve cette solution est encore lent si vous avez WHERE conditions qui filtrent beaucoup de lignes. Je suppose que c'est parce que TABLESAMPLE SYSTEM(0.5) extraire toutes les lignes avant de WHERE conditions s'appliquent.

Une autre solution pour les grandes tables (mais pas très aléatoire) est:
```
products_scope.limit(sample_size).sample(limit)
```
où sample_size peut être 100 (mais pas trop grand sinon c'est lent et consomme beaucoup de mémoire), et limit peut être 1. Notez que même si c'est rapide, mais il n'est pas vraiment aléatoire, c'est de l'aléatoire dans sample_size dossiers seulement.

PS: résultats des tests dans les réponses ci-dessus ne sont pas fiables (au moins dans Postgres) parce que certaines requêtes DB course à la 2ème temps peut être considérablement plus rapide que la course à la 1ère fois, grâce à DB cache. Et malheureusement, il n'existe pas de moyen facile de désactiver le cache dans Postgres pour faire de ces points de référence fiables.

InformationsquelleAutor Linh Dam
0

Très vieille question, mais avec :
```
rand_record = Model.all.shuffle
```
Vous avez un Tableau d'enregistrement, de les classer par ordre aléatoire.
Pas besoin de pierres précieuses ou de scripts.

Si vous souhaitez un enregistrement :
```
rand_record = Model.all.shuffle.first
```
- Pas la meilleure option, car cette charge tous les enregistrements dans la mémoire. Aussi, shuffle.first == .sample
InformationsquelleAutor Gregdebrick
0

Avec l'aide de RANDOM(), vous pouvez également jeter dans un champ:
```
class Thing
scope :random, -> (limit = 1) {
order('RANDOM()').
limit(limit)
}
end
```
Ou, si vous n'avez pas envie que comme un champ, il suffit de jeter dans une méthode de classe. Maintenant Thing.random travaille avec Thing.random(n).

InformationsquelleAutor Damien Roche

Vous devez vous connecter pour publier un commentaire.