Comment construire un index inversé simple?

Je veux construire une simple fonction d'indexation du moteur de recherche, sans API, comme Lucene. Dans l'index inversé, j'ai juste besoin d'enregistrer des informations de base de chaque mot, par exemple docID, la position et la freqence.

Maintenant, j'ai plusieurs questions:

  1. Quel type de structure de données est souvent utilisé pour la construction d'index inversé? Multidimensionnelle liste?
  2. Après la construction de l'index, la façon de l'écrire dans les fichiers? Quel type de format dans le fichier? Comme un tableau? Comme le dessin d'une table d'index sur le papier?

source d'informationauteur Munichong