Procédure de programmation pour convertir HTML en epub?
Puis-je faire cette conversion avec n'importe quel langage de programmation ou à la bibliothèque?
- Avez-vous le vent s'installent sur un processus? La recherche d'une solution PHP moi-même.
- Après avoir essayer différents programmes, je pense que c'est beaucoup mieux: juliansmart.com/ecub Bien qu'il n'est pas open source.
- Je pense que vous êtes intéressé à ceci: github.com/Grandt/PHPePub
Vous devez vous connecter pour publier un commentaire.
La réponse courte est oui, il peut être fait dans n'importe quel langage de programmation.
Étapes de base:
Certains sites web pour vous aider à démarrer:
Juin 2015 Remarque: La epubcheck valideur a déménagé de google code pour GitHub; à noter que la nouvelle URL.
Calibre prend en charge une large gamme de formats, y compris HTML, et une grande variété de formats de sortie, y compris l'EPUB, mais ce n'est pas "un langage de programmation ou à la bibliothèque". Existe-il des raisons particulières, vous avez le désir d'une programmation basée sur l'approche plutôt qu'un outil? Si oui, peut-être que Python et ebookmaker.py, par exemple, pourrait vous aider.
Une réponse tardive, mais j'ai trouvé le Python 3 ebookmaker être de valeur, au moins après que j'ai contribué un pull request pour supprimer un UTF-8 BOM. Un problème avec, il semble qu'il utilise cassant des expressions régulières pour analyser HTML, mais je crois que je vais le rapporter là.
Voici pdf à epub, je sais que c'est pas ce que vous êtes après, mais c'est un début.
La calibre paquet peut avoir ce que vous voulez
Je suis en utilisant la bibliothèque de Aspose - http://www.aspose.com/categories/.net-components/aspose.words-for-.net/default.aspx
En seulement deux lignes de code, je suis en mesure de le faire en html en epub conversions. L'utilisation de ce actuellement dans un système de production.
Document doc = new Document(_sourceFilePath);
doc.Enregistrer(_destinationFilePath, SaveFormat.Epub);
J'ai juste commencé à mettre en œuvre un outil en Java (OpenJDK compatible): html2epub. Afin de se débarrasser de modifier manuellement le fichier de config, je vais probablement commencer un autre outil pour générer le fichier de configuration à partir d'un répertoire donné (toutefois, il serait encore nécessaire de déterminer l'ordre de la XHTMLs dans le format EPUB - pour les non-programmatique utilisation, le développement d'une interface graphique, outil d'aide pourrait être envisagée, pour une flexibilité totale, programmatique solution, je ne suis pas venu avec une idée encore). Avant cela, j'ai mis en place shell script en fonction des convertisseurs pour le custom XML d'entrée (hag2epub outils) - dans le cas où vous êtes intéressé, je serais probablement de port à XHTML entrée (avec un fichier de config pour le format EPUB de métadonnées ou d'obtenir des métadonnées à partir de la plus haute index.html d'un répertoire, si existante).
J'ai le même problème auparavant, quelque chose que je veux lire le contenu des pages web en mode hors connexion sur mon iPad. Je n'ai aucune idée et je ne suis pas calée en informatique. Il y a calibre ou la strophe blabla....
Mais pour moi, ils sont juste des formats convertisseurs et j'ai besoin d'un ePub créateur de livres qui me permet de combiner un grand nombre désiré de documents à lire. Ensuite, j'ai trouvé une passion pour les livres html to ePub converter, j'ai enregistrer le code html de la page de web puis de les convertir avec elle. C'est un très bon outil pour moi maintenant.