• =?UTF-8?Q?Assembler_des_fichiers_PDF_s=C3=A9par=C3=A9s_en_un_docume?= =

    From =?UTF-8?Q?Beno=C3=AEt_Barbier?=@21:1/5 to All on Sat Jul 5 13:00:01 2025
    Bonjour à toutes et tous,


    Je recherche une liste de logiciels libres, si possible en paquet dans
    le dépôt Debian, pour assembler des PDF (document papier qui ont été numérisés en fichiers PDF), en un document, ajouter un
    foliotage(pagination), avec la possibilité d’intercaler des pages de chapitre et de créer une table des matières par chapitres ajoutés.

    Et si possible, ajouter des repères de texte dans les fichiers PDF
    séparés pour créer une table des matières avec des sections.


    Merci d’avance,

    --
    Benoît

    Ps.
    Je me demande s'il ne serait pas plus simple de passer par une
    reconnaissance optique de caractères, mais dans certain cas, ça va être difficile, car c'est des articles de presse, papier en colonnes
    numérisées avec des images.
    Toutes suggestions sont les bienvenues.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From =?UTF-8?B?SsOpcsOpbXkgTGFs?=@21:1/5 to All on Sat Jul 5 13:00:02 2025
    Bonjour,

    j'ai fait exactement ça avec des logiciels libres, en l'espèce avec playwright et chromium,
    en faisant un fichier HTML contenant les images et en exportant en pdf. C'était pas facile ! Le client était content de payer sa facture...

    Le sam. 5 juil. 2025 à 12:52, Benoît Barbier <benoitlst@ouvaton.org> a
    écrit :

    Bonjour à toutes et tous,


    Je recherche une liste de logiciels libres, si possible en paquet dans
    le dépôt Debian, pour assembler des PDF (document papier qui ont été numérisés en fichiers PDF), en un document, ajouter un foliotage(pagination), avec la possibilité d’intercaler des pages de chapitre et de créer une table des matières par chapitres ajoutés.

    Et si possible, ajouter des repères de texte dans les fichiers PDF
    séparés pour créer une table des matières avec des sections.


    Merci d’avance,

    --
    Benoît

    Ps.
    Je me demande s'il ne serait pas plus simple de passer par une
    reconnaissance optique de caractères, mais dans certain cas, ça va être difficile, car c'est des articles de presse, papier en colonnes
    numérisées avec des images.
    Toutes suggestions sont les bienvenues.



    <div dir="ltr">Bonjour,<div><br></div><div>j&#39;ai fait exactement ça avec des logiciels libres, en l&#39;espèce avec playwright et chromium,</div><div>en faisant un fichier HTML contenant les images et en exportant en pdf.</div><div>C&#39;était pas
    facile ! Le client était content de payer sa facture...</div></div><br><div class="gmail_quote gmail_quote_container"><div dir="ltr" class="gmail_attr">Le sam. 5 juil. 2025 à 12:52, Benoît Barbier &lt;<a href="mailto:benoitlst@ouvaton.org">benoitlst@
    ouvaton.org</a>&gt; a écrit :<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Bonjour à toutes et tous,<br>


    Je recherche une liste de logiciels libres, si possible en paquet dans <br>
    le dépôt Debian, pour assembler des PDF (document papier qui ont été <br> numérisés en fichiers PDF), en un document, ajouter un <br> foliotage(pagination), avec la possibilité d’intercaler des pages de <br> chapitre et de créer une table des matières par chapitres ajoutés.<br>

    Et si possible, ajouter des repères de texte dans les fichiers PDF <br> séparés pour créer une table des matières avec des sections.<br>


    Merci d’avance,<br>

    --<br>
    Benoît<br>

    Ps.<br>
    Je me demande s&#39;il ne serait pas plus simple de passer par une <br> reconnaissance optique de caractères, mais dans certain cas, ça va être <br> difficile, car c&#39;est des articles de presse, papier en colonnes <br> numérisées avec des images.<br>
    Toutes suggestions sont les bienvenues.<br>

    </blockquote></div>

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From ajh-valmer@21:1/5 to All on Sat Jul 5 15:30:01 2025
    On Saturday 05 July 2025 12:52:27 Benoît Barbier wrote:
    Je recherche une liste de logiciels libres, si possible en paquet dans
    le dépôt Debian, pour assembler des PDF

    PDF merge alias PDFSAM en mode graphique le fait très bien,
    le document fourni est de bonne qualité visuelle.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From colonius@free.fr@21:1/5 to All on Sat Jul 5 15:50:01 2025
    Il y a aussi pdftk.

    apt-cache show pdftk

    Librement
    Klaus

    05.07.2025 15:24:57 ajh-valmer <ajh.valmer@free.fr>:

    On Saturday 05 July 2025 12:52:27 Benoît Barbier wrote:
    Je recherche une liste de logiciels libres, si possible en paquet dans
    le dépôt Debian, pour assembler des PDF

    PDF merge alias PDFSAM en mode graphique le fait très bien,
    le document fourni est de bonne qualité visuelle.

    <html>
    <head>
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    </head>
    <body>
    <span dir="ltr" style="margin-top:0; margin-bottom:0;">Il y a aussi pdftk.</span>
    <br>
    <br><span dir="ltr" style="margin-top:0; margin-bottom:0;">apt-cache show pdftk</span>
    <br>
    <br><span dir="ltr" style="margin-top:0; margin-bottom:0;">Librement </span>
    <br><span dir="ltr" style="margin-top:0; margin-bottom:0;">Klaus </span>
    <br>
    <div class="fairemail_quote">
    <div dir="ltr">
    <p>05.07.2025 15:24:57 ajh-valmer &lt;ajh.valmer@free.fr&gt;:</p>
    </div>
    <blockquote style="margin:0;border-left:3px solid #ccc; padding-left:10px;">
    <div>
    On Saturday 05 July 2025 12:52:27 Benoît Barbier wrote:
    <br>
    <blockquote style="margin:0;border-left:3px solid #ccc; padding-left:10px;">
    Je recherche une liste de logiciels libres, si possible en paquet dans
    <br>
    le dépôt Debian, pour assembler des PDF
    <br>
    </blockquote>
    <br>
    PDF merge alias PDFSAM en mode graphique le fait très bien,
    <br>
    le document fourni est de bonne qualité visuelle.
    <br>
    </div>
    </blockquote>
    </div>
    </body>
    </html>

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Michel Verdier@21:1/5 to All on Sun Jul 6 08:50:01 2025
    Le 5 juillet 2025 Benoît Barbier a écrit :

    Je recherche une liste de logiciels libres, si possible en paquet dans le dépôt Debian, pour assembler des PDF (document papier qui ont été numérisés en
    fichiers PDF), en un document, ajouter un foliotage(pagination), avec la possibilité d’intercaler des pages de chapitre et de créer une table des matières par chapitres ajoutés.

    Et si possible, ajouter des repères de texte dans les fichiers PDF séparés pour créer une table des matières avec des sections.

    Pour ce qui est de concaténer des pdf on t'a donné des pistes. Mais je suppose que ça ne couvre pas le reste. Peut-être devrais-tu utiliser un logiciel de rédaction. Perso j'utiliserais LaTeX qui concatènera
    pdf/images et te donnera la main sur pagination, chapitrage, sections,
    table des matières et bien plus. Et une présentation pro.

    Je me demande s'il ne serait pas plus simple de passer par une reconnaissance optique de caractères, mais dans certain cas, ça va être difficile, car c'est
    des articles de presse, papier en colonnes numérisées avec des images.

    Oui ça doit au moins pouvoir alimenter un index de mots (LaTeX gère ça aussi). Mais c'est sûr qu'il y aura du tri à faire.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Basile Starynkevitch@21:1/5 to Michel Verdier on Sun Jul 6 09:10:01 2025
    On Sun, 2025-07-06 at 08:40 +0200, Michel Verdier wrote:
    Le 5 juillet 2025 Benoît Barbier a écrit :

    Je recherche une liste de logiciels libres, si possible en paquet dans le dépôt Debian, pour assembler des PDF (document papier qui ont été numérisés
    en
    fichiers PDF), en un document, ajouter un foliotage(pagination), avec la possibilité d’intercaler des pages de chapitre et de créer une table des
    matières par chapitres ajoutés.

    Et si possible, ajouter des repères de texte dans les fichiers PDF séparés
    pour créer une table des matières avec des sections.

    Pour ce qui est de concaténer des pdf on t'a donné des pistes. Mais je suppose que ça ne couvre pas le reste. Peut-être devrais-tu utiliser un logiciel de rédaction. Perso j'utiliserais LaTeX qui concatènera
    pdf/images et te donnera la main sur pagination, chapitrage, sections,
    table des matières et bien plus. Et une présentation pro.

    Une alternative libre à LaTeX pour un usage sans (ou avec peu de) formules mathématiques (ou notes et partitions musicales, gérées par https://fr.wikipedia.org/wiki/MusiXTeX ou https://fr.wikipedia.org/wiki/LilyPond
    ...) serait l'utilisation du formatteur de texte GNU lout

    https://fr.wikipedia.org/wiki/Lout

    Ce dernier est bien moins lourd que LaTeX (avec une syntaxe différente)

    Pour ceux qui veulent générer programmatiquement un fichier PDF il existe aussi
    la bibliothèque libre http://www.pdfhummus.com/ dont le code est en https://github.com/galkahana/PDF-Writer et http://libharu.org/ en https://github.com/libharu/libharu (et quelques autres.

    Personnellement je crois que générer un PDF est plus simple que de l'assembler à
    partir d'autres fichiers PDFs.

    Librement
    --
    Basile STARYNKEVITCH <basile@starynkevitch.net>
    8 rue de la Faïencerie http://starynkevitch.net/Basile/
    92340 Bourg-la-Reine https://github.com/bstarynk
    France https://github.com/RefPerSys/RefPerSys

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Fabien R@21:1/5 to All on Sun Jul 6 09:50:01 2025
    On 05/07/2025 12:52, Benoît Barbier wrote:
    Ps.
    Je me demande s'il ne serait pas plus simple de passer par une reconnaissance optique de caractères, mais dans certain cas, ça va être difficile, car c'est des articles de presse,
    papier en colonnes numérisées avec des images.
    Toutes suggestions sont les bienvenues.
    Tu peux tester gImagerReader qui génère des fichiers ODT.
    -
    Fabien

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From ajh-valmer@21:1/5 to All on Sun Jul 6 12:50:01 2025
    On Sunday 06 July 2025 01:34:39 Michel MOUNIER wrote:
    Quelques commandes à utiliser avec pdftk :

    pdftk n'aua pas le même rendu en qualité que
    PDF merge alias PDFSAM

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From Jean Bernon@21:1/5 to All on Sun Jul 6 22:50:01 2025
    Je comprends que tu ne veux pas seulement assembler des PDF, mais faire un travail d'édition à partir d'eux : titres de section, pagination, table des matières etc.
    Si j'avais à le faire, j'utiliserai tout simplement LibreOffice Writer qui permet de créer un document en y insérant des PDF en mode image.

    ----- Mail original -----

    De: "Benoît Barbier" <benoitlst@ouvaton.org>
    À: "Liste Debian" <debian-user-french@lists.debian.org>
    Envoyé: Samedi 5 Juillet 2025 12:52:27
    Objet: Assembler des fichiers PDF séparés en un document

    Bonjour à toutes et tous,

    Je recherche une liste de logiciels libres, si possible en paquet
    dans
    le dépôt Debian, pour assembler des PDF (document papier qui ont été numérisés en fichiers PDF), en un document, ajouter un foliotage(pagination), avec la possibilité d’intercaler des pages de chapitre et de créer une table des matières par chapitres ajoutés.

    Et si possible, ajouter des repères de texte dans les fichiers PDF
    séparés pour créer une table des matières avec des sections.

    Merci d’avance,

    --
    Benoît

    Ps.
    Je me demande s'il ne serait pas plus simple de passer par une
    reconnaissance optique de caractères, mais dans certain cas, ça va
    être
    difficile, car c'est des articles de presse, papier en colonnes
    numérisées avec des images.
    Toutes suggestions sont les bienvenues.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From =?UTF-8?Q?Philippe_V=C3=A9dovati?=@21:1/5 to All on Sun Jul 6 23:20:01 2025
    Bonsoir,

    Pour des travaux sur des PDF, j'utiliserais PDF arranger mais comme le dit Jean bernon, pour ton cas, libreOffice semble le plus apte à faire le travail.

    Bien cordialement

    6 juil. 2025 22:47:08 Jean Bernon <jbernon@free.fr>:

    Je comprends que tu ne veux pas seulement assembler des PDF, mais faire un travail d'édition à partir d'eux : titres de section, pagination, table des matières etc.
    Si j'avais à le faire, j'utiliserai tout simplement LibreOffice Writer qui permet de créer un document en y insérant des PDF en mode image.

    ----- Mail original -----

    De: "Benoît Barbier" <benoitlst@ouvaton.org>
    À: "Liste Debian" <debian-user-french@lists.debian.org>
    Envoyé: Samedi 5 Juillet 2025 12:52:27
    Objet: Assembler des fichiers PDF séparés en un document

    Bonjour à toutes et tous,

    Je recherche une liste de logiciels libres, si possible en paquet
    dans
    le dépôt Debian, pour assembler des PDF (document papier qui ont été
    numérisés en fichiers PDF), en un document, ajouter un
    foliotage(pagination), avec la possibilité d’intercaler des pages de
    chapitre et de créer une table des matières par chapitres ajoutés.

    Et si possible, ajouter des repères de texte dans les fichiers PDF
    séparés pour créer une table des matières avec des sections.

    Merci d’avance,

    --
    Benoît

    Ps.
    Je me demande s'il ne serait pas plus simple de passer par une
    reconnaissance optique de caractères, mais dans certain cas, ça va
    être
    difficile, car c'est des articles de presse, papier en colonnes
    numérisées avec des images.
    Toutes suggestions sont les bienvenues.

    <html>
    <head>
    <meta name="viewport" content="width=device-width, initial-scale=1.0">
    </head>
    <body>
    <span dir="ltr" style="margin-top:0; margin-bottom:0;">Bonsoir,</span>
    <br>
    <br><span dir="ltr" style="margin-top:0; margin-bottom:0;">Pour des travaux sur des PDF, j'utiliserais PDF arranger mais comme le dit Jean bernon, pour ton cas, libreOffice semble le plus apte à faire le travail.</span>
    <br>
    <br><span dir="ltr" style="margin-top:0; margin-bottom:0;">Bien cordialement </span>
    <br>
    <div class="fairemail_quote">
    <div dir="ltr">
    <p>6 juil. 2025 22:47:08 Jean Bernon &lt;jbernon@free.fr&gt;:</p>
    </div>
    <blockquote style="margin:0;border-left:3px solid #ccc; padding-left:10px;">
    <div>
    Je comprends que tu ne veux pas seulement assembler des PDF, mais faire un travail d'édition à partir d'eux : titres de section, pagination, table des matières etc.
    <br>
    Si j'avais à le faire, j'utiliserai tout simplement LibreOffice Writer qui permet de créer un document en y insérant des PDF en mode image.
    <br>
    <br>
    ----- Mail original -----
    <br>
    <br>
    <blockquote style="margin:0;border-left:3px solid #ccc; padding-left:10px;">
    De: "Benoît Barbier" &lt;benoitlst@ouvaton.org&gt;
    <br>
    À: "Liste Debian" &lt;debian-user-french@lists.debian.org&gt;
    <br>
    Envoyé: Samedi 5 Juillet 2025 12:52:27
    <br>
    Objet: Assembler des fichiers PDF séparés en un document
    <br>
    </blockquote>
    <br>
    <blockquote style="margin:0;border-left:3px solid #ccc; padding-left:10px;">
    Bonjour à toutes et tous,
    <br>
    </blockquote>
    <br>
    <blockquote style="margin:0;border-left:3px solid #ccc; padding-left:10px;">
    Je recherche une liste de logiciels libres, si possible en paquet
    <br>
    dans
    <br>
    le dépôt Debian, pour assembler des PDF (document papier qui ont été
    <br>
    numérisés en fichiers PDF), en un document, ajouter un
    <br>
    foliotage(pagination), avec la possibilité d’intercaler des pages de
    <br>
    chapitre et de créer une table des matières par chapitres ajoutés.
    <br>
    </blockquote>
    <br>
    <blockquote style="margin:0;border-left:3px solid #ccc; padding-left:10px;">
    Et si possible, ajouter des repères de texte dans les fichiers PDF
    <br>
    séparés pour créer une table des matières avec des sections.
    <br>
    </blockquote>
    <br>
    <blockquote style="margin:0;border-left:3px solid #ccc; padding-left:10px;">
    Merci d’avance,
    <br>
    </blockquote>
    <br>
    <blockquote style="margin:0;border-left:3px solid #ccc; padding-left:10px;">
    --
    <br>
    Benoît
    <br>
    </blockquote>
    <br>
    <blockquote style="margin:0;border-left:3px solid #ccc; padding-left:10px;">
    Ps.
    <br>
    Je me demande s'il ne serait pas plus simple de passer par une
    <br>
    reconnaissance optique de caractères, mais dans certain cas, ça va
    <br>
    être
    <br>
    difficile, car c'est des articles de presse, papier en colonnes
    <br>
    numérisées avec des images.
    <br>
    Toutes suggestions sont les bienvenues.
    <br>
    </blockquote>
    </div>
    </blockquote>
    </div>
    </body>
    </html>

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From k6dedijon@free.fr@21:1/5 to All on Mon Jul 7 05:30:01 2025
    Bonjour Benoît,
    Si vous allez vers une solution Libre Office, je pense qu'il vaut mieux envisager Scribus dont les possibilités de mise en pages sont plus grandes.

    Pour le moment j'utilise PDF arranger pour ajouter des pages PDF pour réaliser en un seul PDF, pour extraire des pages d'un PDF...
    Je ne me suis pas penché sur la numérotation des pages de ces arrangements.

    Pour réaliser un document complexe avec des indications de section sur chaque page, Scribus me paraît plus adapté que Libre Office.
    Bien évidemment la numérotation des pages est prise en compte, les emplacement des images avec chevauchement de texte, détourage et plus encore.

    Bonne recherche.
    Cassis



    ----- Mail d'origine -----
    De: Philippe Védovati <philippe.vedovati@free.fr>
    À: Jean Bernon <jbernon@free.fr>
    Cc: Debian Users French <debian-user-french@lists.debian.org>
    Envoyé: Sun, 06 Jul 2025 23:13:08 +0200 (CEST)
    Objet: Re: Assembler des fichiers PDF séparés en un document

    Bonsoir,

    Pour des travaux sur des PDF, j'utiliserais PDF arranger mais comme le dit Jean bernon, pour ton cas, libreOffice semble le plus apte à faire le travail.

    Bien cordialement

    6 juil. 2025 22:47:08 Jean Bernon <jbernon@free.fr>:

    Je comprends que tu ne veux pas seulement assembler des PDF, mais faire un travail d'édition à partir d'eux : titres de section, pagination, table des matières etc.
    Si j'avais à le faire, j'utiliserai tout simplement LibreOffice Writer qui permet de créer un document en y insérant des PDF en mode image.

    ----- Mail original -----

    De: "Benoît Barbier" <benoitlst@ouvaton.org>
    À: "Liste Debian" <debian-user-french@lists.debian.org>
    Envoyé: Samedi 5 Juillet 2025 12:52:27
    Objet: Assembler des fichiers PDF séparés en un document

    Bonjour à toutes et tous,

    Je recherche une liste de logiciels libres, si possible en paquet
    dans
    le dépôt Debian, pour assembler des PDF (document papier qui ont été
    numérisés en fichiers PDF), en un document, ajouter un
    foliotage(pagination), avec la possibilité d’intercaler des pages de
    chapitre et de créer une table des matières par chapitres ajoutés.

    Et si possible, ajouter des repères de texte dans les fichiers PDF
    séparés pour créer une table des matières avec des sections.

    Merci d’avance,

    --
    Benoît

    Ps.
    Je me demande s'il ne serait pas plus simple de passer par une
    reconnaissance optique de caractères, mais dans certain cas, ça va
    être
    difficile, car c'est des articles de presse, papier en colonnes
    numérisées avec des images.
    Toutes suggestions sont les bienvenues.

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)
  • From =?UTF-8?Q?S=C3=A9bastien_NOBILI?=@21:1/5 to All on Mon Jul 7 10:10:01 2025
    Bonjour,

    Le 2025-07-05 12:52, Benoît Barbier a écrit :
    Je recherche une liste de logiciels libres, si possible en paquet dans
    le dépôt Debian, pour assembler des PDF (document papier qui ont été numérisés en fichiers PDF), en un document, ajouter un foliotage(pagination), avec la possibilité d’intercaler des pages de chapitre et de créer une table des matières par chapitres ajoutés.

    Ça sort un peu du cadre "en paquet dans le dépôt Debian" mais j'en
    profite pour signaler la "(grosse) trousse à outils pour manipuler des
    PDF" mise en ligne par Framasoft :

    https://stirling-pdf.framalab.org/

    Sébastien

    --- SoupGate-Win32 v1.05
    * Origin: fsxNet Usenet Gateway (21:1/5)