Vill du veta hur du kan fånga en webbsida och spara den som ett PDF-dokument eller en bild med terminalen? Lyckligtvis har Linux en mängd verktyg som du kan använda för att automatisera uppgiften att konvertera HTML-dokument till PDF-filer och bilder.
Den här artikeln presenterar dig för wkhtmltopdf och wkhtmltoimage, verktyg som du behöver för att göra ditt arbete enklare.
Hur man konverterar HTML till PDF
Om du vill fånga webbsidor och konvertera dem till en PDF-fil hjälper verktyget wkhtmltopdf dig. Wkhtmltopdf är ett kommandoradsverktyg med öppen källkod som används för att återge webbsidor till PDF-dokument.
Eftersom verktyget fungerar huvudlöst inuti Linux-terminalen behöver du inte någon webbdrivrutin eller en webbläsarautomationsram som Selenium.
Installera wkhtmltopdf på Linux
Wkhtmltopdf är inte ett av standardpaketen som är förinstallerade på Linux. Du måste installera det manuellt med systemets pakethanterare.
Så här installerar du wkhtmltopdf på Ubuntu och Debian-baserade distributioner:
sudo apt installera wkhtmltopdf
På Arch-baserade distros som Manjaro Linux:
sudo pacman -S wkhtmltopdf
Det är också enkelt att installera wkhtmltopdf på RHEL-baserade distributioner som Fedora och CentOS.
sudo dnf installera wkhtmltopdf
Grundläggande syntax
Den grundläggande syntaxen för kommandot är:
wkhtmltopdf webbsidans filnamn
...var webbsida är webbadressen till den webbsida som du vill konvertera och filnamn är namnet på den utgående PDF-filen.
Så här konverterar du Googles startsida till ett PDF-dokument:
wkhtmltopdf https://google.com google.pdf
Produktion:
När du öppnar PDF-filen kommer du att märka att wkhtmltopdf exakt har gjort webbsidan till ett dokument.
Skriv ut flera kopior av webbsidan
De - kopior flagg är en livräddare om du vill att din utdatafil ska ha flera kopior av webbsidan. Observera att vid utskrift av flera kopior genererar wkhtmltopdf inte flera PDF-filer utan lägger till fler sidor till ett enda dokument istället.
Så här skapar du tre kopior av Googles startsida:
wkhtmltopdf --kopior 3 https://google.com google.pdf
Den utgående PDF-filen kommer att innehålla tre sidor enligt vad som anges i ovan nämnda kommando.
Lägg till ett gråskalefilter i utdata
Om du vill lägga till ett gråskalefilter i PDF-filen använder du -g eller - gråskala flagga med kommandot:
wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf - gråskala https://google.com google.pdf
Utdatafil:
Ändra PDF-riktningen
Som standard genererar wkhtmltopdf PDF-filen i vertikal layout, dvs. porträtt. För att ändra detta standardbeteende och fånga webbsidor i liggande i stället använder du --orientering flagga med kommandot:
wkhtmltopdf - orienteringslandskap https://google.com google.pdf
Produktion:
Observera att landskapsversionen av dokumentet har ett större blankstegsområde jämfört med porträttet.
Inkludera inte bilder när du konverterar
När du genererar utdata, om du inte vill att wkhtmltopdf ska återge bilder som finns på en webbsida, använd - inga bilder flagga:
wkhtmltopdf - inga bilder https://google.com google.pdf
Produktion:
Relaterad: Bästa verktygen för att redigera en PDF-fil var som helst
Hur man konverterar en webbsida till bilder
Verktyget wkhtmltoimage är en del av paketet wkhtmltopdf. Om du arbetar med en rapport och vill inkludera bilder på en webbplats, kommer det här verktyget att fungera till din fördel. Linux-terminalen gör det inte bara lättare för dig att fånga bilder utan ger dig också en rad alternativ som gör att du kan anpassa din produktion.
Grundläggande syntax
Wkhtmltoimage har en syntax som liknar wkhtmltopdf:
wkhtmltoimage webbsides filnamn
...var webbsida är webbadressen till en webbplats och filnamn är namnet på den utgående bilden.
Konvertera en webbsida till en bild
Fortsätt med det ovan nämnda exemplet, låt oss konvertera Googles startsida till bilder.
wkhtmlbild https://google.com google.png
Produktion:
Du kan också ange ett anpassat filformat som du vill att utdatabilden ska ha. Wkhtmltoimage stöder följande filtillägg:
- JPEG / JPG
- PNG
- SVG
Om du till exempel vill skapa en JPG-bild, byt helt enkelt ut filtillägget med JPG i kommandot:
wkhtmlbild https://google.com google.jpg
Relaterad: JPG vs. JPEG: Vad är skillnaden mellan dessa bildfilformat?
Fånga webbsidor med Linux Terminal
Du måste ha en PDF-visare installerad på ditt Linux-system om du vill visa PDF-filer som genereras av wkhtmltopdf. Medan de flesta Linux-distributioner har en förinstallerad PDF-editor kan du manuellt välja och installera en PDF-editor som passar dina behov.
Behöver du redigera en PDF-fil i Linux? Dessa Linux PDF-redigerare är gratis att installera och enkla att använda.
Läs Nästa
- Linux
- Linux
Deepesh är Junior Editor för Linux på MUO. Han har skrivit informationsinnehåll på internet i över 3 år. På fritiden tycker han om att skriva, lyssna på musik och spela gitarr.
Prenumerera på vårt nyhetsbrev
Gå med i vårt nyhetsbrev för tekniska tips, recensioner, gratis e-böcker och exklusiva erbjudanden!
Ett steg till…!
Bekräfta din e-postadress i e-postmeddelandet som vi just skickade till dig.