Konvertuesi në internet në internet në pdf me tabelën e përmbajtjes. Si ta ktheni me lehtësi një faqe interneti në PDF? Me ndihmën e specialeve

Shtëpi / teknologjitë
  • Java,
  • PDF
    • Tutorial

    Ishte shumë e papritur për mua që në qendër Java nuk ka praktikisht asnjë informacion për të punuar me të dokument PDF Prandaj, nga përvoja personale, unë dua të përdor shembullin e një servlet për të treguar se sa lehtë mund ta ktheni çdo faqe në internet në një dokument PDF.

    Parathënie:
    Le të shkruajmë një servlet të thjeshtë që do të marrë faqen e internetit që ne specifikojmë nëpërmjet protokollit HTTP dhe do të gjenerojë një dokument PDF të plotë bazuar në të.
    Bibliotekat e përdorura:
    • Flying Saucer PDF është biblioteka kryesore që do të na ndihmojë të krijojmë një dokument PDF nga HTML/CSS
    • iText është një bibliotekë që përfshihet me atë të përshkruar më sipër, por nuk mund të mos e përfshija në listën e bibliotekave sepse... është mbi këtë bazë që do të gjenerohet dokumenti PDF
    • HTML Cleaner - një bibliotekë që do të pastrojë kodin tonë HTML

    Përshkrimet e bibliotekave për konfigurimin e Maven (pom.xml)

    org.xhtmlrenderer disk-fluturues-pdf 9.0.4 net.sourceforge.htmlpastrues html pastrues 2.6.1

    Formimi i faqes:
    Një nga më pika të rëndësishmeështë formimi i faqes. Fakti është se nga vetë faqja, duke përdorur CSS, janë vendosur parametrat e dokumentit të ardhshëm PDF.

    Le të shohim paraqitjen:

    faqe.jsp

    <%@ page import="java.util.Date" %> <%@ page import="java.text.SimpleDateFormat" %> <%@ page contentType="text/html;charset=UTF-8" language="java" %> <%! private SimpleDateFormat sdf = new SimpleDateFormat("HH:mm:ss"); %> Shembull

    Përshëndetje, habr! Koha aktuale:<%=sdf.format(new Date())%>
    Faqe e re!


    Këtu dua të nënvizoj disa pika. Gjërat e para së pari: të gjitha rrugët duhet të jenë absolute! Fotografitë, stilet, adresat e shkronjave, etj., shtigjet absolute duhet të specifikohen për gjithçka. Tani le të kalojmë nëpër rregullat CSS (ajo që fillon me simbolin @).
    @font-face- ky është një rregull që do t'i tregojë gjeneratorit tonë PDF se çfarë font duhet të marrë dhe nga ku. Problemi është se biblioteka që do të gjenerojë dokumentin PDF nuk përmban fonte që përfshijnë cirilik. Kjo është arsyeja pse në këtë mënyrë do të jetë e nevojshme të përcaktohet TE GJITHA fontet që përdoren në faqen tuaj, edhe nëse është fontet standarde: Arial, Verdana, Tahoma etj., in ndryshe Ju rrezikoni të mos shihni alfabetin cirilik në dokumentin tuaj.
    Kushtojini vëmendje veçorive të tilla si "-fs-pdf-font-embed: embed;" dhe "-fs-pdf-font-encoding: Identity-H;", këto veti janë të nevojshme, vetëm mos harroni t'i shtoni.
    @faqe- ky është një rregull që përcakton dhëmbëzimin për një dokument PDF, si dhe madhësinë e tij. Këtu dua të vërej se nëse specifikoni madhësinë e faqes A3 (dhe siç tregon praktika, kjo është shpesh e nevojshme, pasi faqja nuk përshtatet në dokument në gjerësi), kjo nuk do të thotë që përdoruesi do të duhet të printojë dokument (nëse dëshironi) në formatin A3, më tepër thjesht e gjithë përmbajtja do të zvogëlohet/rritet proporcionalisht në madhësinë e dëshiruar (zakonisht A4). ato. referojuni vlerës së pronës madhësia skeptik, por dijeni se mund të luajë një rol kyç për ju.
    @media- një rregull që ju lejon të krijoni klasa CSS për një lloj specifik pajisjeje, në rastin tonë është "print". Brenda këtij rregulli, ne krijuam një klasë pas së cilës gjeneratori ynë i dokumenteve PDF do të krijojë një faqe të re.
    Servlet:
    Tani le të shkruajmë një servlet që do të na kthejë dokumentin PDF të krijuar:

    PdfServlet.java

    paketa ru.habrahabr.web_to_pdf.servlets; importoni org.htmlcleaner.CleanerProperties; importoni org.htmlcleaner.HtmlCleaner; importoni org.htmlcleaner.PrettyXmlSerializer; importoni org.htmlcleaner.TagNode; import org.xhtmlrenderer.pdf.ITextRenderer; importoj javax.servlet.ServletException; importoj javax.servlet.http.HttpServlet; import javax.servlet.http.HttpServletRequest; importoni javax.servlet.http.HttpServletResponse; import java.io.*; importoni lidhjen java.net.HttpURLC; import java.net.URL; importoni lidhjen java.net.URL; /** * Data: 31.03.2014 * Ora: 9:33 * * @autor Ruslan Molchanov ( [email i mbrojtur]) */ klasën publike PdfServlet zgjeron HttpServlet ( String final statik privat PAGE_TO_PARSE = "http://localhost:8080/page.jsp"; varg final statik privat CHARSET = "UTF-8"; @Override shërbimin e mbrojtur të zbrazët (HttpServletRequest, HttpServletResponse resp) hedh ServletException, IOException ( provo ( resp.setContentType ("application/pdf"); bajt pdfDoc = performPdfDocument(PAGE_TO_PARSE); resp.setContentLength(pdfDoc.length)(pdfDoc.length); resp. catch (Përjashtim ex) ( resp.setContentType ("tekst/html"); PrintWriter out = resp.getWriter (); out.write (" Diçka nuk shkon

    "); ex.printStackTrace(out); ex.printStackTrace(); ) ) /** * Metoda që përgatit një dokument PDF. performPdfDocument( String String) hedh Përjashtim ( // Merrni kodin HTML të faqes String html = getHtml(rruga); // Buffer që do të përmbajë kodin HTML të formatuar ByteArrayOutputStream out = i ri ByteArrayOutputStream(); // Formatimi HTML kodi /* kjo procedurë është opsionale, por unë rekomandoj fuqimisht përdorimin e këtij blloku */ HtmlCleaner cleaner = new HtmlCleaner();


    Nga rruga, nuk është aspak e nevojshme të shkruani një servlet për këto qëllime, ju mund të transferoni logjikën e këtij servleti edhe në një aplikacion konsol që do të ruajë dokumentet PDF në skedarë. Siç mund ta keni vënë re, nuk ka nevojë të konfiguroni, ndryshoni, shtoni etj. në servlet. (epo, me përjashtim të rrugës drejt faqes dhe, ndoshta, kodimit), në përputhje me rrethanat, e gjithë puna për përgatitjen e një dokumenti PDF është shumë e thjeshtë dhe shfaqet ekskluzivisht në pamje.

    Në fund, duhet të përfundoni me një dokument PDF që duket diçka si kjo.

    Koha e mirë të gjithëve!

    Përkundër faktit se në çdo shfletues mund të krijoni shpejt faqeshënues për faqet tuaja të preferuara, megjithatë, ndonjëherë është shumë e nevojshme të ruani faqen e dëshiruar të internetit në PDF (nëse vetëm sepse kjo faqe mund të hiqet ose modifikohet nga faqja me kalimin e kohës) ...

    Përveç kësaj, informacioni nga formati PDF mund të lexohet lehtësisht më së shumti pajisje të ndryshme(mbështetet nga të gjithë lexuesit pa përjashtim), mund të modifikohet në Word dhe t'u transferohet përdoruesve të tjerë. Dhe vetë faqja nuk do të gërryhet me kalimin e kohës, formatimi dhe dizajni i saj nuk do të ndryshojnë. Në përgjithësi, një gjë e dobishme dhe e nevojshme!

    Në këtë artikull do të shikoj disa mënyra se si mund ta bëni këtë shpejt dhe lehtë. Në fakt, le t'i drejtohemi biznesit ...

    Duke përdorur printimin e shfletuesit

    1) Çfarëdo shfletuesi që keni (Chrome, Opera, Edge, Firefox, etj.), Shtypni kombinimin e butonave Ctrl+P(ky kombinim nënkupton printimin e faqes). Ky funksion është gjithashtu i disponueshëm në menynë e shfletuesit.

    2) Më pas, ndryshoni printerin e paracaktuar në "Ruaj si PDF" ose "Microsoft Print to PDF" (në varësi të shfletuesit dhe sistemit operativ - mund të keni opsione të ndryshme në dispozicion: të dyja, ose vetëm një prej tyre). Shikoni disa pamje të ekranit më poshtë.

    3) Tani vendosni cilësimet bazë: numrin e faqeve për të ruajtur, paraqitjen e faqes, margjinat, ngjyrën, titujt dhe fundet, etj. Më pas klikoni butonin "Printo".

    Në fakt, kjo detyrë është përfunduar. Tani PDF-ja që rezulton mund të hapet në Word, Adobe PDF Reader dhe qindra programe të tjera që mbështesin këtë format.

    Me ndihmën e specialeve zgjerimet

    Për shfletuesit më të njohur tani ka një mori shtesash dhe shtesash të ndryshme që ju lejojnë të ruani faqet tuaja të preferuara si në ruajtja në renë kompjuterike, dhe në skedarët PDF në hard diskun tuaj.

    Do të doja të theksoja një shtesë shumë interesante - PDF MAGE.

    PDF Mage

    Një shtesë e vogël për Firefox, Opera, Chrome, e cila ju lejon të ruani të gjithë faqen e internetit në hard diskun tuaj me 1 klik!

    Vërej se pasi klikoni në ikonën PDF Mage, faqja aktuale thjesht shkarkohet në formatin PDF në dosjen tuaj të shkarkimit. Është thjesht e pamundur të imagjinohet diçka më e përshtatshme ...

    Unë do t'ju tregoj me një shembull.

    Pas instalimit të shtesës, do të keni një ikonë të vogël në meny. Pasi të keni gjetur një faqe interesante, thjesht kliko me të majtën mbi të.

    Në vetëm një moment, vetë shfletuesi do të fillojë automatikisht shkarkimin e skedarit PDF. Në fakt, gjithçka bëhet pa lëvizje të panevojshme, shpejt dhe me lehtësi!

    Përdorimi i shërbimeve online

    Ka gjithashtu shumë shërbime të internetit në internet që ju lejojnë të ruani shpejt çdo faqe në internet si PDF. Thelbi i punës është afërsisht si vijon: ju futni në speciale. lidhni URL-në e faqes që duhet të ruani.

    Tjetra, klikoni butonin për të krijuar një skedar PDF. Pas një kohe ju merrni një lidhje për të shkarkuar PDF-në tuaj. Sigurisht, mund ta përdorni, por sipas mendimit tim modest, e gjithë kjo është e lodhshme dhe e përshtatshme për përdorim të përkohshëm. Për shembull, keni "probleme" me shfletuesin ose Windows, keni hasur në një faqe "të çuditshme" që nuk dëshiron të ruhet duke përdorur metodat e mëparshme.

    Dhe kështu, shërbimet më të njohura të këtij lloji:

    1. - shërbim i thjeshtë dhe i përshtatshëm në anglisht. Ka një të veçantë në faqe. një rresht ku ngjisni URL-në, dhe pranë tij është një buton gjenerimi. Në fund, shkarkoni PDF-në e përfunduar në hard diskun tuaj.
    2. - një tjetër shërbim i huaj që funksionon në mënyrë të ngjashme.
    3. - një shërbim shumë i njohur, me ndihmën e tij tashmë janë ruajtur më shumë se 5,000,000 faqe në të gjithë botën! Këtu, ndër të tjera, mund të shkarkoni shtesa për shfletuesin (në mënyrë që të mos vizitoni faqen sa herë që duhet të ruani faqen).
    4. - një shërbim mjaft i thjeshtë dhe i përshtatshëm. Një minimum informacioni të panevojshëm në sit.

    Kjo është e gjitha për mua, fat të gjithëve!


    Pse keni nevojë të ruani faqet e internetit? Epo, ndoshta dëshironi të lexoni informacione jashtë linje ose të bëni disa vëzhgime në sit, ose dëshironi ta bëni këtë për një qëllim tjetër. Mua personalisht nuk më intereson pse ju nevojitet, thjesht do t'ju tregoj se si ta bëni shfletues të ndryshëm. Pra, si mund të ruani një faqe në internet në formatin PDF në shfletuesit Chrome, Opera, Yandex, Firefox?

    Le të fillojmë me shfletuesin krom.

    Së pari, duhet të gjeni faqen që ju intereson. Unë do të përdor faqen e internetit të automobilave ax4.ru si shembull.

    Në këndin e sipërm të djathtë, klikoni diçka si një sanduiç. Në menunë që shfaqet, klikoni " Vulë».

    Më tej, do të shihni se parazgjedhja është emri i printerit që keni instaluar ose një tjetër që është programuar nga shfletuesi. Duhet ta ndryshojmë duke klikuar në butonin përkatës " Ndryshimi».

    Kur shtypim " Ndryshimi", do të shfaqet një menu në të cilën duhet të zgjidhni artikullin " Ruaje si PDF».

    Pas së cilës, në të majtë, emri i printerit do të ndryshojë në " ruaj si PDF" Gjithçka që duhet të bëni është të shtypni " Ruaj».

    Zgjidhni një vendndodhje të ruajtjes (për mua është Desktop).


    Kjo është ajo, tani ju mund të hapni të ruajtura skedar PDF. Mund të mos duket shumë, por mund të kopjoni tekst prej tij shumë lehtë.

    Tani hap skedarin PDF përmes Foxit Reader. Ju, siç e përmenda më herët, mund të përdorni një program tjetër.
    Kjo është e gjitha, jo shumë e bukur, por e kuptoni idenë. Ju mund të krijoni një skedar PDF nga çdo faqe interneti.

    Për ta bërë këtë, unë do të shkoj në faqen e lajmeve nz1.ru dhe do të zgjedh disa lajme.

    Siç e kuptoni tashmë, procedura është e ngjashme në të gjithë shfletuesit. Klikoni mbi ngjashmërinë e sanduiçit në këndin e sipërm të djathtë, pastaj " Për më tepër"Dhe" Vulë».

    Ruaje si PDF.

    Pastaj zgjidhni një vendndodhje të ruajtjes. Për shembull, Desktop.

    Hapni skedarin përmes çdo programi që lexon format PDF, ne përdorim.

    Unë do t'ju tregoj duke përdorur shembullin e një faqeje me fotografi të lezetshme prikolnie-kartinki.ru.

    Shfletuesi Mozilla Firefox-i i bën gjërat pak më ndryshe. Klikoni mbi sanduiçin në këndin e sipërm të djathtë të ekranit dhe zgjidhni " Vulë».

    © 2024 ermake.ru -- Rreth riparimit të PC - Portali informacioni