Ferramentas para capturar e converter a Web

Converta páginas da web e HTML em PDF - Java

API Java

Ao converter arquivos HTML, páginas da Web ou HTML simples em PDF. API Java do GrabzIt fornece os seguintes recursos que ajudam integrate GrabzIt into seu sistema o mais facilmente possível.

No entanto, antes de começar, lembre-se de que depois de chamar o URLToPDF, HTMLToPDF or FileToPDF métodos. Ou o Save or SaveTo O método deve ser chamado para obter a captura de tela do PDF ou converter o HTML diretamente em PDF.

Opções Básicas

Uma captura de tela em PDF captura a página da web inteira e a converte into Um arquivo PDF que pode conter muitas páginas. Dependendo do comprimento da página da web de destino. Apenas um parâmetro é necessário para converter uma página da web into um documento PDF. Ou para converter HTML para PDF como mostrado abaixo.

grabzIt.URLToPDF("https://www.tesla.com");
//Then call the Save or SaveTo method
grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>");
//Then call the Save or SaveTo method
grabzIt.FileToPDF("example.html");
//Then call the Save or SaveTo method

Identificador Personalizado

Você pode passar um identificador personalizado para o PDF métodos como mostrado abaixo. Esse valor é retornado ao seu manipulador GrabzIt Java. Por exemplo, esse identificador personalizado pode ser um identificador de banco de dados, permitindo que uma captura de tela seja associada a um registro específico do banco de dados.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setCustomId("123456");

grabzIt.URLToPDF("https://www.tesla.com", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setCustomId("123456");

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setCustomId("123456");

grabzIt.FileToPDF("example.html", options);
//Then call the Save method
grabzIt.Save("http://www.example.com/handler");

Cabeçalhos e rodapés

Ao criar uma captura de tela em PDF, você pode solicitar a aplicação de um determinado modelo para o PDF gerado. Este modelo deve ser saved com antecedência. Ele especificará o conteúdo do cabeçalho e rodapé, juntamente com quaisquer variáveis ​​especiais. No código de exemplo abaixo, o usuário está usando um modelo criado por ele chamado "meu modelo".

Se não houver uma margem superior ou inferior suficientemente grande para o cabeçalho ou rodapé, respectivamente. Não aparecerá no PDF. No exemplo abaixo, definimos as margens superior e inferior como 20 para fornecer bastante espaço.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setMarginTop(20);
options.setMarginBottom(20);
options.setTemplateId("my template");

grabzIt.URLToPDF("https://www.tesla.com", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setMarginTop(20);
options.setMarginBottom(20);
options.setTemplateId("my template");

grabzIt.HTMLToPDF("<html><body><h1>Hello World!</h1></body></html>", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf");
GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setMarginTop(20);
options.setMarginBottom(20);
options.setTemplateId("my template");

grabzIt.FileToPDF("example.html", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf");

Converter elemento HTML em PDF

Se você deseja apenas converter um único elemento HTML de um documento HTML. Como converter um único div ou span diretamente intum documento PDF que você pode com a biblioteca Java do GrabzIt. Você deve passar o Seletor CSS do elemento HTML que você deseja converter para o setTargetElement método.

...
<span id="Article">
<p>This is the content I am interested in.</p>
<img src="myimage.jpg">
</span>
...

Neste exemplo, queremos capturar todo o conteúdo no período que possui o ID de Article. Então, passamos esse ID para o GrabzIt, como mostrado abaixo.

GrabzItClient grabzIt = new GrabzItClient("Sign in to view your Application Key", "Sign in to view your Application Secret");

PDFOptions options = new PDFOptions();
options.setTargetElement("#Article");

grabzIt.URLToPDF("http://www.bbc.co.uk/news", options);
//Then call the Save or SaveTo method
grabzIt.SaveTo("result.pdf");

Como um PDF é cortado ao segmentar um elemento HTML pode ser controlado usando essas técnicas.