Ferramentas para capturar e converter a Web

Baixe todas as imagens de um site

Este exemplo também está disponível como um modelo.

Uma tarefa comum é baixar imagens de um site, com Raspador da Web do GrabzIt Isso é facil. Primeiro, crie um novo raspar com os detalhes normais, como a página inicial do raspar e outras opções.

Em seguida, vá para o Instruções para raspar guia e clique no Botão de página da Web botão. Isso entrará no Page palavra chave into as instruções de raspar e abrirá uma lista suspensa. Selecione getTagAttributes da lista. Próximo add 'src' como o primeiro parâmetro, isso indica ao raspador da Web para extrair o atributo src e digite uma vírgula.

Em seguida, clique no Botão de filtro isso permite que você informe ao raspador da Web de quais elementos extrair o atributo src. Na janela de filtro, verifique se o tipo está definido como 'Página da Web' e se a restrição é 'nome da tag' e 'igual a'. Então entre img na caixa de texto e clique no botão Adicionar e depois no botão Inserir filtro. Conclua a instrução adicionando um ponto-e-vírgula ao final da linha.

Você deve ficar com algo parecido com o que é mostrado abaixo.

Page.getTagAttributes('src', {"tag":{"equals":"img"}});

O código acima extrairá todos os URLs da imagem da página da web, mas agora precisamos usar esses URLs para save essas imagens como arquivos. Para fazer isso, envolveremos esse comando menos o ponto e vírgula em um Data.saveFile comando. Para fazer isso, vá para o início da linha e selecione o Botão de dados botão. Em seguida, no menu suspenso, selecione saveFile, vá para o final da linha e adicione um ) antes do ponto e vírgula.

Agora você deve ter as seguintes instruções de raspar.

Data.saveFile(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));

Agora, se você executar o raspar, extrairá todas as imagens do site. Muito deste tutorial também pode ter sido alcançado usando o botão do assistente na barra de ferramentas Instruções para raspar.