Uma tarefa comum é baixar imagens de um site, com Raspador da Web do GrabzIt Isso é facil. Primeiro, crie um novo raspar com os detalhes normais, como a página inicial do raspar e outras opções.
Em seguida, vá para o Instruções para raspar guia e clique no botão. Isso entrará no
Page
palavra chave into as instruções de raspar e abrirá uma lista suspensa. Selecione getTagAttributes
da lista. Próximo add 'src'
como o primeiro parâmetro, isso indica ao raspador da Web para extrair o atributo src e digite uma vírgula.
Em seguida, clique no isso permite que você informe ao raspador da Web de quais elementos extrair o atributo src. Na janela de filtro, verifique se o tipo está definido como 'Página da Web' e se a restrição é 'nome da tag' e 'igual a'. Então entre
img
na caixa de texto e clique no botão Adicionar e depois no botão Inserir filtro. Conclua a instrução adicionando um ponto-e-vírgula ao final da linha.
Você deve ficar com algo parecido com o que é mostrado abaixo.
Page.getTagAttributes('src', {"tag":{"equals":"img"}});
O código acima extrairá todos os URLs da imagem da página da web, mas agora precisamos usar esses URLs para save essas imagens como arquivos. Para fazer isso, envolveremos esse comando menos o ponto e vírgula em um Data.saveFile
comando. Para fazer isso, vá para o início da linha e selecione o botão. Em seguida, no menu suspenso, selecione
saveFile
, vá para o final da linha e adicione um )
antes do ponto e vírgula.
Agora você deve ter as seguintes instruções de raspar.
Data.saveFile(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
Agora, se você executar o raspar, extrairá todas as imagens do site. Muito deste tutorial também pode ter sido alcançado usando o botão do assistente na barra de ferramentas Instruções para raspar.