Uma tarefa comum é baixar imagens de um site, com Raspador da Web do GrabzIt Isso é facil. Primeiro, crie um novo raspar com os detalhes normais, como a página inicial do raspar e outras opções.
Em seguida, vá para o Instruções para raspar guia e clique no botão. Isso entrará no Page palavra chave into as instruções de raspar e abrirá uma lista suspensa. Selecione getTagAttributes da lista. Próximo add 'src' como o primeiro parâmetro, isso indica ao raspador da Web para extrair o atributo src e digite uma vírgula.
Page
getTagAttributes
'src'
Em seguida, clique no isso permite que você informe ao raspador da Web de quais elementos extrair o atributo src. Na janela de filtro, verifique se o tipo está definido como 'Página da Web' e se a restrição é 'nome da tag' e 'igual a'. Então entre img na caixa de texto e clique no botão Adicionar e depois no botão Inserir filtro. Conclua a instrução adicionando um ponto-e-vírgula ao final da linha.
img
Você deve ficar com algo parecido com o que é mostrado abaixo.
Page.getTagAttributes('src', {"tag":{"equals":"img"}});
O código acima extrairá todos os URLs da imagem da página da web, mas agora precisamos usar esses URLs para save essas imagens como arquivos. Para fazer isso, envolveremos esse comando menos o ponto e vírgula em um Data.saveFile comando. Para fazer isso, vá para o início da linha e selecione o botão. Em seguida, no menu suspenso, selecione saveFile, vá para o final da linha e adicione um ) antes do ponto e vírgula.
Data.saveFile
saveFile
)
Agora você deve ter as seguintes instruções de raspar.
Data.saveFile(Page.getTagAttributes('src', {"tag":{"equals":"img"}}));
Agora, se você executar o raspar, extrairá todas as imagens do site. Muito deste tutorial também pode ter sido alcançado usando o botão do assistente na barra de ferramentas Instruções para raspar.