Ferramentas para capturar e converter a Web

Grandes melhorias no raspador da Web para o 2019

08 Março de 2019

Além de um novo design e uma série de correções, fizemos melhorias drásticas no raspador da Web do GrabzIt, que incluem:

  • Suporte à extração de conteúdo contido em estilos CSS
  • Agora você pode escolher o país a partir do qual um raspar é executado. No momento, as opções são EUA ou Reino Unido.
  • Agora você pode escolher se respeita ou não as regras do robots.txt. Por padrão, um raspar faz.
  • Os dados relativos agora podem ser automaticamente associados juntos, isso é útil quando você tem dados presentes em alguns elementos HTML, mas não em outros. Ao associar esses itens, os valores aparecerão nos itens de dados corretos no conjunto de dados resultante.
  • Ao criar um conjunto de dados, diferentes colunas podem pertencer a diferentes modelos, o que significa que algumas colunas podem ser preenchidas em um tipo de página e outras em diferentes tipos de página. Um exemplo disso seria uma página de listagem de produtos e uma página de detalhes do produto. Isso permitiria obter detalhes amplos na página de listagem e, em seguida, informações detalhadas na página de detalhes do produto.
  • Outra maneira de melhorar o construtor de conjuntos de dados é permitir que os efeitos de uma operação, como a contains, less than etc sejam aplicados a todas ou algumas colunas.
  • Agora existem vários novos comandos disponível no assistente de raspar.
    • Excluir - agora você pode excluir elementos, o que é útil em algumas circunstâncias para impedir que os mesmos elementos sejam lidos várias vezes.
    • Rolagem - o raspador da Web agora pode rolar os elementos HTML compatíveis.
    • Passe o mouse - esse comando passa o mouse sobre um elemento especificado, o que pode ser útil para revelar informações.
    • Paginação - esse é um novo recurso da ação Clique e permite que a paginação seja executada automaticamente nos links de paginação selecionados. Isso significa que, mesmo que o raspador clique em algum lugar nos dados paginados, como parte da raspagem, ele retornará à página paginada atual para continuar com a raspagem.
  • A melhor parte sobre o GrabzIt Raspador da Web é que você pode usá-lo gratuitamente todos os meses. Então, o que você está esperando? Experimente e por favor, devolva-nos qualquer comentário que desejar. Gostaríamos de fazer do nosso o melhor raspador da web online!

Ver as últimas postagens do blog