Ferramentas para capturar e converter a Web

Grandes melhorias no raspador da Web para o 2019

Sexta-feira, Março 8, 2019

Al√©m de um novo design e uma s√©rie de corre√ß√Ķes, fizemos melhorias dr√°sticas no raspador da Web do GrabzIt, que incluem:

  • Suporte √† extra√ß√£o de conte√ļdo contido em estilos CSS
  • Agora voc√™ pode escolher o pa√≠s a partir do qual um raspar √© executado. No momento, as op√ß√Ķes s√£o EUA ou Reino Unido.
  • Agora voc√™ pode escolher se respeita ou n√£o as regras do robots.txt. Por padr√£o, um raspar faz.
  • Os dados relativos agora podem ser automaticamente associados juntos, isso √© √ļtil quando voc√™ tem dados presentes em alguns elementos HTML, mas n√£o em outros. Ao associar esses itens, os valores aparecer√£o nos itens de dados corretos no conjunto de dados resultante.
  • Ao criar um conjunto de dados, diferentes colunas podem pertencer a diferentes modelos, o que significa que algumas colunas podem ser preenchidas em um tipo de p√°gina e outras em diferentes tipos de p√°gina. Um exemplo disso seria uma p√°gina de listagem de produtos e uma p√°gina de detalhes do produto. Isso permitiria obter detalhes amplos na p√°gina de listagem e, em seguida, informa√ß√Ķes detalhadas na p√°gina de detalhes do produto.
  • Outra maneira de melhorar o construtor de conjuntos de dados √© permitir que os efeitos de uma opera√ß√£o, como a contains, less than etc sejam aplicados a todas ou algumas colunas.
  • Agora existem v√°rios novos comandos dispon√≠vel no assistente de raspar.
    • Excluir - agora voc√™ pode excluir elementos, o que √© √ļtil em algumas circunst√Ęncias para impedir que os mesmos elementos sejam lidos v√°rias vezes.
    • Rolagem - o raspador da Web agora pode rolar os elementos HTML compat√≠veis.
    • Passe o mouse - esse comando passa o mouse sobre um elemento especificado, o que pode ser √ļtil para revelar informa√ß√Ķes.
    • Pagina√ß√£o - esse √© um novo recurso da a√ß√£o Clique e permite que a pagina√ß√£o seja executada automaticamente nos links de pagina√ß√£o selecionados. Isso significa que, mesmo que o raspador clique em algum lugar nos dados paginados, como parte da raspagem, ele retornar√° √† p√°gina paginada atual para continuar com a raspagem.
  • A melhor parte sobre o GrabzIt Raspador da Web √© que voc√™ pode us√°-lo gratuitamente todos os meses. Ent√£o, o que voc√™ est√° esperando? Experimente e por favor, devolva-nos qualquer coment√°rio que desejar. Gostar√≠amos de fazer do nosso o melhor raspador da web online!

Ver as √ļltimas postagens do blog