Ferramentas para capturar e converter a Web

API do raspador da Web do GrabzIt, dados como serviço!

Por meio da API do raspador da Web do GrabzIt, podemos fornecer à sua aplicação dados raspados como um serviço da Web, permitindo que você integrate raspou informações de volta into seu aplicativo. o integração de dados into seu aplicativo é alcançado por meio de um manipulador de retorno de chamada, que é um script ou aplicativo em um URL acessível ao público que processa os dados enviados de Raspador da Web do GrabzIt. Os arquivos completos são postados nesse manipulador de retorno de chamada seqüencialmente. Por exemplo, ele pode começar com uma série de imagens antes de terminar com um JSON arquivo, os dados no arquivo JSON poderiam ser facilmente analisados ​​usando os métodos auxiliares na biblioteca do cliente. Essa API também permite que seu aplicativo controle automaticamente quando os rascunhos iniciam e param, além de solicitar que os resultados sejam reenviados.

Para começar primeiro criar um arranhão em seguida, escolha Opção URL de retorno de chamada na guia Opções de exportação e insira o URL para o manipulador de retorno de chamada, por exemplo http://www.example.com/handler/

Se você estiver tendo problemas com o manipulador de retorno de chamada, escolha o modo Debug na guia Opções de raspar. Isso produzirá a resposta retornada pelo manipulador de retorno de chamada into os logs.

Manipulador de retorno de chamada

Para processar dados raspados dentro do manipulador de retorno de chamada, escolha as opções JSON ou XML na guia Exportar, pois isso retorna os dados em um formato que pode ser facilmente lido por qualquer linguagem orientada a objetos.

Para dados que não são dados JSON ou XML, suas opções de processamento são limitadas, pois os dados não são muito legíveis por máquina, portanto, a melhor opção é save o arquivo em disco ou em um banco de dados.

Para ajudar o intprocesso de integração O GrabzIt fornece as seguintes APIs do raspador para os idiomas abaixo. No entanto, como nosso código é de código aberto e disponível em GitHub não há motivo para que você não possa criar um para uma linguagem de programação não listada aqui ou peça para que crie uma biblioteca para você. Se sim, por que não compartilhá-lo com o mundo?

API do Raspador do ASP.NET API do raspador PHP API do raspador Python

Embora o manipulador de retorno de chamada seja a melhor maneira de integrating o raspador da web do GrabzIt com sua aplicação, você também pode integrate via Amazon S3, Dropbox, FTP e WebDav.