Ferramentas para capturar e converter a Web

Como o GrabzIt converte HTML em DOCX

O HTML pode representar muitas estruturas complicadas, como DIVs embutidos ou SPANs lado a lado. Sobreposição de elementos HTML e bordas aplicadas a diferentes elementos HTML. Na maioria das vezes, isso não seria uma abordagem sensata no DOCX, embora fosse possível criar floatAo inserir elementos HTML com caixas de texto, quase todos os conteúdos seriam contidos nas caixas de texto, resultando em um documento do Word muito feio e confuso.

É por causa desse problema que ignoramos o floatcriação de elementos HTML e bordas da maioria dos elementos HTML. No entanto, respeitamos as bordas em alguns elementos HTML, como as células da tabela e o alinhamento nos elementos da imagem, por exemplo.

Isso significa que você não pode colocar conteúdo lado a lado? Não. Isso ainda é possível usando atributos CSS da coluna, Tabelas HTML e paradas de tabulação conforme descrito abaixo.

Se você quiser que um documento HTML seja capturado exatamente como mostrado na tela, seria melhor converter o HTML para PDF já que o formato de arquivo PDF usa posicionamento absoluto.

Paradas de tabulação

Paradas de tabulação são um recurso DOCX especial que é ativado se floatOs elementos HTML ing, com alinhamento de texto, estão contidos em um elemento HTML de largura de 100% que não possui alinhamento de texto específico. Isso é importante porque significa que o alinhamento normal não deve ser aplicado aos elementos filho. Isso é feito usando text-align:start. Observe que as paradas de tabulação não funcionam em uma tabela ou lista.

Um exemplo disso é mostrado abaixo.

<div style="width:100%;text-align:start">
   <div style="width:50%;text-align:left;float:left">Aligned One</div>
   <div style="width:50%;text-align:left;float:left">Aligned Two</div>
</div>