Como criar uma amostra: o REGEX na rotina da produção dos e-books (via Colofão)

21/08/2014
 / 

Confira o artigo de Joana De Conti, publicado no blog Colofão, que explica como criar uma amostra para arquivos ePub com menos trabalho manual.

No meu último texto, foi explicada a inusitada relação entre as amostras, aquele trecho do livro disponibilizado pelas lojas para que o leitor possa degustar e conhecer melhor o conteúdo que deseja comprar, e as expressões regulares, um sistema de busca avançado carinhosamente chamado de REGEX, que utiliza caracteres genéricos para fazer buscas e substituições.

Pretendo neste texto apresentar um exemplo prático de como criar uma amostra através de algumas etapas simples, sendo uma delas feita através do uso de uma expressão regular.

Vou utilizar um livro produzido por mim a título de exemplo, uma coletânea de contos de Machado de Assis, textos que estão em domínio público e são facilmente baixados no site do Ministério da Cultura.

A primeira etapa na criação da amostra é determinar qual será o seu tamanho. Utilizo como padrão na minha rotina até oito mil caracteres ou 10% do livro. Trata-se de uma etapa simples na qual eu copio do PDF um trecho inicial do livro, colo em algum editor de texto (tais como o Word ou o Writer) e identifico, pela contagem de caracteres, até que parte do livro será incluída na amostra. No exemplo em questão a amostra será composta dos primeiros dois contos, ou seja, aquilo que seria equivalente aos capítulos um e dois.

Meu próximo passo é excluir do arquivo ePub, utilizando o programa Sigil, todo o texto que não será parte da amostra. Ou seja, irei excluir os HMTLs dos contos três ao quinze. Para isso basta selecionar todos os HMTLs simultaneamente, clicar com o botão direito sobre eles e escolher a opção “Excluir”.

(Continue lendo no Colofão)

 

Chat via Whats (51) 98628-2293