terça-feira, 10 de fevereiro de 2009

doc2odt: Converta seus documentos para um formato aberto e padronizado

Que tal converter seus arquivos do Microsoft Word pro OpenOffice? Utilizar um formato internacionalmente padronizado tem uma série de vantagens, sendo a principal delas você ter a possibilidade de abrir seu documento no programa que preferir:



Os arquivos .doc do famigerado Word além de serem grandes demais, a cada atualização do Microsoft Office ficam incompatíveis com versões anteriores do mesmo. Já os arquivos .odt são padronizados (ou seja, compatíveis com diversos softwares de edição de texto) e também bem menores (ex.: no caso do OpenOffice, já vem "automaticamente compactados"). Além disso, os documentos da família ODF (OpenDocumento format) consistem num formato aberto e público, aprovado como norma ISO/IEC e também pela Associação Brasileira de Normas Técnicas (ABNT).

É por essas e outras é que eu sempre utilizo o ODT como formato para documentos de texto. Na pior das hipóteses, quando necessito enviá-lo para algum usuário do Windows+MSOffice, converto-o para PDF e aproveito para sugerir que ele experimente o OpenOffice.

Porém, o que fazer quando obtém-se uma grande quantidade de documentos do Word? Converter manualmente um a um no OpenOffice via "Salvar como"? Felizmente, praticamente toda tarefa dita repetitiva pode ser automatizada pelo conputador, geralmente de maneira bem simples. Aqui no Ubuntu encontrei um programinha muito bom para este tipo de tarefa de "conversão em lote", chamado unoconv. Para instalá-lo basta executar num terminal:
sudo apt-get install unoconv
e execuar no diretório onde estão os arquivos do Word o seguinte comando:
find ./ -name "*.doc" -exec doc2odt {} \;
e pronto! Após alguns segundos todos seus documentos estarão convertidos para .odt, e com o bônus de seu tamanho cair praticamente pela metade :-)

Se você ficou satisfeito com o resultado, agora basta apagar os arquivos originais assim:
find ./ -name "*.doc" -exec rm -f {} \;
P.S.: o unoconv também possibilita converter para diversos outros formatos, como PDF e TXT, bastando informar o tipo de formato desejado com a opção -f.

Um comentário:

eduardorv disse...

Funciona com *.docx também. Muito legal sua postagem. Gostaria de tê-la descoberto há mais tempo.