Selecionando a codificação de texto ao abrir e salvar arquivos. Converta documentos do Word com um comando Conversor para exibir o arquivo do Word corretamente

Lar / Não liga

Quando você abre arquivo de texto V Microsoft Word ou outro programa (por exemplo, em um computador, idioma sistema operacional que é diferente daquele em que o texto do arquivo é escrito), a codificação ajuda o programa a determinar de que forma o texto precisa ser exibido na tela para que possa ser lido.

Neste artigo

Compreendendo a codificação de texto

O texto que aparece como texto na tela é, na verdade, armazenado como valores numéricos em um arquivo de texto. O computador traduz valores numéricos em símbolos visíveis. Um padrão de codificação é usado para isso.

Uma codificação é um esquema de numeração no qual cada caractere de texto em um conjunto corresponde a um caractere específico. valor numérico. A codificação pode conter letras, números e outros símbolos. Idiomas diferentes geralmente usam conjuntos de caracteres diferentes, portanto, muitas das codificações existentes são projetadas para representar os conjuntos de caracteres de seus respectivos idiomas.

Codificações diferentes para alfabetos diferentes

As informações de codificação salvas com o arquivo de texto são usadas pelo computador para exibir o texto na tela. Por exemplo, na codificação "Cirílico (Windows)", o caractere "Y" corresponde ao valor numérico 201. Ao abrir um arquivo contendo este caractere em um computador que usa a codificação "Cirílico (Windows)", o computador lê o número 201 e exibe o sinal "Y".

Porém, se o mesmo arquivo for aberto em um computador que utiliza uma codificação diferente por padrão, o caractere correspondente ao número 201 nesta codificação será exibido na tela. Por exemplo, se o seu computador utiliza a codificação "Europa Ocidental (Windows)", o caractere "Y" do arquivo de texto fonte baseado no alfabeto cirílico será exibido como "É", pois este é o caractere que corresponde ao número 201 nesta codificação.

Unicode: uma codificação única para diferentes alfabetos

Para evitar problemas com codificação e decodificação de arquivos de texto, você pode salvá-los em Unicode. Essa codificação inclui a maioria dos caracteres de todos os idiomas comumente usados ​​em computadores modernos.

Como o Word é baseado em Unicode, todos os arquivos nele contidos são salvos automaticamente nesta codificação. Arquivos Unicode podem ser abertos em qualquer computador com sistema operacional Inglês independentemente do idioma do texto. Além disso, nesse computador você pode salvar arquivos em Unicode que contenham caracteres que não estejam nos alfabetos da Europa Ocidental (por exemplo, grego, cirílico, árabe ou japonês).

Selecionando codificação ao abrir um arquivo

Se em abrir arquivo o texto está distorcido ou aparece como pontos de interrogação ou quadrados; o Word pode ter determinado a codificação incorretamente. Você pode especificar a codificação a ser usada para exibir (decodificar) texto.

    Abra a guia Arquivo.

    Clique no botão Opções.

    Clique no botão Adicionalmente.

    Vá para a seção Em geral e marque a caixa Confirme a conversão do formato de arquivo ao abrir.

    Observação: Quando esta caixa de seleção é marcada, o Word exibe uma caixa de diálogo Conversão de arquivo Sempre que você abrir um arquivo em um formato diferente do Word (ou seja, um arquivo que não possui extensão DOC, DOT, DOCX, DOCM, DOTX ou DOTM). Se você trabalha frequentemente com esses tipos de arquivos, mas normalmente não precisa selecionar uma codificação, desative esta opção para evitar que esta caixa de diálogo apareça.

    Feche e reabra o arquivo.

    Na caixa de diálogo Conversão de arquivo selecione o item Texto codificado.

    Na caixa de diálogo Conversão de arquivo definir o interruptor Outro e selecione a codificação desejada na lista.

    Na área Amostra

Se quase todo o texto parecer igual (por exemplo, quadrados ou pontos), seu computador pode não ter fonte desejada. Neste caso, você pode instalar fontes adicionais.

Para instalar fontes adicionais, faça o seguinte:

    Clique no botão Começar e selecione Painel de controle.

    Faça um dos seguintes:

    No Windows 7

    1. No Painel de Controle, selecione o item Desinstalando programas.

      Mudar.

    EM Windows Vista

      No painel de controle, selecione a seção Desinstalando um programa.

      Na lista de programas, clique em Microsoft Office ou Microsoft Word se tiver sido instalado separadamente do Microsoft Office e clique em Mudar.

    No Windows XP

      No Painel de Controle, clique em Instalando e removendo programas.

      Na lista Programas instalados Clique em Microsoft Office ou Microsoft Word se tiver sido instalado separadamente do Microsoft Office e clique em Mudar.

    Em um grupo Mudar Instalações da Microsoft Escritório clique no botão Adicionar ou remover componentes e depois clique no botão Continuar.

    Na seção Opções de instalação expandir o elemento Em geral Ferramentas de escritório , e então - Suporte multilíngue.

    Selecione a fonte desejada, clique na seta ao lado dela e selecione Executar do meu computador.

Conselho: Ao abrir um arquivo de texto em uma codificação ou outra, o Word usa as fontes definidas na caixa de diálogo Opções de documentos da Web. (Para abrir a caixa de diálogo Opções de documentos da Web, imprensa Botão da Microsoft Escritório e clique em Opções de palavras e selecione uma categoria Adicionalmente. Na seção Em geral clique no botão Opções de documentos da Web.) Usando as opções da guia Fontes caixa de diálogo Opções de documentos da Web Você pode personalizar a fonte para cada codificação.

Selecionando a codificação ao salvar um arquivo

Se você não selecionar uma codificação ao salvar o arquivo, Unicode será usado. Em geral, o Unicode é recomendado porque suporta a maioria dos caracteres na maioria dos idiomas.

Se você planeja abrir o documento em um programa que não suporta Unicode, você pode selecionar a codificação desejada. Por exemplo, em um sistema operacional em inglês, você pode criar um documento em chinês tradicional usando Unicode. No entanto, se tal documento for aberto em um programa que suporte chinês, mas não suporte Unicode, o arquivo poderá ser salvo na codificação "Chinês Tradicional (Big5)". Como resultado, o texto será exibido corretamente quando você abrir o documento em um programa que ofereça suporte ao chinês tradicional.

Observação: Como o Unicode é o mais padrão completo, ao salvar texto em outras codificações, alguns caracteres podem não ser exibidos. Por exemplo, suponha que um documento Unicode contenha texto em hebraico e cirílico. Se você salvar o arquivo na codificação "Cirílico (Windows)", o texto em hebraico não será exibido, e se você salvá-lo na codificação "Hebraico (Windows)", o texto em cirílico não será exibido.

Se você selecionar um padrão de codificação que não suporte alguns caracteres no arquivo, o Word os marcará em vermelho. Você pode visualizar o texto na codificação selecionada antes de salvar o arquivo.

Quando você salva um arquivo como texto codificado, o texto para o qual a fonte Símbolo está selecionada, bem como os códigos de campo, são removidos do arquivo.

Seleção de codificação

    Abra a guia Arquivo.

    No campo Nome do arquivo insira um nome para o novo arquivo.

    No campo Tipo de arquivo selecione Texto simples.

    Se uma caixa de diálogo aparecer Microsoft Office Word - Verificação de compatibilidade, pressione o botão Continuar.

    Na caixa de diálogo Conversão de arquivo selecione a codificação apropriada.

    • Para usar a codificação padrão, selecione a opção Windows (padrão).

      Para usar a codificação MS-DOS, selecione a opção MS DOS.

      Para definir uma codificação diferente, selecione o botão de opção Outro e selecione o item desejado na lista. Na área Amostra você pode visualizar o texto e verificar se ele é exibido corretamente na codificação selecionada.

      Observação: Para aumentar a área de exibição do documento, você pode redimensionar a caixa de diálogo Conversão de arquivo.

    Se aparecer a mensagem "O texto em vermelho não pode ser salvo corretamente na codificação selecionada", você pode selecionar uma codificação diferente ou marcar a caixa Permitir substituição de caracteres.

    Se a substituição de caracteres estiver habilitada, os caracteres que não podem ser exibidos serão substituídos pelos caracteres equivalentes mais próximos na codificação selecionada. Por exemplo, as reticências são substituídas por três pontos e as aspas dos cantos são substituídas por retas.

    Caso a codificação selecionada não possua caracteres equivalentes aos caracteres destacados em vermelho, eles serão armazenados fora de contexto (por exemplo, como pontos de interrogação).

    Se o documento for aberto em um programa que não quebra o texto de uma linha para outra, você poderá habilitar quebras de linha nele. Para fazer isso, marque a caixa Inserir quebras de linha e especifique o símbolo de quebra desejado (retorno de carro (CR), avanço de linha (LF) ou ambos) no Linhas finais.

Encontrando codificações disponíveis no Word

O Word reconhece várias codificações e oferece suporte às codificações incluídas no software do sistema.

Abaixo está uma lista de scripts e suas codificações associadas (páginas de código).

Sistema de escrita

Codificações

Fonte usada

Multilíngue

Unicode (UCS-2 little endian, UTF-8, UTF-7)

Fonte padrão para o estilo "Normal" da versão localizada do Word

árabe

Janelas 1256, ASMO 708

Chinês (simplificado)

GB2312, GBK, EUC-CN, ISO-2022-CN, Hz

Chinês (escrita tradicional)

BIG5, EUC-TW, ISO-2022-TW

cirílico

Janelas 1251, KOI8-R, KOI8-RU, ISO8859-5, DOS 866

Inglês, Europeu Ocidental e outros baseados no alfabeto latino

Janelas 1250, 1252-1254, 1257, ISO8859-x

grego

japonês

Shift-JIS, ISO-2022-JP (JIS), EUC-JP

coreano

Wansung, Johab, ISO-2022-KR, EUC-KR

vietnamita

Indiano: Tâmil

Indiano: nepalês

ISCII 57002 (Devanágari)

Indiano: Concani

ISCII 57002 (Devanágari)

Indiano: Hindi

ISCII 57002 (Devanágari)

Indiano: Assamês

Indiano: bengali

Indiano: Guzerate

Indiano: Kannada

Indiano: malaiala

Indiano: Oriya

Indiano: Marathi

ISCII 57002 (Devanágari)

Indiano: Punjabi

Indiano: Sânscrito

ISCII 57002 (Devanágari)

Indiano: Telugu

    Para usar idiomas indianos, você precisa suportá-los no sistema operacional e ter as fontes OpenType apropriadas.

    Apenas suporte limitado está disponível para nepalês, assamês, bengali, gujarati, malaiala e oriya.

Análise

Usuários do Microsoft Office XP e 2003 Word, Excel ou PowerPoint: Instale atualizações de alta prioridade do site do Microsoft Update antes de baixar o Pacote de Compatibilidade.

Ao instalar o Pacote de Compatibilidade como um complemento do Microsoft Office 2000, Office XP ou Office 2003, você pode abrir, editar e salvar arquivos nos novos formatos de arquivo usados ​​no versões mais recentes Programas Word, Excel e PowerPoint. Você também pode usar o Pacote de Compatibilidade com os visualizadores do Microsoft Office Word 2003, Excel 2003 e PowerPoint 2003 para visualizar arquivos salvos em novos formatos. Para obter mais informações sobre o Pacote de Compatibilidade, consulte o Artigo 924074 da Base de Conhecimento.

Observação. Se o Microsoft Word 2000 ou o Microsoft Word 2002 for usado para ler ou gravar documentos que contenham um conjunto de caracteres complexos, para exibição correta Documentos do Word Para versões mais recentes da aplicação, consulte a informação contida no artigo 925451.

Administradores: você pode baixar o modelo administrativo para conversores Word, Excel e PowerPoint incluídos no Pacote de Compatibilidade.

Atualizar. O Pacote de Compatibilidade do Microsoft Office foi atualizado para incluir o Service Pack 2 (SP2). Agora se Arquivos DOCX ou DOCM contiverem tags XML personalizadas, as tags serão removidas quando o arquivo for aberto no Word 2003. Para obter mais informações, consulte KB978951

Requisitos do sistema

Sistemas operacionais:

Windows 2000 Service Pack 4, Servidor Windows 2003, Windows Vista, Windows Vista Service Pack 1, Windows XP Service Pack 1, Windows XP Service Pack 2, Windows XP Service Pack 3
Windows 7; Windows Server 2008

Microsoft Word 2000 SP3 Excel 2000 SP3 e PowerPoint 2000SP3

Microsoft Word 2002 SP3, Microsoft Excel 2002 SP3 e Microsoft PowerPoint 2002 SP3

Microsoft Office Word 2003 SP1 ou posterior, Microsoft Office Excel 2003 SP1 ou posterior e Microsoft Office PowerPoint 2003 SP1 ou posterior

Visualizador do Microsoft Office Word 2003.

Visualizador do Microsoft Office Excel 2003

Visualizador do Microsoft Office PowerPoint 2003

Instruções

Instalando a atualização
Certifique-se de que seu sistema esteja atualizado instalando atualizações de alta prioridade e atualizações obrigatórias baixadas do site Microsoft Update (necessárias para Usuários da Microsoft OfficeXP e 2003).

Depois de instalar as atualizações de alta prioridade e as atualizações necessárias do site do Microsoft Update, baixe o pacote de compatibilidade clicando no botão Baixar acima e salvando o arquivo em seu disco rígido.

Para executar o instalador, clique duas vezes no arquivo executável FileFormatConverters.exe salvo em seu disco rígido.

Conclua a instalação seguindo as instruções na tela.

Excluindo um arquivo de download

No menu operacional "Iniciar" Sistemas Windows Clique no ícone do Painel de Controle.

Selecione Adicionar ou remover programas.

Na lista programas instalados selecione Pacote de Compatibilidade para versão 2007 Sistemas de escritório e clique em Remover ou Adicionar ou Remover. Quando uma caixa de diálogo aparecer, siga as instruções para desinstalar o programa.

Clique em Sim ou OK para confirmar a exclusão do programa.


Para obter o texto completo do Pacote de Compatibilidade do Microsoft Office 2010 para formatos de arquivo Word, Excel e PowerPoint, consulte o arquivo para download.
A página contém um fragmento.

PARA QUEM TEM MICROSOFT OFFICE ANTIGO INSTALADO, COMO 97, 2003, 2007 e 2010

PARA COMPATIBILIDADE DE FORMATOS DE ESCRITÓRIO, INSTALE O SOFTWARE APROPRIADO.

para que novos formatos abram em versões antigas

Análise

Usuários do Microsoft Office XP e 2003 Word, Excel ou PowerPoint: Antes de baixar o Pacote de Compatibilidade instalar atualizações de alta prioridade do site Atualização da Microsoft antes de baixar o pacote de compatibilidade Ao instalar o Pacote de Compatibilidade como um complemento do Microsoft Office 2000, Office XP ou Office 2003, você pode abrir, editar e salvar arquivos nos novos formatos de arquivo usados ​​nas versões mais recentes do Word, Excel e PowerPoint. Você também pode usar o Pacote de Compatibilidade com os visualizadores do Microsoft Office Word 2003, Excel 2003 e PowerPoint 2003 para visualizar arquivos salvos em novos formatos. Para obter mais informações sobre o Pacote de Compatibilidade, consulte o artigo da Base de Conhecimento.

Observação. Se você usar o Microsoft Word 2000 ou o Microsoft Word 2002 para ler ou gravar documentos que contenham caracteres complexos, consulte as informações deste artigo para garantir que os documentos do Word sejam exibidos corretamente nas versões mais recentes do aplicativo.

Administradores: Você pode baixar o modelo administrativo para conversores Word, Excel e PowerPoint incluídos no Pacote de Compatibilidade.

Atualizar. O Pacote de Compatibilidade do Microsoft Office foi atualizado para incluir o Service Pack 2 (SP2). Agora, se os arquivos DOCX ou DOCM contiverem tags XML personalizadas, as tags serão removidas quando o arquivo for aberto no Word 2003. Para obter mais informações, consulte KB978951

Requisitos do sistema

  • Sistemas operacionais: Windows 2000 Service Pack 4, Windows Server 2003, Windows Vista, Windows Vista Service Pack 1, Windows XP Service Pack 1, Windows XP Service Pack 2, Windows XP Service Pack 3
    Windows 7; Windows Server 2008
  • Apresentou Programas da Microsoft Escritório:
    • Microsoft Word 2000 SP3, Microsoft Excel 2000 SP3 e Microsoft PowerPoint 2000 SP3
  • Microsoft Word 2002 SP3, Microsoft Excel 2002 SP3 e Microsoft PowerPoint 2002 SP3
  • Microsoft Office Word 2003 SP1 ou posterior, Microsoft Office Excel 2003 SP1 ou posterior e Microsoft Office PowerPoint 2003 SP1 ou posterior
  • Visualizador do Microsoft Office Word 2003.
  • Visualizador do Microsoft Office Excel 2003
  • Visualizador do Microsoft Office PowerPoint 2003

Instruções

Instalando a atualização

  1. Certifique-se de que seu sistema esteja atualizado instalando atualizações de alta prioridade e atualizações necessárias baixadas do site do Microsoft Update (obrigatório para usuários do Microsoft Office XP e 2003).
  1. Depois de instalar as atualizações de alta prioridade e as atualizações necessárias do site do Microsoft Update, baixe o pacote de compatibilidade clicando no botão acima e salvando o arquivo em seu disco rígido.
  1. Para executar o instalador, clique duas vezes no arquivo executável salvo em seu disco rígido FileFormatConverters.exe.
  1. Conclua a instalação seguindo as instruções na tela.

Excluindo um arquivo de download

Na resolução de problemas cotidianos de TI, como administração de rede e suporte ao usuário, diversos arquivos são frequentemente utilizados, principalmente documentos compilados em editores de texto. Infelizmente, embutido Ferramentas do Windows permitem que você trabalhe com documentos apenas como arquivos; as ferramentas padrão não lidam com dados internos do Word, como conversão de tipo de documento.

Elaborei um script WSH (Windows Script Host) chamado ConvertWord que é usado como um shell de comando para o Microsoft Word e facilita o trabalho com documentos. Além disso, o script pode ser útil para testar documentos incorretos.

Requisitos do ConvertWord

Para usar o ConvertWord, você deve ter o Word 97 ou posterior instalado em seu computador editor de texto. O texto fonte completo do ConvertWord pode ser baixado do site da nossa revista. Trechos do script ConvertWord estão abaixo. Os arquivos convertword.wsf e convertword.cmd devem ser salvos na mesma pasta.

ConvertWord pode usar automaticamente qualquer conversor formatos de arquivo, implementado no Word. O Word vem com um conjunto básico de conversores de formato de arquivo para documentos típicos. No entanto, este conjunto não inclui conversores especiais, por exemplo para Documentos da Microsoft Funciona ou WordPerfect. Para obter estes e outros conversores opcionais, você deve executar instalação especial Palavra.

Os conversores padrão do Word incluídos nos Resource Kits do Microsoft Office podem ser baixados na página do Office 2003 Editions Resource Kit em http://www.microsoft.com/office/ork/2003/default.htm . Os conversores do pacote de recursos são compatíveis com o Word 97 e versões mais recentes do editor. Após instalar o pacote de recursos, você deve ir ao diretório criado (\%programfiles%orktools por padrão) e encontrar o arquivo com o conjunto de conversores (oconvpck.exe) e, em seguida, executar oconvpck.exe em todos os computadores nos quais deseja implantar os conversores.

Objetivo do ConvertWord

O objetivo original da criação do ConvertWord era realizar algumas tarefas que não eram possíveis com o Assistente de conversão em lote Editor de palavras. O Assistente de conversão em lote é uma adição útil ao kit de ferramentas de qualquer administrador. O assistente é um modelo do Word que converte um formato de entrada em um formato de saída. Mais informações detalhadas sobre tal conversão pode ser encontrada no artigo da Microsoft “Como converter automaticamente muitos documentos para o formato Word 2002” em http://support.microsoft.com/?kbid=313714.

O Assistente de conversão em lote executa muitas tarefas, mas não é otimizado para algumas delas, como administração remota ou automatização de conversões simples para usuários finais que compartilham documentos em sites de rede separados. O ConvertWord pode ajudá-lo a resolver esses problemas de conversão distribuída executando as seguintes operações básicas.

  • Envia uma solicitação ao sistema sobre a versão do Word que possui.
  • Abre automaticamente listas de tipos de documentos mistos de comprimento arbitrário.
  • Garantido para salvar documentos com nomes exclusivos em Word (padrão) ou outros formatos.
  • Testa documentos para procurar problemas de formatação e senhas de usuário incorretas.

Como funciona o ConvertWord

O processo de conversão do ConvertWord é um processo de quatro etapas. Na primeira etapa, o script gera uma instância da aplicação Word, conforme mostrado no trecho listagem 1 rotulado como A. Parte do código-fonte do script foi projetada para reduzir o número de caixas de diálogo tanto quanto possível. Por exemplo, texto fonte rotulado como blocos B caixas de diálogo quando possível.

Na segunda etapa, o ConvertWord abre cada documento. O objeto Word contém uma coleção de Documentos; ao chamar o método Open deste conjunto (o fragmento rotulado A em listagem 2) o documento é recuperado. Se você souber o nome do documento e quiser que o Word detecte automaticamente seu formato, poderá chamar o método apenas com o nome do documento como argumento.

Ou você pode especificar o formato do documento como outro parâmetro para o método Open. Infelizmente, dependendo da versão do Word, o método Open requer até 16 parâmetros. Como o parâmetro de controle de formato está em décimo lugar, os nove parâmetros anteriores devem ser especificados. O resultado é uma corda longa e pesada. Informações sobre os parâmetros podem ser obtidas em http://msdn.microsoft.com/library/default.asp?url=/library/enus/dv_wrcore/html/wrconwordobjectmodeloverview.asp ou na Ajuda do Word.

As opções do ConvertWord são FileName, ConfirmConversions, ReadOnly, AddToRecentFiles, PasswordDocument, PasswordTemplate, Revert, WritePasswordDocument, WritePasswordTemplate e Format. O parâmetro FileName é o nome do arquivo do documento do Word. Você pode usar o parâmetro ConfirmConversions para exibir uma caixa de diálogo quando o Word converte um documento aberto. No ConvertWord, este parâmetro é sempre definido como False para facilitar a automação.

O parâmetro ReadOnly controla o processo de abertura de um documento somente leitura; ConvertWord sempre atribui este parâmetro Valor verdadeiro para que o documento original permaneça inalterado. AddToRecentFiles determina se o documento aberto será adicionado à lista RecentFiles do usuário atual. O documento pode ter dezenas ou até centenas, portanto não é recomendado adicioná-lo à lista e o parâmetro é definido como False.

PasswordDocument é a senha para abrir documentos protegidos e PasswordTemplate é a senha para modelos. Esses valores não são úteis para documentos que não sejam do Word, portanto, em vez de qualquer parâmetro, você pode especificar dois aspas duplas("") indicando uma string vazia. O parâmetro Reverter determina se o script reverterá para a versão atualmente aberta do documento se o documento que está sendo convertido já estiver aberto. ConvertWord define este parâmetro como True para evitar a perda de alterações e ativar apenas a instância aberta do documento.

Os parâmetros WritePasswordDocument e WritePasswordTemplate especificam as senhas necessárias para salvar documento aberto ou modelo. Para os fins deste artigo, esses parâmetros são opcionais porque o ConvertWord não substitui o documento original; portanto, o script especifica "" para cada um desses argumentos.

Finalmente, o parâmetro Format é um número que indica o método que o Word utiliza para determinar o formato do documento aberto. Acertar o número não é fácil porque os números e os métodos que eles representam dependem de versão instalada Word, conversores de documentos adicionais e procedimentos de instalação. Digamos que precisamos abrir e converter um documento RTF (Rich Text Format) com código de abertura de formato 3. Para abrir o documento de amostra usando um conversor RTF padrão, use o seguinte procedimento:

Definir doc = Word.Documents._

Open("c:meu.rtf",Falso, _

Verdadeiro, Falso, "", "", _

Verdadeiro, "", "", 3)

Algumas linhas código fonte Este artigo está dividido em várias linhas por falta de espaço. Uma lista de conversores de documentos adicionais com números correspondentes e extensões padrão pode ser encontrada usando o conjunto de objetos FileConverters. O código-fonte na Listagem 3 mostra uma lista desses conversores. Não há conversores padrão do Word listados. Uma lista de conversores padrão do Word pode ser encontrada em mesa 1 e na ajuda do Word.

A rotina CreateFormatCollections do script ConvertWord exibe uma lista de conversores do Word. Embora o script simplifique um pouco a tarefa de determinar os formatos de abertura e salvamento, o formato usado para abrir ou salvar um documento depende da versão do Word e de como os conversores estão instalados.

Depois de abrir o documento nova versão salvo usando o método SaveAs (fragmento rotulado A em listagem 4). O método SaveAs leva até 16 parâmetros, mas precisamos apenas de dois, pois o parâmetro SaveFormat necessário é o segundo. Assim como acontece com os parâmetros OpenFormat, você deve especificar os códigos de formato do documento que está abrindo no parâmetro SaveFormat. Para especificar o formato de salvamento - por exemplo, para salvar o documento em um arquivo puramente de texto C:my.txt - você deve inserir o comando

doc.SaveAs "C:meu.txt", 2

Após salvar o documento, o ConvertWord o fecha utilizando o método Close (rótulo B na Listagem 4). False indica que o Word deve descartar as alterações se o documento for alterado após ser salvo. Quando o script abre, salva e fecha sequencialmente todos os documentos, última etapa sairá do Word chamando o método Quit Programas de palavras (listagem 5).

Aplicação do ConvertWord

Antes de iniciar o ConvertWord pela primeira vez, é útil familiarizar-se com as informações sobre sua versão local do Word executando o comando

converter palavra/versão

Este comando mostra informações importantes, incluindo o número da versão do Word instalado na máquina. A Microsoft parou de colocar o número da versão no nome do produto começando com Office 95 (que seria chamado de Office 7), mas o número da versão interna aumenta em 1 a cada atualização importante subsequente. O mesmo esquema de numeração é usado no Word como componente do pacote Office. Os números de versão internos são 8 (Word 97), 9 (Word 2000), 10 (Word 2002) e 11 (Word 2003).

Por padrão, o ConvertWord abre arquivos automaticamente, faz suposições fundamentadas sobre seu formato (por exemplo, Word, Texto Simples, WordPerfect, RTF) e os salva como documentos do Word, dando-lhes nomes exclusivos que consistem no nome do arquivo, um sublinhado e um número. O ConvertWord oferece várias maneiras de nomear documentos. O nome do arquivo pode ser inserido como argumento para o seguinte comando:

converter palavra unicode.txt plain.txt

Outrodocscorel.wps

Essa abordagem resulta em arquivos de saída do Word sendo salvos como unicode.doc, plain.doc e otherdocscorel.doc. Outra opção é configurar o ConvertWord para ler arquivos de uma fonte padrão, como esta:

converter palavra

Os resultados de um comando que cria uma lista de arquivos podem ser enviados ao ConvertWord da seguinte forma:

dir /s /b c:caixa de entrada*.txt

| converter palavra

Se nenhuma entrada for especificada, o ConvertWord solicitará nomes de documentos de entrada até que você pressione Ctrl+C duas vezes.

ConvertWord possui um método simples que permite evitar a substituição de arquivos com o mesmo nome. Digamos que você queira salvar um arquivo do Word como um arquivo de texto chamado mylist.txt. Se já existir um arquivo com o mesmo nome, o ConvertWord começa a iterar pela sequência de nomes derivados - minhalista_1.txt, minhalista_2.txt, etc. - até que um nome não utilizado seja encontrado. Este nome é então atribuído ao arquivo salvo. Normalmente, procurar um nome de arquivo leva menos tempo do que abrir e salvar manualmente um documento.

Alterando o local de armazenamento e o nome do arquivo

O ConvertWord salva os arquivos na mesma pasta onde está localizado. arquivo de origem, com o mesmo nome base. Desta forma, ao converter arquivos para muitos usuários ou grupos de usuários, os novos arquivos serão colocados ao lado dos antigos. Normalmente, os usuários conhecem “seus” arquivos e lembram seus nomes.

No entanto, o diretório para gravação dos documentos convertidos pode ser alterado. Para fazer isso, basta especificar a chave /d com um nome totalmente qualificado, que pode ser absoluto ou especificado em relação ao caminho que aponta para a pasta na qual o script é executado. ConvertWord expande o caminho para formato completo e cria o diretório correspondente se ele ainda não existir.

convertword /d:c: empexportações

Você pode alterar o nome base (nome do arquivo sem extensão) usando a opção /b. Se o ConvertWord encontrar vários arquivos com o mesmo nome, o ConvertWord alterará os nomes dos arquivos conforme explicado acima. Você também pode usar a opção /x para especificar uma extensão de arquivo diferente da extensão padrão do tipo de arquivo exportado.

Criação de documentos não-Word

Por padrão, o ConvertWord gera automaticamente documentos do Word. Se quiser criar um documento diferente do Word, você pode usar a opção /sa no utilitário ConvertWord para alterar o formato de salvamento padrão. Os formatos nos quais você pode salvar arquivos variam dependendo da versão do Word e dos conversores adicionais disponíveis no sistema em que o ConvertWord é executado. A primeira etapa ao salvar um arquivo em um formato específico é iniciar o Word com a opção /cnv para visualizar os conversores instalados; o número do conversor corresponde ao tipo em que você deseja salvar novo arquivo. Se todos os arquivos precisarem ser salvos em um formato específico, por exemplo RTF (número 6), a opção /sa:6 deverá ser adicionada aos argumentos do ConvertWord. Por exemplo, para converter todos os arquivos do WordPerfect na pasta atual para RTF, você executaria o comando

diretório /s /b *.wpd

| converter palavra/sa:6

Dependendo da versão do Word e dos conversores instalados, o número de formatos disponíveis pode ser grande. Você deve sempre verificar os tipos antes de converter arquivos porque carros diferentes seus números serão diferentes. A única exceção a esta regra irritante são os conversores padrão integrados do Word. O Word 97 e versões posteriores têm os mesmos valores de 0 a 6, e os números dos tipos padrão aumentam à medida que novas versões são adicionadas. No Word 2003, os números de 0 a 11 serão iguais em todas as máquinas. A exceção aos valores padrão é o pino com número -1. Este valor não corresponde Conversor de palavras e é usado como o comando ConvertWord para gravar dados de um arquivo de documento no console. Ele pode ser definido usando a opção /sa - /sa:-1 ou /sa+.

Tratamento de erros

Durante operações de conversão em grande escala, alguns arquivos podem apresentar problemas. Você precisa de uma maneira de rastrear documentos que não foram convertidos. Se o arquivo não puder ser convertido, o ConvertWord passa o nome do arquivo e as informações descritivas para o fluxo de erros padrão (StdErr); Um administrador pode rastrear falhas observando os nomes dos arquivos rolarem pela tela ou redirecionando os dados de erro para um arquivo para análise posterior, por exemplo:

Erros.txt

Por padrão, o ConvertWord mostra erros fornecendo apenas o nome do arquivo e o número do erro:

c:demo.rtf FALHA: 2

Usando a opção /v+ (saída detalhada), você pode obter informações mais detalhadas sobre o erro:

converter palavra
/v+>erros.txt

A opção /v- não exibe números de erro; em vez disso, o nome do arquivo é simplesmente passado para StdErr para facilitar o processamento subsequente.

O último erro detectado pelo ConvertWord é sempre aceito como nível de erro final; Após a conclusão da execução do script, esse valor estará disponível no ambiente de comando e poderá ser lido por outro script, que determinará se a chamada para ConvertWord foi bem-sucedida ou falhou.

Para descobrir erros potenciais, sem converter documentos, você pode executar o ConvertWord com a opção /w (e se). Esta chave faz com que o ConvertWord abra todos os documentos sem salvá-los. Se algo der errado com algum dos arquivos, como dados internos corrompidos, uma mensagem de erro normal será exibida.

Resolvendo o problema da senha

As senhas são especialmente problemáticas quando processadas em lote porque podem ser diferentes para documentos diferentes. Por padrão, o ConvertWord usa o caractere de espaço como senha, o que abre todos os documentos sem senha, mas os documentos com senha geram um erro que não interrompe o processamento posterior.

Esse comportamento pode ser alterado usando a opção /p (senha). Se você especificar um argumento vazio (por exemplo, /p:""), o Word solicitará que você insira uma senha para todos os documentos protegidos. Com a opção /p você pode especificar uma senha específica. Porém, você não poderá abrir documentos sem senha ou com senha diferente da especificada.

Aplicação prática do ConvertWord

Fiz aproximadamente 30 mil conversões usando o ConvertWord e encontrei alguns problemas comuns. Falhas incomuns eram quase invariavelmente causadas por erros de automação do Word; O número e a mensagem do erro, na maioria dos casos, vieram do Word. A maioria dos erros (como senha incorreta) não é difícil de resolver ou compreender. Os três erros seguintes foram repetidos com bastante regularidade.

A primeira é a caixa de diálogo pop-up do Word para documentos que contêm comandos de macro. Por padrão, o ConvertWord bloqueia comandos de macro em documentos para proteger o usuário contra ataques perigosos. código do programa. No entanto, quando o Word abre documentos que contêm macros, aparece uma caixa de diálogo informando que as macros estão bloqueadas. A única maneira que conheço de eliminar esta janela é habilitar comandos de macro. Você pode fazer isso iniciando o ConvertWord e especificando a chave /as (segurança de automação) com um valor 0 (/as:0). Este é o valor padrão para documentos do Word abertos programaticamente. Antes de usar a opção /as, você deve certificar-se de que o documento que está abrindo não contém código de programa perigoso.

O segundo erro está relacionado a alguns documentos RTF que não podem ser abertos com êxito, mas ainda são exibidos corretamente no WordPad. Eles geralmente não são formatados corretamente e não podem ser abertos corretamente no Word. O ConvertWord não pode resolver esse problema, portanto, o ConvertWord não pode ser usado para converter esses arquivos.

O terceiro erro ocorre porque o Word identifica documentos de texto Unicode iniciando Byte Order Mark no arquivo. Se não houver marca, o Word trata o documento como texto simples e, ao abrir o documento convertido, o usuário verá espaços após cada caractere visível (os espaços na verdade correspondem a caracteres nulos). A única maneira de resolver o problema é converter os arquivos com a opção /oa (OpenAs) definida como texto codificado ou Unicode (/oa:5 para Word 97 e posterior).

Felizmente, esses erros ocorrem com relativa pouca frequência. ConvertWord será extremamente útil para processar um grande número de documentos e irá ajudá-lo a abrir e converter documentos do Word sem trabalho manual tedioso.

Consultoria especializada em redes em Indiana. Ele possui certificados MCSE, MCP+I e MVP.

© 2024 ermake.ru - Sobre reparo de PC - Portal de informações