Файлы стандартных документов подготовленных в программе ms word имеют расширение

What’s on this Page

.DOC вариант №
Краткая история

WordPerfect, продукт Corel, использовал DOC как расширение собственного формата. В 1980-х годах WordPerfect по-прежнему использовался на большинстве компьютеров из-за его легкой доступности, совместимости с большинством компьютеров и операционных систем. Однако WordPerfect потерпел крах в ОС Windows, когда Microsoft представила Microsoft Word в качестве своего продукта для формата файлов документов и выбрала расширение DOC для своего проприетарного формата. Поскольку Microsoft Word становился все более и более популярным, формат файла DOC претерпел несколько изменений по сравнению с Microsoft Word 97 — 2003. Это был 2007 год, когда формат файла DOC по умолчанию был заменен форматом Office Open XML (известным как DOCX) и новыми версиями Microsoft Word теперь использует это новое расширение в качестве формата файла по умолчанию.

Спецификации формата файла DOC — дополнительная информация
Некоторые основные понятия

Прежде чем мы углубимся в подробности спецификаций формата файлов для DOC, необходимо понять некоторые фундаментальные концепции, чтобы работать с этим форматом файлов.

Как открыть очень большой документ Word

Информационная база файлов (Fib): Структура Fib содержит информацию о документе и определяет файловые указатели на различные части, составляющие документ. Фибоначчи — это структура переменной длины. За исключением базовой части, размер которой фиксирован, каждому разделу предшествует поле счета, которое определяет размер следующего раздела.

Позиция символа: CP или позиция символа представляет собой 32-разрядное целое число без знака, которое служит отсчитываемым от нуля индексом символа в тексте документа. Расположение и размер каждого символа в файле не могут быть получены напрямую и должны быть вычислены с использованием заранее заданного алгоритма. Персонажи включают:

  • Текст документа
  • Якоря объектов, таких как сноски или текстовые поля
  • Управляющие символы, такие как метки абзаца и метки ячеек таблицы

ПЛК: Структура ПЛК представляет собой массив CP, за которым следует массив элементов данных. Элементы данных для любого ПЛК должны иметь одинаковый размер — ноль или более байтов, и по этой причине количество CP должно быть на единицу больше, чем количество элементов данных. Структуры ПЛК бывают разных типов, каждый из которых указывает, разрешены ли дублирующие CP для этого типа или нет. Структура ПЛК состоит из:

  • aCP (переменная длина): Массив элементов CP. Каждый тип структуры PLC определяет значение элементов CP и допустимый диапазон.
  • aData (переменная длина): Каждый тип структуры PLC определяет структуру и значение элементов данных, любые ограничения на количество элементов данных и любые ограничения на содержащиеся в них данные. Он также определяет взаимосвязь между элементами данных и соответствующими CP.

Действительный выбор: Конструкции файлов .DOC в основном описываются рядом CP. Существует ряд правил, указанных Microsoft для соблюдения в таком случае.

Читайте также:
Как на компьютере сделать программу паскаль

собираем несколько документов Word в один

STTB: STTB — это таблица строк, состоящая из заголовка, за которым следует массив элементов. Значение cData указывает количество элементов, содержащихся в массиве.

Хранение свойств: В текстовом файле могут быть различные элементы, такие как текст, абзацы, таблицы, изображения и разделы, каждый из которых может иметь свои собственные свойства. Их свойства сохраняются в файле Word как отличия от значений по умолчанию. Такие различия определяются PR1, состоящим из модификатора одного свойства (Sprm) и его операнда. Приложение может определить окончательный набор свойств путем применения списков Prls.

Защита паролем. Файлы Word также могут быть защищены паролем, для чего можно использовать один из следующих механизмов.

  • Обфускация XOR
  • Шифрование двоичных документов Office RC4
  • Шифрование двоичного документа Office RC4 CryptoAPI

Если FibBase.fEncrypted и FibBase.fObfuscation равны 1, файл запутывается с помощью запутывания XOR.

Если FibBase.fEncrypted равен 1, а FibBase.fObfuscation равен 0, файл шифруется либо с помощью шифрования Office Binary Document RC4, либо с помощью шифрования Office Binary Document RC4 CryptoAPI, при этом EncryptionHeader хранится в первых байтах FibBase.lKey потока таблицы. EncryptionHeader.EncryptionVersionInfo указывает, какой механизм шифрования использовался для шифрования файла.

Структура файла

Бинарный файл Word по своей оригинальности представляет собой составной OLE-файл, состоящий из нескольких хранилищ и потоков. Эти хранилища и потоки имеют свою структуру и размеры, задающие параметры записи и чтения. Это:

Поток WordDocument

Этот поток содержит текст документа и другую информацию, на которую ссылаются другие части файла. Поток не имеет предопределенной структуры, кроме FIB в начале, который является обязательным и должен иметь смещение 0. Этот поток не должен превышать 2147 МБ.

1TableStream или 0TableStream

Двоичный файл Word может содержать потоки таблиц, известные как поток 1Table или поток 0Table. Хотя бы один из них должен присутствовать в документе. Однако, если документ содержит потоки 1Table и 0Table, используется только поток, на который ссылается base.fWhichTblStm. Поток без ссылки ДОЛЖЕН игнорироваться. Размер Table Stream НЕ ДОЛЖЕН превышать 2147 МБ.

Поток данных

Поток данных не имеет предопределенной структуры. Он содержит данные, на которые ссылается FIB или другие части файла. Этот поток не обязательно должен присутствовать, если на него нет ссылок. Поток данных НЕ ДОЛЖЕН превышать 2147 МБ.

Хранилище пула объектов

Хранилище пула объектов содержит хранилища для встроенных объектов OLE. Это хранилище не обязательно должно присутствовать, если в документе нет встроенных объектов OLE.

Пользовательское хранилище данных XML

Хранилище пользовательских XML-данных — это дополнительное хранилище, имя которого ДОЛЖНО быть «MsoDataStore».

Поток сводной информации

Поток сводной информации — это необязательный поток, имя которого ДОЛЖНО быть «05SummaryInformation», где 05 — это символ со значением 0x0005, а не строковый литерал «05».

Поток сводной информации о документе

Поток сводной информации о документе — это необязательный поток, имя которого ДОЛЖНО быть «05DocumentSummaryInformation», где 05 — символ со значением 0x0005, а не строковый литерал «05».

Поток шифрования

Поток шифрования — это необязательный поток, имя которого ДОЛЖНО быть «шифрование». Этот поток НЕ ДОЛЖЕН присутствовать, если не выполняются оба следующих условия:

  • Документ зашифрован с помощью шифрования Office Binary Document RC4 CryptoAPI.
  • Значение fDocProps задается в EncryptionHeader.Flags.
Читайте также:
Программа на планшет для флешки

Хранилище макросов

Хранилище макросов — это дополнительное хранилище, содержащее макросы для файла. Если он присутствует, это ДОЛЖНО быть корневым хранилищем проекта.

Хранилище XML-подписей

Хранилище XML-подписей — это необязательное хранилище, имя которого ДОЛЖНО быть «_xmlsignatures».

Поток подписей

Поток подписей является необязательным потоком, имя которого ДОЛЖНО быть «_signatures». Этот поток содержит цифровые подписи.

Хранилище пространства данных для управления правами на доступ к данным

Хранилище пространства данных управления правами на доступ к данным является дополнительным хранилищем, имя которого ДОЛЖНО быть «06DataSpaces», где 06 — это символ со значением 0x0006, а не строковый литерал «06». Если это хранилище присутствует, поток защищенного контента также ДОЛЖЕН присутствовать. Если это хранилище присутствует, все указанные потоки и хранилища, кроме этого хранилища и потока защищенного содержимого, ДОЛЖНЫ считываться из потока защищенного содержимого, как указано в [MS-OFFCRYPTO], и если какие-либо из этих потоков и хранилищ существуют за пределами защищенного содержимого. Stream, их ДОЛЖНО игнорировать.

Защищенный поток контента

Поток защищенного содержимого — это необязательный поток, имя которого ДОЛЖНО быть «09DRMContent», где 09 — это символ со значением 0x0009, а не строковый литерал «09». Если этот поток присутствует, ДОЛЖНО также присутствовать хранилище пространства данных управления правами на доступ к данным.

Использованная литература

  • Спецификации формирования файлов MS-DOC
  • Документация по вычислениям

See Also

  • NB — формат файла блокнота Mathematica
  • OTS — формат файла шаблона электронной таблицы OpenDocument
  • XLR — формат файла электронной таблицы Microsoft Works
  • Что такое формат файла XLS? Узнайте у экспертов по формату файлов!
  • Что такое формат файлов Lotus 123? Узнайте у экспертов по формату файлов!

Источник: docs.fileformat.com

Документы формата doc и docx – чем открыть

Doc – это стандартное расширение файлов, созданных текстовым редактором Microsoft Word, начиная с версии 97 и до версии 2003, либо приложением WordPad. Подобные форматы на данный момент фактически устарели.

Версии редактора Word с 2007 года работают с документами, имеющими расширение docx. Соответственно, стандартной программой для открытия файла в старом формате будет версия Word до 2003 года включительно или WordPad, а в новом – Word 2007 или более современный.

Чем отличаются форматы документов

Файлы типа doc – это бинарные (двоичные) файлы, которые могут иметь разное строение, в зависимости от конкретной версии создавшей их программы. Документы, созданные WordPad, отличаются от вордовских в сторону примитивности.

Чем открывают расширения doc и docx

А какими еще приложениями можно открывать документы с расширениями doc и docx? Список достаточно большой, но есть некоторые нюансы при их использовании. Корпорация Microsoft традиционно закрывает свои разработки от свободного использования, поэтому сторонние разработчики часто имеют проблемы с совместимостью.

Изменяем размер шрифта в Windows

  • Бесплатный пакет LibreOffice по интерфейсу немного отличается от привычных нам офисных пакетов. Он создавался на основе OpenOffice.org. Получил широкое распространение в учебных заведениях и некоммерческих организациях. В пакет встроен редактор Writer. LibreOffice достаточно медленно запускается, но открытые простые документы выглядят так же, как и в Word. После редактирования результат можно сохранять в исходном формате.Открытие в LibreOffice
  • Сервис Яндекс.Диск позволяет хранить информацию в сети, освободив дисковое пространство на домашнем компьютере. Пользователи Интернета, работающие с данным сервисом, могут просматривать тексты, не запуская дополнительные программы. Для этого в веб-интерфейсе достаточно дважды щелкнуть по названию файла. Но тут тоже есть неприятные моменты. В нашем случае старый формат выглядит так:Используем Яндекс Диск
Читайте также:
Как с компьютера подключить интернет на телефон без программ

Текстовая надпись потерялась. При попытке редактирования сервис предупреждает, что результат будет сохранен как docx.

Открытие нового формата

С новым форматом дела чуть лучше:

Надпись внизу слегка исказилась. Сервис Яндекс.Диск удобно использовать для просмотра информации, но для редактирования лучше запускать Word.

Использование Doc Reader

  • Приложение DocReader позволяет просматривать и печатать тексты, набранные в Word. Doc Reader бесплатен, занимает мало места, прост в установке и в использовании. Функционал ограничен, но для просмотра текстов возможностей вполне достаточно:

Источник: composs.ru

Справочник по форматам файлов для Word, Excel и PowerPoint

Поддерживаемые форматы файлов и их расширения перечислены в следующих таблицах для Word, Excel и PowerPoint.

Форматы файлов, поддерживаемые в Word

В следующей таблице описаны форматы файлов, поддерживаемые в Word, отсортированные в алфавитном порядке по расширению.

Файлы в формате PDF можно сохранять и открывать с помощью Word 2019, Word 2016 и Word 2013.

Форматы файлов, поддерживаемые в Excel

В следующих таблицах описываются форматы файлов, поддерживаемые в Excel.

Форматы файлов, поддерживаемые в PowerPoint

В следующих таблицах описываются форматы файлов, поддерживаемые в PowerPoint.

Форматы файлов, которые не поддерживаются в Office

Приложения Office не поддерживают форматы файлов, описанные в следующей таблице.

Приложение Неподдерживаемый формат файлов
Excel — Диаграмма Excel (форматы файлов Excel 2.0, 3.0 и 2.x) (XLC)
— Форматы файлов Lotus 1-2-3 (все версии) (.wk1, .wk2, .wk3, .wk4, .wks)
— Microsoft Works (все версии) (wks)
— формат файла DBASE II (DBF)
— Формат файла Quattro Pro для MS-DOS (WQ1)
— Quattro Pro 5.0 и 7.0 для Windows (.wb1, .wb3)
PowerPoint — открытие или сохранение в форматах файлов PowerPoint 95 (или более ранних версий)
— файлы мастера упаковки и go (PPZ).
— файлы веб-страниц (.htm, .html)

Дополнительная информация о форматах файлов

В этом разделе приведены дополнительные форматы файлов и сведения о том, поддерживаются ли они в приложениях Office.

Форматы файлов буфера обмена Microsoft Office

Пользователи могут вставлять данные из буфера обмена Office в Word, Excel и PowerPoint, если данные буфера обмена Office имеют один из форматов, указанных в следующей таблице.

Открытие и просмотр неподдерживаемых форматов файлов

Если формат файла, который пользователи хотят использовать, не поддерживается, они могут попробовать следующие методы, чтобы открыть файл.

  • Найдите в Интернете компанию, которая создает конвертеры форматов файлов, чтобы найти форматы файлов, которые не поддерживаются в приложении.
  • Сохраните файл в формате, поддерживаемом другой программой. Например, пользователи могут импортировать свои файлы Word, Excel или PowerPoint в другую программу, которая не поддерживает собственный формат файла приложения. Однако она может поддерживать импорт файлов в другом формате, например текстовом. В этом случае пользователи могут сохранять свою работу в текстовом формате, а затем импортировать текстовый файл в другую программу.

Связанные статьи

  • Справочник по расширениям имен файлов XML в Office
  • Руководство по ресурсам панели мониторинга телеметрии Office

Источник: learn.microsoft.com

Рейтинг
( Пока оценок нет )
Загрузка ...
EFT-Soft.ru