Введение
Если вы создаёте воспроизводимый пример для работы с DOCX, формат DOCX часто мешает из‑за своей структуры: это ZIP‑архив с поддиректориями и множеством XML‑файлов. Часто хочется обойтися одним плоским XML‑файлом, который MS Word откроет напрямую, как LibreOffice открывает FODT.
Ниже разберёмся, поддерживает ли MS Word «плоский» XML‑формат, эквивалентный FODT, и какие варианты подойдут при простом документе без изображений и встроенных объектов.
Задача и ограничения
Исходная проблема: DOCX — это по сути ZIP‑архив, содержащий несколько XML‑файлов и поддиректорий. Это усложняет воспроизводимые примеры и тесты.
Ограничения, которые важны для выбора формата:
- Документ простой — без изображений и встроенных объектов.
- Должен открываться в MS Word без конвертации и внешних инструментов.
- Форматы, поддерживаемые только сторонними редакторами (например, LibreOffice‑только), не рассматриваются.
Поддерживает ли MS Word плоский XML?
Да — MS Word поддерживает два варианта XML‑форматов, которые можно рассматривать как «плоские» в разном смысле. Они видны в стандартном диалоге «Сохранить как» как «Word XML Document» и «Word 2003 XML Document».
Оба варианта позволяют обойти упаковку в ZIP, но отличаются по структуре и совместимости с DOCX.
Word 2003 XML Document — плоский <wordDocument>
Первый вариант — это формат, введённый в Office 2003 до появления DOCX. Он представляет собой плоский XML‑документ с корневым элементом <wordDocument>.
Такой файл действительно является единым XML‑файлом, который MS Word открывает без конвертации. Для простых документов (текст, базовое форматирование) это лучший эквивалент FODT по простоте использования.
Ограничения: этот формат старее и может не поддерживать некоторые современные возможности DOCX, но для базовых тестов и воспроизводимых примеров он подходит идеально.
Обновлённый формат на основе <package> — многочастный XML в одном файле
Второй вариант — это обновлённый XML‑формат, который представляет собой корневой элемент <package>. В нём те же части, что и в DOCX (пакет с множеством файлов), встраиваются как поддеревья в один XML‑файл.
Фактически это один файл, но по структуре он отражает многочастную природу DOCX: отдельные части документа (словесные части, свойства, стили и т.д.) хранятся как вложенные узлы в едином XML‑дереве.
Такой файл тоже открывается напрямую в MS Word и ближе по возможностям к полнофункциональному DOCX, сохраняя при этом единый XML‑файл без ZIP‑контейнера.
Вывод — какой формат выбрать?
Если нужна простая, плоская альтернатива FODT для воспроизводимых примеров и тестов, используйте «Word 2003 XML Document» с корнем <wordDocument>. Это самый непосредственный плоский XML‑файл, который MS Word откроет без конвертации.
Если вам нужен единый XML‑файл, но с сохранением структуры и частей, аналогичных DOCX, используйте вариант с корнем <package>, где все части встраиваются как поддеревья. Он ближе по возможностям к современному DOCX и также открыт MS Word без внешних инструментов.
Ключевые слова и совместимость
Ключевые слова из исходного запроса: DOCX, ZIP архив, XML файлы, плоский XML, FODT, LibreOffice, MS Word, Word XML Document, Word 2003 XML Document, <wordDocument>, <package>.
Оба упомянутых формата видны в диалоге «Сохранить как» в MS Word и соответствуют требованию «открыть в MS Word без конвертации». Форматы, поддерживаемые только LibreOffice (например, FODT для ODT), в рамках условия «out of scope» не рассматриваются.