Перейти к содержимому

Метаданные офисных документов

Показывает автора, компанию, правки и комментарии в DOCX, XLSX и PPTX — и удаляет их перед отправкой документа. Поддерживает batch.

Открывает офисный документ Word, Excel или PowerPoint и показывает, что внутри: автора и компанию из метаданных, дату создания и последнего изменения, заголовок и тему, ключевые слова, custom properties (туда часто пишут идентификаторы SharePoint/DLP и шаблонов), все принятые-непринятые правки tracked changes с авторами и все комментарии-обсуждения. Затем чистит выбранные группы целиком. Технически: DOCX, XLSX и PPTX — это ZIP-контейнеры в формате OOXML. Метаданные документа лежат в docProps/core.xml (автор, дата, заголовок, описание) и docProps/app.xml (компания, имя приложения, путь к шаблону). Правки разметаются по word/document.xml в виде тегов w:ins/w:del/w:moveFrom/w:moveTo с атрибутом w:author — на каждое изменение видно, кто его внёс. Комментарии лежат в word/comments.xml для DOCX, в xl/comments*.xml для XLSX и в ppt/comments/*.xml для PPTX; современные «облачные» нити дополнительно — в xl/threadedComments и ppt/modernComments. При очистке tracked-правки принимаются полностью (текст становится финальным, маркеры истории убираются), комментарии и список авторов правок обнуляются, идентификационные поля метаданных — creator, lastModifiedBy, title, subject, description, keywords, company, manager, путь шаблона — очищаются. Application и AppVersion оставляются: это просто метка софта, а не личный идентификатор. Custom properties — отдельный чекбокс, по умолчанию выключенный: туда часто пишут DLP/RM-плагины бизнес-критичные значения, и слепое удаление может сломать workflow. Макросы (vbaProject.bin), если есть, сохраняются как были — удаление макросов лишило бы документ автоматизации. Можно загрузить сразу несколько файлов — каждый чистится отдельно, на выходе ZIP. Обработка идёт в браузере: документ ни на байт не попадает на сервер.