Давно хотел написать несколько статей по новой версии Symantec Enterprise Vault (9.0), благо недавно вышел первый сервис пак для Exchange 2010 и есть с чем сравнить его обновлённую функцию архивирования. На последнем MCP-клубе увидел, что тема может показаться интересной.
Для начала имеет смысл определиться с терминами. Часто архивирование путают с резервным копированием (предполагаю, что связано это с тем, что достаточно давно программы, выполнявшие резервные копии назывались архиваторами). В чём же разница между этими двумя, на внешний взгляд, похожими процессами? Давайте посмотрим на определение терминов, обозначающих эти процессы.
Архивирование – процесс сбора устаревших данных с целью их дальнейшего хранения.
Резервное копирование – процесс создания копии данных, предназначенной для восстановления данных в случае их повреждения или удаления.
На лицо разница в целях процессов. Целью архивирования является хранение устаревших (исторических) данных (оригинальных документов), целью же резервного копирования является создание копий документов с возможностью их восстановления в случае повреждения или удаления оригинальных данных.
Помимо основной цели (хранение) архив может выполнять ряд дополнительных функций: сбор устаревших документов (комплектование фондов), осуществление доступа к архивным документам, и их учёт (в частности создание каталога хранимых документов для облегчения поиска).
Программное обеспечение, выполняющее архивирование, по идее, должно все эти функции уметь выполнять. Часто в архив складываются документы из почтовых систем. Очевидно, что хранение устаревших документов в рабочих почтовых базах увеличивает нагрузку на них, даже не смотря на то, что устаревшие документы просматриваются крайне редко. Перемещение же их в отдельное хранилище снижает нагрузку на рабочие почтовые базы. Учитывая, что устаревшие документы просматриваются нечасто, можно большой объём устаревших документов хранить в относительно недорогих хранилищах. В этом основной выигрыш перемещения устаревших документов в отдельные хранилища.
Кроме почтовых баз архивированию могут так же подвергаться файловые хранилища и хранилища документов Sharepoint.
В следующей статье перейдём непосредственно к Symantec Enterprise Vault (как он работает, его системным требования и тд).
Станислав Булдаков
“Архивирование — процесс сбора устаревших данных с целью их дальнейшего хранения” – что за ерунда? Почему СБОРА? почему УСТАРЕВШИХ?
У меня ходит скрипт и имена всех файлов, старше трех месяцев, записываются в лог. Это архивирование? Почему нет, ведь подпадает под ваше определение!?
А собственно почему нет? Возможно определение немного и корявое, но дальше по тексту четко разъясняется цель архивирования.
А ваш пример со скриптом не корректен, поскольку имена файлов: 1) не устаревшая информация (устаревшей может быть предыдущая версия списка файлов, но не текущая). Во-вторых запись имени файла в лог это не есть процесс сборахранения данных. Это вы просто реестр файлов составили.
Согласен, определение немного корявое, может сбить с толку. Нужно чётко понимать, что если не введено понятие “устаревшие данные” (то есть введён критерий, по которому каждый документ можно либо назвать устаревшим, либо актуальным), то архивировать будет крайне сложно. В таком случае, фактически, архивирование превратится в ручную операцию – ни о какой автоматизации процесса речи быть не может.
И ещё небольшое дополнение, собственно архивирование – опциональная функция архива. Документы могут быть собраны раз и после этого фонды уже пополняться не будут. Это не противоречит главной задаче архива – хранению.
Я думаю основная недовольство в определении “архивирование” вызывает
отсутствие упоминания об уменьшении размера хранимых данных, за счет снижения их доступности, в т.ч.
“Перемещение же их в отдельное хранилище снижает нагрузку на рабочие почтовые базы.” – из перемещения архивных данных в отдельное хранилище напрямую следует уменьшение размера данных, хранимых в рабочем хранилище.