Способы организации хранилища метрических книг

Опубликовано kom -

Размышления на тему возникли, когда я затеял выкачать книги с FS по Чернскому уезду.
Конечно, хранить их в режиме "только для себя", если тебе нужна пара сел, никакого смысла нет: лишь перевод времени, денег и дискового пространства.
Поэтому, конечно же, надо выкладывать все это в общий доступ.
С физическим хранилищем вопросов не возникло: свободных полтерабайта на дропбоксе, вроде бы должно хватить. Если не сбился со счета, то по уезду на FS около 350 пленок, это значит 300 с чем-то Гб.
Вопросы начинаются, когда задумываешься об организации, о структуре хранения.
Ясно, что просто перекачивать пленки "как есть" смысла нет никакого. Во-первых, FS с исходными пленками худо-бедно, но через прокси доступен. Во-вторых, никакого смысла частично дублировать хранилище admiral21 на Google Drive я не вижу.

Значит, пленки надо резать. Но как?
Вначале начал резать по делам. С точки зрения конечного пользователя - это нужная вещь, так как сплошь и рядом границы пленки не совпадают с границами дела, и одно дело, начинаясь на одной пленке, переходит на другую. В результате, в поисках одной-единственной странички пользователю нужно просмотреть не одну, а две пленки, поскольку никогда заранее не известно, на какой из пленок находится нужная метрическая книга. А каждая пленка - это тысяча кадров...
К слову, такой принцип хранения (по делам) реализован у.ГАТО. Но удобство конечного пользователя вряд ли беспокоило архив в первую очередь. В конце концов, система у них коммерческая, доступ к отсканированным материалам платный, причем повременной. Так что, чем больше времени проведет исследователь на сайте, тем будет лучше для архива (с финансовой стороны). И все же: пленка, порезанная на дела, много удобнее.
Но тогда напрашивается следующий шаг: резать на приходы (села), причем сразу, не тратя времени на разрезание на дела. Ведь пленок - три с половиной сотни (UPD.Три с половиной сотни - не пленок, а "айтемов" на пленке. Самих пленок раза в 2 меньше). И на каждой обычно два или три дела. Даже просто найти начало и конец каждого займет, положим, с минуту. А потом еще и перекопировать найденное. И все умножить на 350.

Значит, решено. Режем сразу на приходы. Тем более, ведь что интересует конечного пользователя? Метрическая книга по конкретному приходу за конкретный год. Таким образом, если наш конечный пользователь будет сразу иметь ссылку на приход (а внутри этой ссылки сразу видеть набор книг, разложенных по годам), он сэкономит кучу времени. Ему даже не нужно будет смотреть "слепой" скан описи: если только в дальнейшем ему не понадобится правильная ссылка на дело. Но и она ведь может понадобиться лишь после того, как требуемая запись в деле (книге) будет найдена.

Подытожим. На сегодняшний день пользователь, чтобы просмотреть конкретную метрическую книгу, зная лишь село (приход) и интересующий год, проделывает следующие операции:
- определяет по описям фонд, опись и номер дела;
- просматривает целиком дело в электронном каталоге (как в ГАТО) с повременным платным доступом, находит нужную метрическую книгу (это примерно полтысячи листов);
- или заходит на бесплатный, но заблокированный в России FamilySearch, по фонду-описи-номеру дела находит нужную пленку (или пленки);
- просматривает пленку или пленки, находит нужную метрическую книгу (размер одной пленки около тысячи листов);
- изучает уже нужную МК.

Далее, для каждого следующего года процесс повторяется.

Предлагаемая же выше система хранения позволяет достичь того же результата двумя кликами мыши: по ссылке попадаем в папку прихода (села), а затем - в папку с нужным годом.