Sunday, April 8, 2012

Testing Inforbix

Попробуем порассуждать о подходе, который элегантно и повсеместно создает новую парадигму управления данными и информацией. Ну и поделиться впечатлениями от использования облачного сервиса Inforbix.
Давно ли вы были в библиотеке? Пользовались ли вы бумажными каталогами, искали ли статьи по конкретному автору, не прибегая к электронному поиску? Если пару раз это проделать вручную, то приходит некое понимание проблемы поиска в куче информации. Более того, появляется внимание к тому, как оформлена карточка в каталоге (или запись в базе данных). Если какой-то параметр неверно заполнен, могут быть проблемы с поиском. То же самое касается просто недооформленной записи в каталоге. Например, одну статью мне удалось найти, только узнав у автора название самой книги - в каталоге и БД ее просто не было.

А теперь ближе к делу. Мне необходимо было понять, возможно ли не внедрять "тяжелую", "жесткую" для малого и среднего архитектурного бизнеса систему документооборота, при этом получать возможность поиска (в т.ч. и "глубокого" - например, блоков внутри dwg-файлов) и организации данных различных форматов.


Иллюстрация разнородности файловых форматов. Источник
Разнородность данных
Первым делом я собрал файлы и папки с различными проектами, экспериментами в единую локацию на жестком диске и поставил индексироваться Inforbix'ом. В среднем папка с проектом (например, ресторана) весит около 1 ГБ и содержит порядка 2000 файлов (данные по бюро 9-studio, где я работал). Я отобрал ряд проектов, в которых активно участвовал, т.е. чертежи, модели, документы Word, Excel, или pdf-альбомы  непосредственно производились мной. Также я "почистил" от мусора сами проекты.
После ряда тестов в течение 4-5 месяцев тестирования, я пришел к выводу, что наша архитектурная деятельность довольно хаотична, неупорядоченна, и мы не вопринимаем файл как документ. Более того, мы очень часто используем различные программы, и сами данные получаются в различных форматах. Получаем крайне сложную структуру папок
В итоге, у меня собралось около 2000 файлов различных форматов - dwg, skp, pdf, xls и т.д.

Testing Inforbix
 Ниже я привожу видеоролик, где я попробовал зафиксировать некоторые моменты своего опыта использования Inforbix. Безусловно, этот ролик нельзя сравнивать с обстоятельными и наглядными видео в исполнении Вика Санчеса - в мои задачи не входила реклама или пиар. Более того, мне так и не удалось в полной мере оценить семантические механизмы Inforbix. Поэтому сначала размещаю пару "родных" роликов об Inforbix.



Также на Youtube-канале Inforbix можно посмотреть остальные видеоролики.

А вот и мой ролик:


В виде заключения
По сути, я получил "обратный инжиниринг" своих рабочих процессов с CAD-приложениями. Это дало мне возможность переосмыслить способ управления информацией внутри, например, небольшой фирмы. Конечно, Revit + Vault + Buzzsaw решают все проблемы такого рода блестяще, но я ни по бюджету, ни по подходу к проектированию (о своих мыслях насчет проектного процесса я писал в предыдущих постах) не могу себе этого позволить.

Итак, еще раз попробую сделать некоторые выводы.
  • Если файл создается внимательно, с нормальным наименованием и некоторыми заполненными атрибутами, то найти его будет несложно. Кроме того, это позволит нам отслеживать, кем, когда и какой файл был создан. Это, в свою очередь, можно формализовывать в диаграммы процессов.
  • Data Granularity rules , но во всем знай меру
  • Если не делать ставку на сложные иерархические структуры папок, а использовать плоскую структуру хранения файлов, то мы можем с помощью виртуальной организации файлов достигать необходимой упорядоченности и информативности (это наглядно можно проследить в механизме Picasa) и избегать дублирования файлов
  • Самым главным и надежным хранилищем информации о проекте является PDF или DWF-версия альбома. 
  • Огромная разница между человеком, который работает сам на себя и все под себя организует, и группой людей. Процесс поиска и организации информации усложняется в разы. 
  • Файлы, которые скачаны из интернета или получены от других участников проекта, заметно отличаются от созданных вами, и механизмы поиска могут "не сработать". Я скачивал файлы светильников с сайта производителя - они нередко оказываются далеки от совершенства (во всяком случае, в моем понимании).
  • Последний вывод касается Inforbix. Мы привыкли к "тупости" поиска в Google или Yandex, поэтому работа с Inforbix может показаться слишком сложной. Особенно, когда поиск выполняется поступательно, постепенно сужая критерии.
Как-то так. Информационную сложность побороть сложно, но можно. В том числе и благодаря "гранулярности" данных.

2 comments:

  1. Evgeny, thanks so much for such a great post and amazing video. We are going to learn from your experience and... fix few obvious bugs :). Best, Oleg

    ReplyDelete
  2. Thank you, Oleg. I'm really impressed by this "nonlinear" approach you are promoting. it made me rethink data and information mgmt deeply.
    i would be really delighted if my experience and thoughts could be useful. #languagepractice

    ReplyDelete