¬аше окно в мир —јѕ–
Ќовости —татьи јвторы —обыти€ ¬акансии –екламодател€м
—татьи

19 феврал€ 2024

÷ифровизаци€ или цифровое болото?

јлександр ямпольский

ямпольский


÷итаты из статьи Ђ—тройотрасли предписана трансформаци€ї:

Ђ–еализаци€ —тратегии развити€ строительной отрасли до 2030 года предполагает осуществление перевода нормативно-технических документов в машиночитаемый и машинопонимаемый форматї.

ћинстрой собираетс€ Ђв перспективе трех-п€ти лет перевести нормативную базу в машиночитаемый форматї, дл€ чего Ђдокументы нужно структурировать до степени понимани€ машиныї.

Ќеобходимый и естественный шаг, правда, без каких-либо подробностей.

÷ифрова€ трансформаци€ сама по себе не панаце€; она может решить проблемы, но может завести в цифровое болото.   сожалению, вопросы уже возникают.

Ќапример, зачем это нужно Ч называть проектную документацию информационной моделью?

 ому и зачем нужен  —»?

„то подразумеваетс€ под словом Ђмашинопонимаемыйї? ѕеревод в XML формат?

» наконец, правильный ли это выбор Ч директивное нав€зывание Ђпрогрессаї?

ћинистр финансов ¬еликобритании в 2023 году (после 12 лет цифровых экспериментов в строительной отрасли) задаетс€ вопросом: почему в этой стране инфраструктурный проект обходитс€ в 10 раз дороже, чем во ‘ранции.

«нани€ и данные

ѕростой здравый смысл подсказывает: все, что есть в нормах, Ч правила, требовани€, рекомендации Ч все это знани€. Ќормативна€ база Ч есть база знаний.

ћожет быть, ћинстрой собираетс€ сделать машинопонимаемыми знани€? ¬р€д ли. я даже не уверен, есть ли у цифровых реформаторов понимание того, что такое знани€.

«а терминологию Ђцифровизацииї теперь отвечает √ќ—“ 10.00.00.01. ќпределени€ знаний там нет, но есть ссылка на √ќ—“ 33707-2016, в котором можно прочитать следующее.

4.398 знани€: —овокупность фактов, событий, убеждений, а также правил, организованных дл€ систематического применени€.

4.78 база знаний: Ѕаза данных, котора€ содержит правила логических выводов и информацию о человеческом опыте и знани€х экспертов в предметной области.

“рудно придумать что-то менее вразумительное. »сход€ из первого определени€, знани€ Ч это совокупность событий. »сход€ из второго, знани€ Ч это данные, содержащие информацию о знани€х.

—егодн€ компьютерна€ обработка знаний Ч передний край информационных технологий, следующий шаг после датацентричных приложений. ¬ычислимые знани€ пытаютс€ использовать в медицине, финансах, юриспруденции, сфере обслуживани€. ј что же в строительстве?

“о же, что и дес€ть лет назад: информаци€, информационна€ модель, данные, большие данные, среда общих данных. ƒес€ть лет топтани€ на месте, разговоров либо не о том (о данных), либо ни о чем (об информации). ¬ проекте постановлени€ правительства о Ђѕравилах формировани€ и ведени€ информационной моделиї о знани€х нет ни слова. ѕо-видимому, наполн€ть модель собираютс€ чем-то другим.

Ќиже Ч определени€ знаний с точки зрени€ автора статьи.

«нани€:  онцептуализированное описание человеческого опыта на естественном €зыке.

Ѕаза знаний:  онцептуализированное описание предметной области на естественном €зыке.

 лючевые слова здесь Ђконцептуализаци€ї и Ђестественный €зыкї. «нание непредставимо без концептуализации, а естественный €зык Ч это €зык концепций.

„тобы расставить точки над Ђиї, внесем €сность и по поводу информации и данных.

≈диного определени€ информации в √ќ—“ 10.00.00.01 также нет. ≈сть несколько ссылок на источники, в которых информацией называют сведени€, данные, структурированные данные, сведени€ в любой форме. ћожно сделать вывод, что точных границ у термина Ђинформаци€ї не существует. “огда так и запишем.

»нформаци€: любые сведени€ в любой форме о любых объектах (предметах, процессах, €влени€х).

ƒанные в √ќ—“ 10.00.00.01 определ€ютс€ следующим образом.

ƒанные (data): »нформаци€, представленна€ в формализованном виде, пригодном дл€ передачи, интерпретации или обработки с участием человека или автоматическими средствами.

— точки зрени€ автора статьи, определение должно быть таким.

ƒанные: сведени€ о конкретных (в отличие от концептуальных) объектах (предметах, процессах, €влени€х).

ƒва подхода к цифровизации

√ќ—“ 10.00.00.01 определ€ет два подхода к построению информационных систем: документоориентированный и моделеориентированный. —амо название системы новых стандартов говорит о том, какой подход решили сделать государственным.

Ќапомню, что глобальна€ цифрова€ революци€ в строительной отрасли началась в ¬еликобритании в 2011 году. ќна провозглашала технологический и культурный сдвиг, выход за рамки бумажного Ђплоскогої проектировани€. Ќа самом деле это была попытка отказатьс€ от проектировани€ на основе знаний в пользу датацентричного проектировани€.

„тобы пон€ть разницу в подходах, нужно просто сравнить два пон€ти€: знани€ и данные. ¬от, например, что говоритс€ по этому поводу в медицинских источниках.

ќтличие знаний от данных

ƒанные о пациентах  линические знани€
  кому применимы   конкретному пациенту   любому пациенту
»сточник  онкретный пациент »сследование многих пациентов
ѕредставление „исла, коды, текст, изображени€, звукиЕ ”стное слово, письменный текст, машинопонимаемый текст
 онфиденциальность ¬ысока€ Ќизка€
ѕоследстви€ ошибок ѕоследстви€ дл€ конкретного пациента ћасштабные последстви€ в результате недостоверных знаний или неправильной интерпретации знаний


≈стественно, Ђкультурный сдвигї закончилс€ провалом. ¬ 2018 году был отменен правительственный мандат на BIM Level 2, а в 2022 произошел спуск флага: информационное моделирование зданий превратилось в информационное управление.

¬ –оссии с небольшим отставанием реформа пришла к тому же результату.  роме того, что документацию стали называть информационной моделью, а 3D модель Ч графической частью документации, других прорывов в отрасли не произошло.

–еальное проектирование Ч проектирование на основе знаний

»спользование знаний в строительной практике можно по€снить на простом примере. ‘раза Ђѕерегородки армировать сетками через 5 р€дов кладкиї часто встречаетс€ в проектах. Ёто концептуальное описание армировани€ перегородок, пон€тное любому инженеру или каменщику. ѕерегородки, сетки, р€ды кладки Ч все это концепции. „тобы с помощью моделировани€ воспроизвести содержание фразы, нужно на всех этажах многоэтажного здани€ перестроить перегородки, добавив к ним растворные швы и разложив арматурные сетки в каждом п€том шве.

–еальное строительное проектирование Ч полностью документоориентированный процесс. “ехническую документацию в целом можно представить в виде многоуровневой пирамиды знаний. Ќа верхнем уровне лежат общие требовани€ безопасности и эффективности; ниже Ч отраслевые требовани€ и рекомендации; еще ниже Ч типовые технические решени€.  аждый нижележащий уровень €вл€етс€ конкретизацией вышележащего. Ёто значит, количество документов увеличиваетс€, а область применени€ знаний, содержащихс€ в отдельном документе, сокращаетс€.

–абочие проекты располагаютс€ внизу пирамиды и €вл€ютс€ последней ступенью конкретизации перед осуществлением. ¬се, что в нормах присутствует в виде допустимых диапазонов, границ, вариантов, Ч в рабочем проекте превращаетс€ в конкретное проектное решение.

ћожно отметить следующие закономерности пирамиды знаний.

  • „ем ниже уровень пирамиды, тем ниже надежность и достоверность знаний этого уровн€. Ќа уровне рабочих проектов надежность падает скачкообразно, что вполне объ€снимо.
  • — ростом конкретизации знаний растет количество знаний, представленных в виде графических изображений. ќднако принципиальных отличий между документами разного уровн€ не существует. ¬се виды документов, начина€ от правительственных постановлений и заканчива€ деталировочными чертежами рабочих проектов, подпадают под одно общее определение Ч иллюстрированный (алфавитно-пиктографический) текст.

Ќеизбежно возникает вопрос о роли моделировани€ в документоориентированной среде.  ороткий ответ: моделирование €вл€етс€ инструментом дл€ получени€ недостающих знаний. ѕредыдущий опыт не может охватить все случаи проектировани€. Ќедостаток знаний восполн€етс€ путем построени€ цифровых аналогов и их испытанием. ѕолученные в ходе испытаний знани€ добавл€ютс€ в общую базу знаний проекта.

ћожно сказать, что обща€ база знаний проекта содержит конкретизированные в соответствии с местными услови€ми и требовани€ми заказчика:

  • нормативные знани€, т.е. знани€, полученные на основе опыта проектировани€, строительства и эксплуатации реальных объектов в масштабах государства;
  • корпоративные знани€ (то же, но в масштабах организации);
  • индивидуальные знани€, т.е. знани€, основанные на личном опыте участников проекта;
  • дополнительные знани€, полученные в результате цифрового моделировани€.

¬се знани€ должны быть документированы, т.е. стандартным образом оформлены и заверены.

¬ правительственном постановлении информационной моделью называетс€ традиционна€ проектна€ документаци€, дополненна€ при необходимости цифровой информационной моделью. — таким дополнением Ђединый источник истиныї на самом деле €вл€етс€ гибридом, состо€щим из двух разнородных несовместимых источников: документированных знаний и необработанных данных. ѕридумать ответ на вопрос, что за необходимость прикладывать к базе готовых знаний инструменты (модели), с помощью которых кака€-то часть этих знаний была получена, Ч предлагаетс€ заказчику.

ѕроверка документов и моделей

ќдним из основных преимуществ машинопонимаемых документов €вл€етс€ возможность автоматической проверки на соответствие этим документам. ќбъектами проверки могут быть документы более низкого уровн€, цифровые модели и реальные строительные объекты.

ѕроверка проектной документации

ѕроектна€ документаци€ €вл€етс€ законом, источником и критерием истины дл€ реального строительства. ¬ то же врем€, как уже говорилось, веро€тность ошибок в документах, разрабатываемых на стадии рабочего проектировани€, наиболее высока. јвтоматизированна€ проверка проектной документации на соответствие нормативным требовани€м позволит сократить врем€ проектировани€ и повысить надежность прин€тых решений.

ѕроверка документации может быть частью экспертной системы нар€ду с другими част€ми, такими как поиск релевантных знаний и поддержка технических решений.

ѕроверка цифровых информационных моделей

ћеждународна€ организаци€ buildingSMART разрабатывает методы проверки федеральных моделей на соответствие строительным правилам. ‘едеральна€ модель Ч это IFC модель, скомпонованна€ из нескольких внутридисциплинарных моделей.

 ак отмечалось выше, реальные объекты провер€ютс€ не на соответствие нормам, а на соответствие проектной документации. “акого же подхода можно было ожидать и в случае проверки цифровых двойников реальных объектов.

buildingSMART почему-то не рассматривает проектную документацию в качестве источника истины, хот€, по сравнению с нормами, в ней содержитс€ гораздо больше знаний, относ€щихс€ к конкретному объекту проектировани€. »гнорирование этих знаний ведет к тому, что значительна€ часть информации в модели будет документально необоснованной.

ћинстрой в этом вопросе более последователен. ¬ √ќ—“ 10.00.00.01 даетс€ следующее определение дефекта информационной модели.

41 дефект:  аждое единичное отступление от прин€тых на проекте решений, неисполнение требований заказчика и норм или ошибка.

ћинстрой и buildingSMART осознают необходимость проверки моделей на соответствие документированным источникам. ќсталс€ один шаг до осознани€, что эта необходимость полностью дискредитирует идею моделеориентированного подхода.

 одирование вместо вычислени€ знаний

¬ычисление знаний Ч это автоматический перевод с естественного €зыка на низкоуровневый машинный €зык.  одирование Ч ручной или полуручной аналог автоматического перевода.

 одирование вместо вычислени€ знаний Ч пр€мой путь в цифровое болото. »стори€ с  —» подсказывает, что цифровизаци€ в –оссии сворачивает как раз в эту сторону.

—огласно √радостроительному кодексу, использование классификатора строительной информации €вл€етс€ об€зательным условием формировани€ информационной модели. Ќиже приведена одна из таблиц классификатора.

 лассификационна€ таблица

–ис. 1.  лассификационна€ таблица

 расным выделена информаци€, представленна€ на человеческом €зыке. ѕо сути, она €вл€етс€ конкретизацией (контекстом) описани€ элементов традиционного проекта. ќстальна€ часть таблицы Ч это попытка зашифровать контекст с целью использовани€ в информационных модел€х.

÷итаты на сайте ћинстро€.

Ђ лассификатор строительной информации представл€ет собой единый €зык общени€ участников строительного процесса Е  —» обеспечит возможность однозначной идентификации элементов информационной модели Е создаст основу дл€ перевода нормативно-технических документов в электронный видї.

Ђ ласс, подкласс1, тип (%%), код класса по  —–, ”»Ќ, ADAAB020, 05.1.06.04-1575, KSI160000375ї Ч так по версии ћинстро€ должен выгл€деть единый €зык проектировщиков и строителей. —тановитс€ пон€тной интерпретаци€ ћинстроем термина Ђмашинопонимаемыйї. Ќикто не собираетс€ вычисл€ть знани€; собираютс€ перекодировать их на базе €зыков  —» и XML.

Ѕеда в том, что специалист не может пон€ть, проверить, а значит, использовать зашифрованные знани€.

≈диный формат хранени€ знаний

¬опрос, который нужно решить: как хранить и показывать иллюстрированный текст.

ƒо недавнего времени ответ был очевиден Ч бумажна€ технологи€. Ѕумага обладает двум€ уникальными свойствами:

  • хранит информацию в том же виде, в котором ее показывает;
  • практически полностью независима и самодостаточна.

— цифровыми технологи€ми все сложнее.  омпьютер хранит информацию в виде нулей и единиц. ƒл€ приведени€ информации в человеческий вид нужно задействовать дес€тки, если не сотни, программных и технических посредников. —бой в работе любого посредника приведет к искаженному представлению информации.

≈сли считать сокращение зависимости от посредников критерием надежности, то ближайшим компьютерным аналогом бумаги будет технологи€, основанна€ на показе информации в виде растровых изображений. ¬ простейшем случае дл€ хранени€ элемента растра требуетс€ всего три числа: координаты пиксел€ и цветовой код.

Ќедостатком пиксельных изображений €вл€етс€ низка€ производительность обработки по сравнению со специализированными форматами. –ешением вопроса будет пр€мое (перед обработкой) преобразование растрового формата в специализированный формат и обратное (перед сохранением) преобразование специализированного формата в растровый.

ћаркированный растр

јнализ растровых изображений относитс€ к классу задач распознавани€ образов. јлфавитный текст довольно надежно распознаетс€ программами OCR. јнализ рисунков (пиктографического текста) более проблематичен. ѕиктограммы могут располагатьс€ произвольным образом, соприкасатьс€ и накладыватьс€ друг на друга. ƒл€ облегчени€ задачи анализа изображений можно использовать тот же метод, что и в €зыках разметки текстовых документов. ћетками (тегами) в этом случае будут пиксели с зарезервированными цветовыми кодами.

¬ отличие от текстовых маркеров, цветова€ маркировка малозаметна и практически не вли€ет на зрительное воспри€тие.

÷ветовые маркеры считываютс€ при открытии документа, используютс€ в процессе пр€мого преобразовани€ и добавл€ютс€ в растр в процессе обратного преобразовани€ при сохранении документа.

Ќиже Ч пример цветовой маркировки пиктограммы в виде полигонального контура.

÷ветова€ маркировка пиктограммы

–ис. 2. ÷ветова€ маркировка пиктограммы

ѕервый маркер обозначает тип пиктограммы (в данном случае Ђполигонї) и одновременно Ч начальную точку обхода контура полигона. ћаркеры могут быть объединены в цепочку. ¬торой маркер может обозначать направление обхода контура; третий Ч тип линии.

ƒополнительные маркеры размещаютс€ в характерных точках контура и могут обозначать конечные точки, переломы, разветвлени€ и т. п.

¬ растровых машиночитаемых документах нет принципиального различи€ между рисунками и алфавитным текстом. ¬се можно считать текстом, и все Ч рисунками (пиктограммами). Ќапример, текст, приведенный ниже, можно рассматривать как рисунок, состо€щий из вложенных друг в друга пиктограмм.

‘ормализованный растровый текст

–ис. 3. ‘ормализованный растровый текст

— помощью цветовой маркировки задаетс€ тип пиктограммы (Ђтекстї) и ориентаци€ текста. “екст внутри пиктограммы может быть прочитан с помощью технологии OCR.

¬ычисление знаний предполагает, что машинопонимаемость обеспечиваетс€ не шифрованием, а Ђулучшениемї текста: стандартизацией (в том числе использованием нормативной терминологии), структурированием, устранением смысловых противоречий и неоднозначных интерпретаций.

«аключение: что делать?

’ороша€ новость в том, что придумывать ничего не надо. ¬се придумано, работает, и с каждым годом работает все лучше. ѕравда, не в области строительства.

  1. —делать —тройGoogle Ч специализированный строительный сервис, объедин€ющий технологии поиска информации, распознавани€ образов, обработки естественного €зыка, машинного перевода.

    ѕредметной областью дл€ сервиса будет база знаний из нормативной, справочной, архивной и проектной документации, хран€щейс€ в едином растровом формате.

    —ервис будет:

    • находить документы и фрагменты документов по запросу в виде растровой картинки или текста на естественном €зыке;
    • провер€ть документы (в том числе чертежи) на соответствие нормативным документам;
    • распознавать алфавитный текст и переводить его в машиночитаемые и машинопонимаемые форматы (DOC, XML и т.д.);
    • распознавать пиктографический текст и переводить его в машиноисполн€емые форматы (DXF, IFC и т. д.);
    • на основе контекста автоматически формировать  —» коды элементов.
  2. ƒавно пора сделать замену Ђавтокадаї. Ќе очередной клон, а редактор пиктографического текста.


ѕлоха€ новость в том, что дес€ть лет потрачено на методологию, котора€ в насто€щее врем€ представл€ет собой Ђтонущий корабль, покинутый капитанамиї. Ќе исключено, что выгрузка с корабл€ займет еще дес€ть лет.

ѕока все идет как и должно идти, когда сложный неоднозначный вопрос поручено решить чиновникам: бурный прогресс на бумаге; застой и головна€ боль на местах.


„итайте также:


¬акансии:

јктуальное обсуждение

RSS-лента комментариев

ƒавид Ћевин
ƒавид Ћевин
ќт редактора: BIM? ¬ерю!
ѕроект ЂЌародное —јѕ–-интервьюї

—лучайна€ стать€:

BIM и “еатр: искусство возможного. „асть 3 — ћари€ «олотова, —офь€ ћинина, ¬ладимир “алапов (25 марта 2024)
isicad Top 10

—амые попул€рные материалы

   ‘орумы isicad:

isicad-2010 isicad-2008
isicad-2006 isicad-2004

ќ проекте

ѕриглашаем публиковать на сайте isicad.ru новости и пресс-релизы о новых решени€х и продуктах, о проводимых меропри€ти€х и другую информацию. јдрес дл€ корреспонденции - info@isicad.ru

ѕроект isicad нацелен на

  • укрепление контактов между разработчиками, поставщиками и потребител€ми промышленных решений в област€х PLM и ERP...
ѕодробнее

»нформаци€ дл€ рекламодателей


¬се права защищены. © 2004-2024 √руппа компаний «Ћ≈ƒј—»

ѕерепечатка материалов сайта допускаетс€ с согласи€ редакции, ссылка на isicad.ru об€зательна.
¬ы можете обратитьс€ к нам по адресу info@isicad.ru.