CADでダークデータをマイニングしてデジタルツインを構築
エンジニアリング ソフトウェア開発会社が、CAD から GIS への変換イニシアチブが直面している重要な課題の 1 つにどのように対処したか。
共有
カテゴリー: エンタープライズエンジニアリング
この記事は、著者のGavin Schrockが執筆したもので、GoGeomaticsに掲載されたものです。
2023年11月10日
理論的には、設計図からフィーチャを収集して GIS にデータを取り込み、拡張することは、かなり簡単な提案です。 しかし、現実には、これを実行するのは簡単ではありません。 確かに、レベル(またはレイヤー)とセル(またはブロック)によって区別されるCAD図面の線画とシンボルは、関連性のある空間参照フレームワークで提示されていれば、GISスキーマにシームレスに変換されるはずですか? 悪魔は細部に宿るとよく言われますが、レガシーCADの場合、細部を認識できないことが悪魔である可能性があります。
Phocaz Inc.の最高技術責任者であるMark Stefanchuk氏は、「CAD標準は、常に厳密に遵守されているわけではなく、進化している点です。たとえば、2000年以前はレベルに番号が付けられていましたが、後にレベル名に進化しました。 設計者は、特に急いでいるときは、CAD標準を使用しない傾向があります。 線、円、ボックステキストなどの基本要素にセルをドロップしたり、グループ化したりして、保持したい属性が失われる状況に遭遇しました。」
契約した設計会社との断絶、異なる基準を必要とする資金提供プロジェクト、レベル/セルの命名スキーマに関する従来の常識の進化などがあります。 たとえば、一部のエンジニアリング事業体は、純粋に設計どおりのフィーチャと竣工時(またはレコード図面)のフィーチャを区別するために標準を拡張しています。 「CAD標準を再び進化させる必要がある場合は、何年も前に存在していたものから現在存在するもの、そして将来望むものへと移行する手段を開発する必要があります」とStefanchuk氏は述べています。「これはほとんどすべての組織で起こります。基準を他の組織よりも適切に管理している組織もあります。 確かに、例えば運輸省のクライアントでは、プロジェクトごとに、人々がセルを崩壊させたり爆発させたりする異常が見られます。
ダークデータ
「CAD-GIS の移行に関する議論でよく出てくることの 1 つは、なぜレガシー データを扱う必要があるのかということです」と、Phocaz Inc. の共同創業者兼 CEO である Mary A. Ramsey 氏は述べています。
私たち、そしてクライアントの考えは、レガシーデータを持っている人なら誰でも、そもそもそのデータを取得するために多額の投資、さらには数百万ドルを投資しているということです。」 何十年にもわたってCADレコードを作成するのに莫大な投資になる可能性があります。少なくとも、これらの記録からできるだけ多くの情報を得ようとするのは理にかなっています。
「運輸省(DOT)の場合、それは納税者のお金です。 これらのデジタル資産には多額の投資が行われており、これからより多くの報酬を得る必要があります。 ですから、そこにあるデータの分析を始めましょう。 レベルやセル名などで自動抽出できないもの、それが「ダークデータ」です。 しかし、それは幾何学としての図面であり、完全に抽出できるとしたら、そこにある価値を想像してみてください。」 インフラのダークデータが話題になっています。 インフラの文脈では、ダークデータとは、データ規則の進化、標準への準拠の欠如、組織の知識への過度の依存、不十分なデータ管理などにより、他の方法では簡単にアクセスできない貴重なデータを指しますが、AIはそれをマイニングする新しい方法を可能にしています。 そして、それこそが、運輸部門の顧客のCADアーカイブからダークデータをマイニングするためにPocazが採用したアプローチです。
もう一つの疑問は、「なぜモバイルマッピングとドローンではないのか」ということです。 近年、モバイルマッピングとドローンによるデータキャプチャは見事に進化しています。 精度、位置精度、特徴認識の自動化、および現場作業の簡素化の進歩。 しかし、現実には、何万マイルもの高速道路の回廊をキャプチャするには数百万ドルの費用がかかり、それでもこれらのテクノロジーではすべてのフィーチャをキャプチャすることはできません。 何十年にもわたるCAD設計と記録図面の埋没費用は、エンタープライズGIS(デジタルツインに進化している)を大幅に入力/拡張するために採掘するための潜在的に費用対効果の高いリソースとして際立っています。
生産性の向上
「私たちは、主にコンピューター支援設計分野向けのソフトウェア開発サービスを提供する手段として Phocaz を始めました」と Ramsey 氏は述べています。 「特に土木工学ユーザー向け。 Civil 3 D、Bentley MicroStation、OpenRoads (もちろん当時は InRoads だったはず) など。 私たちは基本的に、これらのプラットフォームと基本製品で実行されるクライアント向けのアドインを開発および保守していました。 私たちは現在もこの種の作業を続けており、その方針に沿ったDOTや他のインフラストラクチャクライアントのために多くの作業を行っています。」
長年のクライアントであるジョージア州運輸省(GDOT)から「CADファイルからデータを収集し、抽出を自動化してエンタープライズGISに取り込むことは可能ですか?」というリクエストがあったとき、CAD-to-GISソリューションに関するPocaz氏は述べています。 これが、GDOTがCLIPと名付けた「CAD Level Integration Process」の起源です。 Phocaz氏はまず、これを行うために設計された既存のツール(CAD環境内にもいくつかある)を特定しました。 「私たちはすぐに、これらのプロセスは少し遅く、DOTが採掘したいと思っていたCADアーカイブの膨大さを考えると実用的ではないことに気付きました。 生産を管理する方法や、そのような作業によって生成される膨大な量のデータは言うまでもありません。」
このソリューションは、GDOTやその他の大規模なインフラストラクチャクライアントのニーズを満たすためにスケーラブルである必要がありました。 「例えば、GDOTは 80,000 センターラインの車線マイルと連邦政府の援助ルートを管理しています」とステファンチュク氏は述べています。「これは州内の高速道路の約3分の1に相当します。おそらく州内の車線 250,000 マイルに近いでしょう」。 何マイルにもわたる高速道路のCADファイルを「マイニング」する機会(および課題)を抱えているのはジョージア州だけではありません。 50 州ごとのレーンマイルの合計を見てください。 Pocazは、AIを活用したアルゴリズムの開発に着手し、デジタルツインアプローチを採用し、生産とデータ管理にBentley Systems ProjectWiseを導入しました。
バーチャルロボットカー
当初は、CAD図面をスキャンして、レベルとセル名で認識できる低空飛行の成果を探すだけでした。 しかし、一度だけ「デジタルレーンを運転」して、特徴を包括的に抽出する方がうまくいきました。
コンセプトは、AIが車線に沿って進みながら図面を調べ、その場で特徴をキャプチャすることでした。 LiDAR/Imagingモバイルマッピング搭載車両で各車線を運転するのとほぼ同じです(ただし、コストは数分の一です)。 しかし、AIカーが走行を開始する前に、一貫した空間環境が存在する必要があります。 幸いなことに、Stefanchuk氏が指摘するように、CADの設計アプローチは、モデルで作業し、参照を取り込み、そこからシートを切り取るというものでした。 したがって、ほとんどの場合、図面は「駆動」する準備ができています。 DGN (MicroStation) 環境で動作する DOT クライアントの場合、Bentley ProjectWise の選択が図面、抽出の進行状況、結果データの管理に特に適していることがわかりました。
将来のアプリケーション
そのため、CAD標準を再び進化させる必要がある場合は、何年も前に存在していたものから現在存在するもの、そして将来望むものに移行する手段を開発する必要があります。
—マーク・ステファンチュク
ProjectWiseはBentley Systemsのプロジェクト管理スイートで、複数の分野やフォーマット、プロジェクトのライフサイクル全体にわたるデータのハブとして機能し、デジタルツイン環境での作業を可能にします。 運輸部門の顧客の多くは主に Bentley 環境 (DGN や MicroStation、関連する設計ソフトウェア パッケージなど) で作業しているため、このスイートで CLIP プロジェクトを管理するのは理にかなっています。
「CLIPカー、つまりロボットカーは、アルゴリズムで何が起こっているのかを理解するための視覚化されたセッションツールです」とStefanchuk氏は述べています。「エンドユーザーがそれを見ることはありません」 と言わざるを得ませんが、ロボットカーのデモが描かれているのを見るのは楽しかったです。 「彼らが最終的に求めているのは、GIS 環境内のフィーチャの中心線グラフィックスと、それらに割り当てられたプロパティです。」
高速道路沿いの任意の地点でこれらの特性が何であるかを調べるために、Phocaz はそれらの特徴を調べて見つけることができるツールを開発しました。 AI は、自転車レーンのマーキング (郡によっても大きく異なる可能性があります) など、フィーチャのさまざまな空間的側面についてトレーニングされ、標準の通行権の幅をカバーするためにどれだけ並んでいるかなど、他のルールを適用します。 「アルゴリズムに何をさせたいのかを概念化し、視覚化する必要がありました」と Stefanchuk 氏は言います。「田園地帯を通る曲がりくねった道、現実世界での運転方法、フロントウィンドウとサイドウィンドウから見えるものについて考えました。 次に、AIにチャネル化されたCADレーンを「移動」させ、AIが目にする可能性のあるものから学習する方法です。」
「CLIP/ロボットカーが実際に有利な場所がいくつかあります」とStefanchuk氏は言います。「その1つは、すべてのデータを一度に収集する必要はなく、その時点で見たものを収集し、それに基づいて決定を下し、レポートの準備が整うまで梱包し、高速道路を下り続けるだけでよいということです。 舗装標示のようなものを見つけたら、その舗装標示が何を表しているのかを理解するために、いくつかのビジュアルAIモデルを使用できます。」
「CLIPプロジェクトから学んだことは、右折矢印や左折矢印などの記号から始めて、それを検出するようにAIに教えることができるということです」とStefanchuk氏は述べています。「しかし、そこから推測できること、例えば、どのような車線を走っているかなどに基づいて、他の決定を下すことができます。 右折車線、通過車線、左折車線、Uターン車線などを運転していますか。
Phocazは、舗装のマーキングだけに着目したわけではありません。 舗装標示と同じアプローチを使用します。任意のセルライブラリにある任意のセルの機械学習モデルを作成できます。 「私たちのAIの頭脳は機械学習モデル(MLM)です」とステファンチュク氏は言います。「CLIPとは別のアプリケーション(Phorz AIと呼ばれる)である当社のソフトウェアは、右折矢印、自転車レーン、私道、暗渠などの1つ以上のセル(シンボル)から始めて、独自のMLMを作成する方法をユーザーに案内します。 ユーザーが作成したMLMを適用して、任意のiTwin(デジタルツイン)モデルでこれらのオブジェクトを検出できます。 CADプロジェクトの特徴を検出できるMLMを誰でも簡単に作成できるようにするというアイデアでした。 GDOTのCLIPの場合、MLMをトレーニングしたので、このステップを実行する必要はありません。」 他のクライアントのプロジェクトでは、マスターモデルが作成されますが、セルやシンボルは都市や郡などによって異なるため、ユーザーがAIを拡張したり教えたりするための扉は開いたままになります。
Phocaz は最近、 2023 10 月 11日から12日にシンガポールで開催された毎年恒例の Year in Infrastructure Going Digital Awards のエンタープライズ エンジニアリング部門のファイナリストとして表彰されました。 同じイベントで、Bentley Systemsの最高技術責任者(CTO)であるJulien Moutte氏の基調講演では、CADの高速道路図面から左折矢印を抽出するCLIPのデモが行われました。 「GDOTは、CAD図面が資産データの豊富なソースになると信じていました」とMoutte氏は述べています。 「しかし、そのデータにアクセスするには、何千枚もの設計図や図面を手作業で収集し、各資産を目視で検査する必要があり、数え切れないほどの時間を費やしていました。 ダークデータに光を当てるために、Phocaz氏はProjectWise powered by iTwinを使用して、特徴検出と空間参照を備えたAIを使用してより効率的に分析できるデジタルツインを作成しました。 Phocaz氏はさらに踏み込んで、斬新なAI技術を使ってモデル間のギャップを埋めました。 彼らは、センターラインを検出しながらデジタルツイン内の車線に沿って仮想的に走行できる AI AGENTを作成しました。 AIの自動化により、データを抽出するプロセスは、クライアントにとって法外な時間やコストではなくなります。
将来のアプリケーション
「CLIPは、輸送業界のお客様のこの問題を解決するために開発した独自のワークフローです」とRamsey氏は述べています。 「私たちは、私たちが取り組んでいる前提条件である道路の文脈から始めることができます。 ですから、必ずしも建築に当てはめることはできません。 しかし、そのコンテキストが何であるかを理解すれば、そのような設計からデータを収集する方法について考え始めることができます。」
このアプローチは、インフラストラクチャのどのようなアプリケーションに適用できますか? ユーティリティがすぐに思い浮かびます。 伝送ネットワークと配電ネットワークがあり、テレフォニー ネットワークと通信ネットワークの場合は、線形フィーチャと付属装置のタイプの両方の解析をさらに洗練させるのに役立つルールベースの接続要素があります。 地下設備に関しては、すべてのフィーチャを物理的に配置することが非現実的であることを考えると、CAD フィーチャの抽出の自動化は非常に貴重です。 この種のソリューションを使用して、スキャンされた設計図面からの特徴の抽出に成功する可能性は否定できません。 ただし、空間参照の課題 (縮尺と位置のレジストレーション) に加えて、ラスターからベクターへの変換の品質と完全性があります (ただし、これらを強化するために AI を使用して多くの進歩を遂げています)。
地方自治体、公益事業、キャンパスがデジタルツインの構築を模索する中、完全な物理データキャプチャと竣工調査のコストが、より広範な採用の障害となっています。 しかし、ある種の設計図面なしで構築された地物はほとんどなく、少なくとも過去40年以内のものについては、この方法で採掘できるCAD図面が存在する可能性があります。 何百万ものCADSファイルには、膨大な量のダークデータが潜んでいます。 それをより有効に活用する時が来ました。