2021년 9월 6일 월요일

BIM, 머신러닝과 데이터 마이닝

BIM, 머신러닝과 데이터 마이닝에 대한 좋은 기사가 있어 소개합니다. BIM이 일종의 건설데이터베이스로써 역할을 할 수 있고, 이기종 데이터셋을 연결할 수 있는 미들웨어 역할을 할 수 있을 때, 그 다음 단계는 당연히 필요한 정보를 얻어내는 데이터 마이닝일 것입니다. 이를 위해 우리는 머신러닝과 같은 데이터 사이언스가 필요하겠죠. 이 글은 AECbyte 기사(Rashid Siddiqui, 2018)를 참고하였음을 밝힙니다. 


개요
BIM (Building Information Modeling) 기술은 초기 계획, 설계, 건설, 운영에서 운영에 이르기까지 시설의 수명주기 전반에 걸쳐 건축, 엔지니어링, 건설 소유 운영 산업에 의해 광범위하게 구현된다. 충돌 감지, 4D 스케쥴링, 5D 견적, 6D 지속 가능성, 7D 설비 관리 및 레이저 스캐닝과 같은 다양한 프로세스를 지원한다. 업계 커뮤니티는 BIM에 대한 표준을 개발했다. 여기에는 COBie (건물 정보 교환), IFC 및 LoD (세부 수준 / 개발 수준) 등이 있다. BIM 기술의 사용이 늘어남에 따라 기본 BIM 데이터를 이해하고 탐색하는 것이 매우 중요하다.

BIM의 주요 이점은 여러 분야가 함께 작동하고 단일 모델로 공동 작업 할 수 있다는 것이다. 단일 모델을 사용하면 특히 대규모 프로젝트의 경우 어려움이 있다. 이러한 문제는 일반적으로 하드웨어 제한, 소프트웨어 상호 운용성 및 모델 관리 제한과 관련된다. 솔루션은 여러 모델과 다른 데이터베이스 (예 : 4D, 5D 등)를 사용하는 WBS (Work Breakdown Structure) 를 사용하는 것이다. 

WBS 솔루션을 사용할 때 "빅 데이터"활용이 필요할 때가 있다. 빅 데이터 간 불일치를 해결하고 BIM 표준 및 요구 사항의 정확성을 유지하는 데는 많은 시간이 소요된다. 데이터 사이언스는 혁신적인 워크 플로 변경을 통해 비즈니스 요구 사항 및 사용 가능한 데이터베이스에 따라 효율성을 최적화 할 수 있다. 이 기사에서는 데이터 과학, 워크 플로 및 BIM과 관련된 주요 문제의 하위 필드에 대해 중점적으로 다룬다. 다음 그림은 BIM, 데이터웨어 하우스 및 데이터 사이언스 관계를 함께 보여준다.

데이터를 추출하기 위해, ETL (Extract Transform Load) 프로세스라고 불리는 다양한 데이터 리소스 및 형식 (예 : BIM 컨텍스트에서의 다 분야 BIM 모델, 4D, 5D, COBie 등)에서 정보를 추출하는 과정이 필요하다. 기본적으로 다음 그림과 같이 데이터가 응답하는 5 가지 주요 질문이 있다.

데이터가 대답 할 수있는 다섯 가지 질문

추출 변환 및 로드 (ETL)

ETL은 다양한 자원 및 형식에서 정보를 추출하고 원시 데이터를 균일 한 데이터 구조로 변환하는 데 사용되는 프로세스로 데이터웨어 하우징 및 데이터 통합에 적합하다. 다음은 데이터웨어 하우스에 저장되기 전에 ETL 프로세스를 거칠 수 있는 건물 관련 정보의 예를 보여준다. BIM 데이터베이스에는 일반적으로 구조화, 반 구조화 및 비 구조화의 세 가지 유형의 데이터가 포함된다. 이들 각각은 아래에 설명 된 ETL 프로세스를 거쳐야한다.

데이터웨어 하우스로 추출, 변환 및로드 할 수있는 건물 관련 정보의 예

추출 : ETL 프로세스의 초기 부분에는 BIM 모델 (예 : 문, 레벨 및 공간과 같은 모델 요소), Excel 스프레드 시트, HTML 파일 및 플랫 파일과 같은 다양한 데이터 리소스에서 중요한 BIM 데이터를 추출하는 과정이 포함된다. 

변환 : 다음 프로세스는 변환이며, 대상 데이터웨어 하우스에 적합한 데이터를 준비하는 데 필요한 가장 중요한 ETL 프로세스 중 하나이다. 변환 프로세스에서는 다양한 기능이 데이터에 적용된다. 기능에는 데이터 유형 식별, 데이터 정리, 누락 된 값 찾기 및 원하는 열 지정이 포함된다. 이러한 기능은 추출 된 데이터에 적용되어 데이터웨어 하우스 및 균일 한 데이터 구조에로드되기 전에 데이터의 품질을 보장한다.

로드 : ETL 프로세스의 마지막 단계는 추출 및 변환 된 데이터를 대상 데이터웨어 하우스에로드하는 것이다.


기계 학습 알고리즘

기계 학습은 데이터 사이언스의 하위 분야이다. ETL 프로세스를 거쳐 데이터웨어 하우스에 저장된 정보는 기계 학습을 용이하게 한다. 기계 학습은 명시적인 프로그래밍없이 질문에 대한 해답을 예측하기위한 데이터 집합 및 알고리즘에 의존한다. 단순화 된 설명으로서, 기계 학습은 다양한 종류의 기계 학습 알고리즘을 사용하여 훈련 데이터 세트를 포함한다.

예를 들어 사용자가 BIM 표준, 프로젝트 표준, BIM 실행 계획 또는 기타 BIM 문서와 비교하여 BIM 모델에서 정보가 참인지 거짓인지 예측할 수 있다고 가정하자. 기계 학습 알고리즘을 사용하여 주어진 요소 (예 : 선 두께, 색상, 선 패턴 등)를 입력 데이터로 사용하여 예측을 수행 할 수 있다. 응답은 BIM 데이터 세트에 적용된 알고리즘에 따라 true / false / missing 일 수 있다. 출력은 ETL로 처리되는 새 데이터에 대한 예측을 생성 할 수 있다. 이 개념을 설명하기위한 간단한 예는 주어진 이메일이 스팸인지 여부를 식별하는 이메일 필터링 알고리즘이다. 원하는 수준의 정확도가 달성 될 때까지 프로세스를 계속하도록 기계학습 할 수 있습니다.

일반적으로 사용되는 두 가지 유형의 기계 학습 알고리즘은 감독 학습 알고리즘과 비감독 학습 알고리즘이다.

감독 학습 알고리즘. 감독 학습 알고리즘은 요소가 시스템에 분류되어 입력 및 출력 데이터 모두를 쉽게 훈련 할 수 있으므로 시스템이 문제를 해결하기위한 정확한 통찰력을 생성 할 수 있기 때문에 BIM에서 가장 일반적으로 사용된다. 다음은 일반적으로 사용되는 감독 학습 알고리즘입니다.

  • 분류
  • 회귀 분석

비감독 학습 알고리즘. 감독되지 않은 학습 알고리즘에는 카테고리 정보가 없다. 요소를 범주화하기 위해 추가 요소 기능 (예 : 요소 모양 및 크기)을 추가해야 한다. 감독되지 않은 학습 알고리즘의 목적은 데이터를 분류하여 출력을 분류하는 것이다. 다음은 흔히 사용되는 감독되지 않은 학습 알고리즘이다.

  • 클러스터링
  • 차원 감소

다음 두 가지 예는 BIM 데이터에서 발생할 수있는 문제를 설명한다. 다음은 하나의 잘못된 출력과 5 개의 실제 출력이있는 기계 학습 알고리즘을 보여준다. 

잘못된 출력을 식별하는 감독 학습 분류 알고리즘.

다음 그림은 훈련 된 데이터 세트 및 기계 학습 알고리즘 출력 인 모델 A 및 모델 B를 보여준다. 모델 A는 훈련 된 데이터 세트 (왼쪽 열)와 일치하지 않으며 모델 B 출력에 레벨 4가 누락되어 허위 레벨 3을 갖는다.

허위 정보와 누락 정보를 식별하는 감독 학습 분류 알고리즘.

데이터 시각화

기계 학습 결과물은 그래픽 형식으로 제공되어 사용자가 데이터의 불일치 또는 불완전한 부분을 파악할 수 있다. 예를 들어, AECOM은 ETL 프로세스 및 기계 학습 알고리즘을 실행하여 BIM 데이터의 문제를 예측하고 다음 시각화 도구를 사용하여 보고서 및 통찰력을 제공하는 도구를 내부적으로 개발했다. 데이터 시각화는 프로젝트 팀을 지원하는 데 필요한 여러 수준에서 생성 될 수 있다. 프로젝트 레벨, 모델 레벨 및 요소 레벨에서 생성 할 수 있다. 이 수준에서 시각화를 제공하면 사용자가 동일한 정보를 다른 수준의 세부 정보로 볼 수 있다.

정보의 전체 프로젝트 상태를 보여주는 데이터 레벨 시각화 (True / False).

모델 수준 정보의 상태를 보여주는 데이터 시각화 (True / False).

요소 정보 (True / False)의 상태를 보여주는 데이터 레벨 시각화 및 기계 생성 분야 문제를 해결하기위한 작업 관리자.

요소 정보의 상태를 보여주는 데이터 레벨 시각화. 

아래 그림은 ETL 및 기계 학습 알고리즘을 사용하여 데이터 과학에 대한 성공적인 결과를 보여주는 시각화를 보여준다. 모든 모델의 정확성을 보여줄 수 있다.

모든 모델에서 일관된 모델 레벨 입면도를 보여주는 예.

모든 모델에서 일치하는 기둥 그리드를 보여주는 예.

결론

컴퓨터 학습 알고리즘을 사용하면 사람이 BIM 데이터 불일치를 식별하고 정보를 수동으로 확인하는 데 필요한 시간을 크게 줄일 수 있다. 

데이터 사이언스는 몇 분 이내에 데이터 시각화 및 보고서를 생성하고 모든 장치 및 보안 장치에서 액세스 할 수있는 클라우드를 통해 정보를 공유하는 데 도움이 된다. 시각화 및 보고서는 시간별, 일별 및 주별로 생성 할 수 있다. 건축, 엔지니어링, 건설 및 소유자 / 운영자 산업은 BIM 기술 및 BIM 표준에 크게 투자 해 왔으며 이와 관련된 실행 계획, 정책 및 절차를 개발했다. BIM 데이터를 효과적으로 사용하는 것이 비즈니스 의사 결정을 개선하는 데 중요하다. 


레퍼런스

댓글 없음:

댓글 쓰기

2024년 하반기 스마트 건설과 생성AI 기술 동향

이 글은 2024년 하반기 스마트 건설과 생성AI 기술 동향에 대한 내용을 정리한다. 머리말 건설 분야에서도 제조업과 마찬가지로 생성 AI의 시대가 도래하고 있다. 2023년 글로벌 건설 시장 내 인공지능(AI) 규모는 9억 3,356만 달러에서 20...