본문 바로가기

Microsoft Fabric/Fabric 실습 3 - Dataflow

(5)
05. 파이프라인에 Dataflow 추가 Dataflow를 파이프라인의 활동으로 포함할 수 있습니다. 파이프라인은 데이터 수집 및 처리 작업을 오케스트레이션하는 데 사용되며, 이를 통해 예약된 단일 프로세스에서 Dataflowfmf 다른 종류의 작업과 결합할 수 있습니다. 파이프라인은 Data Factory 환경을 비롯한 몇 가지 다른 환경에서 만들 수 있습니다. Fabric을 사용하는 작업 영역을 선택하고 상단의 "새로 만들기"를 클릭하여 "데이터 파이프라인"을 선택합니다. 파이프라인 이름을 입력하고 저장하면 파이프라인 편집기가 열립니다. "파이프라인 활동 추가"를 클릭하고 "데이터 흐름"을 클릭합니다. 데이터 흐름 활동을 선택한 상태에서 "설정" 탭을 클릭하고, "데이터 흐름" 선택 목록에서 이전에 만든 Dataflow를 선택합니다. 상단의..
04. Dataflow Gen2 데이터 수집 데이터 파이프라인 통합 데이터 파이프라인은 Data Factory 및 데이터 엔지니어링 워크로드에서 쉽게 만들 수 있습니다. 파이프라인은 데이터 엔지니어링의 일반적인 개념이며 오케스트레이션할 다양한 활동을 제공합니다. 데이터 복사 Dataflow 통합 Notebook 추가 메타데이터 가져오기 스크립트 또는 저장 프로시저 실행 Dataflow Gen2 사용해 보기 Dataflow Gen2 다양한 데이터 원본에 연결하고 Power Query Online에서 변환을 수행합니다. 그런 다음 데이터 파이프라인에서 레이크하우스 또는 기타 분석 저장소로 데이터를 수집하거나 Power BI 보고서에 대한 데이터 세트를 정의하는 데 사용할 수 있습니다. 1. 레이크하우스 만들기 Fabric을 사용할 수 있는 작업영역에서..
03. Dataflows Gen2 살펴보기 Dataflows는 확장 가능한 데이터 변환 프로세스를 빌드하고 실행하기 위한 클라우드 기반 ETL(추출, 변환, 로드) 도구의 유형입니다. Dataflows Gen2는 Power Query Online을 사용하여 ETL 작업을 수행하는 쉽고 재사용 가능한 방법을 제공합니다. Dataflows Gen2 사용에 대한 이점과 제한 사항 이점: 표준 날짜 Dimension 테이블과 같은 일관된 데이터로 데이터를 확장합니다. 셀프 서비스 사용자가 데이터 웨어하우스의 하위 집합에 개별적으로 액세스할 수 있도록 허용합니다. 데이터 흐름을 통해 성능을 최적화하고 재사용을 위해 데이터를 한 번 추출하여 느린 원본의 데이터 새로 고침 시간을 줄입니다. 대규모 분석가 그룹에만 데이터 흐름을 노출하여 데이터 원본 복잡성을 ..
02. Data Factory 데이터 복사 작업 Fabric을 사용하도록 설정한 작업 영역에 들어갑니다. Fabric 작업영역 설정은 기존 포스팅을 참고하시면 됩니다. 2024.01.22 - [Microsoft Fabric/Fabric 실습 시리즈 1] - 02. Microsoft Fabric 평가판 사용하기 상단의 새로 만들기를 클릭하여 데이터 파이프라인을 선택합니다. 새 파이프라인의 이름을 지정하고 만들기를 클릭합니다. 파이프라인 화면 중앙에 데이터 복사를 클릭하고 데이터 복사 도우미를 사용하여 데이터 복사 작업을 구성할 수 있습니다. 또는 "활동" 탭에서 "데이터 복사" 버튼을 클릭하여 "캔버스에 추가"를 클릭하면 캔버스에서 해당 작업을 선택하고 아래 창에서 해당 설정을 편집할 수 있습니다. 다음과 같은 다양한 데이터 원본 연결이 지원됩니다. 변..
01. Fabric Data Factory 파이프라인 데이터 파이프라인은 일반적으로 하나 이상의 원본에서 데이터를 추출하고 대상에 로드하며 종종 그 과정에서 데이터를 변환함으로써 전체 프로세스를 오케스트레이션하는 일련의 작업을 의미합니다. 파이프라인은 일반적으로 운영 데이터 저장소에서 레이크하우스 또는 데이터 웨어하우스와 같은 분석 데이터 저장소로 트랜잭션 데이터를 수집하는 ETL(추출, 변환 및 로드) 프로세스를 자동화하는 데 사용됩니다. Microsoft Fabric의 파이프라인 Microsoft Fabric의 파이프라인은 데이터 이동 및 처리 태스크를 수행하는 일련의 활동을 집약합니다. - 데이터 전송 및 변환 활동을 정의하고 - 분기, 반복 및 기타 일반적인 처리 논리를 관리하고 - 이러한 활동을 오케스트레이션할 수 있습니다. Fabric의 파이프라..