MicroStrategy ONE

Azure Data Lake 저장소 2세대

ADLS2(Azure Data Lake Storage Gen2)는 Azure Blob Storage와 완전히 통합된 데이터 레이크 플랫폼입니다. MicroStrategy Cloud 개체 커넥터는 ADLS2에 대한 액세스를 제공하여 폴더와 파일을 신속하게 찾아보고 ADLS2로 가져올 수 있습니다. MicroStrategy 큐브.

이 페이지에서 다음 주제를 살펴보세요.

  1. 연결 매개변수 준비
  2. DBRole 생성
  3. 데이터 가져오기
  4. 제한 사항

연결 매개변수 준비

Cloud Object Connector가 ADLS2 파일 시스템을 성공적으로 탐색하려면 계층적 네임스페이스가 있는 스토리지 계정이 필요합니다. 스토리지 계정 생성에 대한 자세한 내용은 다음을 참조하세요. 마이크로소프트 문서.

스토리지 계정이 생성되면 두 개의 액세스 키가 부여됩니다. 둘 중 하나를 사용하여 연결을 만들 수 있습니다.

DBRole 생성

Azure Data Lake Storage Gen2 Cloud Object Connector에 액세스하세요. MicroStrategy Web 또는 워크스테이션.

  1. Add Data(데이터 추가) > New Data(새 데이터)를 선택합니다.
  2. 찾아서 선택하세요 Azure 데이터 레이크 스토리지 Gen2 데이터 소스 목록의 Cloud Object 커넥터.

  3. 데이터 소스 옆에 있는 새로운 데이터 소스 새로운 연결을 추가하려면

  4. 연결 자격 증명을 입력하세요.

    • 연결 이름: 새 연결의 이름
    • 컨테이너: 액세스하려는 컨테이너
    • 입증: 사용하려는 인증 방법
    • 디렉터리(테넌트) ID: 각 구독과 연결된 ID
    • Azure 저장소 계정: Azure Storage 데이터 개체가 포함된 스토리지 계정
    • Azure 저장소 비밀: Azure Storage와 연결된 비밀
  1. 왼쪽 패널에서 데이터 세트 옆에 있는 새 데이터 세트 만들기 .

  2. 찾아서 선택하세요 Azure 데이터 레이크 스토리지 Gen2 데이터 소스 목록의 Cloud Object 커넥터.

  3. 데이터 소스 옆에 있는 새로운 데이터 소스 새로운 연결을 추가하려면

  4. 연결 자격 증명을 입력하세요.

    • 연결 이름: 새 연결의 이름
    • 디렉터리(테넌트) ID: 각 구독과 연결된 ID
    • Azure 저장소 계정: 스토리지 계정
    • 컨테이너: 액세스하려는 컨테이너
    • 클라이언트 ID: 사용된 클라이언트 ID
    • 클라이언트 비밀번호: 클라이언트 ID와 연결된 클라이언트 비밀번호

데이터 가져오기

커넥터를 성공적으로 생성한 후에는 다음 위치로 데이터를 가져올 수 있습니다. MicroStrategy.

  1. 새로 생성된 연결을 선택합니다.
  2. 특정 컨테이너 아래의 폴더나 파일을 찾아보세요.
  3. 파일을 두 번 클릭하거나 오른쪽 창으로 끌어다 놓습니다.

    미리보기 창에서 샘플 데이터를 확인하고 열 유형을 조정할 수 있습니다.

  4. 큐브 게시 MicroStrategy 선택한 데이터로.

제한 사항

지원되는 파일 유형

다음 파일 형식만 지원됩니다.

  • .json
  • .쪽매 세공
  • .유로
  • .orc
  • .csv
  • 델타 형식

폴더 선택

전체 폴더를 선택할 때 폴더는 다음 요구 사항을 충족해야 합니다.

  • 폴더 아래의 모든 파일은 동일한 파일 형식을 가져야 합니다. 파일 형식을 선택하라는 대화 상자가 표시됩니다.
  • 모든 파일은 동일한 스키마를 공유합니다.
  • 폴더에 하위 폴더가 있는 경우 하위 폴더는 유효한 분할 형식이어야 합니다. 다음은 유효한 폴더 구조의 예입니다.

스파크 제한

  • 각 줄 바꿈이 완전한 JSON으로 포함된 JSON 파일만 읽을 수 있습니다.
  • 특수 문자(, ; { } \ = " .)가 포함된 Parquet 파일을 읽을 수 없습니다.
  • 열 데이터 유형이 INT32(UINT_8)/(UNIT_16)/(UNIT_32)/(TIME_MILLIS)인 Parquet 파일은 지원되지 않습니다.
  • 바이너리 유형의 열은 큐브에 게시할 수 없습니다.
  • 필드 이름에 "_col" 접두사가 붙은 ORC 파일(예: _col0, _col1)(파일 스키마에 중첩된 구조, 배열 또는 맵 필드가 하나 이상 포함되어 있음)은 가져올 수 없습니다.

기능

다음 기능은 지원되지 않습니다.

  • 업로드 중 MicroStrategy Cloud Object Connector에 연결하는 파일
  • 데이터 가져오기 시 데이터 랭글링
  • 데이터 가져오기에서 지리 정의
  • Schedule Cube 게시를 위한 고급 일정
  • 데이터 가져오기의 그룹 테이블