logo

SSIS 튜토리얼

SSIS 튜토리얼

SSIS 자습서는 SQL Server Integration Services의 기본 및 고급 개념을 제공합니다. SSIS 튜토리얼은 초보자와 전문가를 위해 설계되었습니다.

SQL Server 통합 서비스 데이터 추출, 변환, 데이터 로딩에 사용되는 빠르고 유연한 데이터 웨어하우징 도구입니다. 한 데이터베이스에서 SQL Server, Oracle, Excel 파일 등과 같은 다른 데이터베이스로 데이터를 쉽게 로드할 수 있습니다.

이 튜토리얼에서는 다음 주제에 대해 논의합니다.


SSIS란 무엇입니까?

  • SSIS는 SQL Server 통합 서비스를 나타냅니다.
  • 이는 광범위한 통합 작업을 수행하는 데 사용되는 Microsoft SQL Server 데이터베이스 소프트웨어에서 사용할 수 있는 구성 요소입니다.
  • 데이터 추출, 데이터를 다른 데이터베이스에 로드, 데이터 정리, 집계, 병합 등과 같은 변환에 사용되는 데이터 웨어하우징 도구입니다.
  • SSIS 도구에는 이메일 메시지 보내기, FTP 작업, 데이터 소스와 같은 그래픽 도구 및 창 마법사 워크플로 기능도 포함되어 있습니다.
  • SSIS는 광범위한 변환 및 통합 작업을 수행하는 데 사용됩니다. 전체적으로 SSIS 도구는 데이터 마이그레이션에 사용됩니다.

SSIS는 주로 다음 두 가지 기능을 수행하는 데 사용되는 도구입니다.

    데이터 통합
    SSIS는 여러 소스의 데이터를 결합하여 데이터 통합을 수행하고 사용자에게 통합된 데이터를 제공합니다.작업 흐름
    워크플로를 사용하여 여러 가지 작업을 수행할 수 있습니다. 때때로 우리는 기간이나 패키지에 전달된 매개 변수 또는 데이터베이스에서 쿼리된 데이터를 기반으로 하는 특정 단계나 특정 경로를 실행해야 합니다. SQL Server 데이터베이스의 유지 관리를 자동화하고 다차원 분석 데이터에 대한 업데이트를 제공하는 데 사용할 수 있습니다.

데이터 통합이란 무엇입니까?

데이터 통합은 여러 소스의 데이터를 통합하기 위해 수행하는 프로세스입니다. 데이터는 이종 데이터일 수도 있고 동종 데이터일 수도 있습니다. 데이터는 구조화, 반구조화 또는 비구조화될 수 있습니다. 데이터 통합에서는 서로 다른 다양한 데이터 소스의 데이터가 통합되어 의미 있는 데이터를 형성합니다.

데이터 통합을 달성하기 위해 몇 가지 방법이 사용됩니다.

데이터 통합이란 무엇입니까?
    데이터 모델링:데이터 모델링에서는 먼저 데이터 모델을 생성하고 이에 대한 작업을 수행해야 합니다.데이터 프로파일링:데이터 프로파일링은 사용 가능한 데이터의 오류, 불일치 또는 변형을 확인하는 데 사용되는 프로세스입니다. 데이터 프로파일링은 데이터 품질이 데이터의 정확성, 일관성 및 완전성을 나타내는 데이터 품질을 보장합니다.

데이터 통합의 장점:

데이터 통합이란 무엇입니까?
    데이터 복잡성 감소
    이는 데이터 복잡성을 줄여 데이터를 모든 시스템에 전달할 수 있음을 의미합니다. 데이터 통합은 복잡성을 유지하고 연결을 간소화하며 모든 시스템에 데이터를 쉽게 전달할 수 있도록 해줍니다.데이터 무결성
    데이터 무결성은 데이터 통합에서 중요한 역할을 합니다. 데이터를 정리하고 검증하는 작업을 다룹니다. 누구나 고품질의 강력한 데이터를 원하므로 이를 달성하기 위해 데이터 통합 ​​개념이 사용됩니다. 데이터 통합은 오류, 불일치 및 중복을 제거하는 데 도움이 됩니다.간편한 데이터 협업
    접근성은 데이터 협업을 통해 제공됩니다. 접근성이란 데이터가 쉽게 변환될 수 있고 사람들이 쉽게 데이터를 프로젝트에 통합하고 결과를 공유하며 데이터를 최신 상태로 유지할 수 있음을 의미합니다.더욱 스마트한 비즈니스 결정
    또한 보다 현명한 결정을 내릴 수 있도록 해줍니다. 통합데이터란 정보를 보다 쉽게 ​​이해할 수 있도록 기업 내에서 전송하는 과정을 말합니다. 통합된 데이터는 훨씬 쉽고 유익합니다.

왜 SSIS인가?

SSIS는 다음과 같은 이유로 사용됩니다.

왜 SSIS인가?
    데이터는 다양한 대상에 병렬로 로드될 수 있습니다.
    SSIS는 여러 데이터 원본의 데이터를 결합하여 통합 보기에서 단일 구조를 생성하는 데 사용됩니다. 기본적으로 데이터를 수집하고, 여러 데이터 소스에서 데이터를 추출하고, 단일 데이터 소스로 병합하는 역할을 담당합니다.하드 코어 프로그래머의 필요성을 제거합니다.
    SSSIS는 Excel에서 SQL Server 데이터베이스로 대량의 데이터를 로드하는 기능을 갖춘 플랫폼입니다.다른 제품과의 통합
    SSSIS 도구는 Microsoft의 다른 제품과 긴밀한 통합을 제공합니다.다른 ETL 도구보다 저렴함
    SSSIS 도구는 대부분의 다른 도구보다 저렴합니다. 다른 기본 제품, 관리 효율성, 비즈니스 인텔리전스 등에 저항할 수 있습니다.데이터 흐름 내의 복잡한 오류 처리
    SSSIS를 사용하면 데이터 흐름 내의 복잡한 오류를 처리할 수 있습니다. 오류의 심각도에 따라 데이터 흐름을 시작하고 중지할 수 있습니다. 오류가 발생하면 관리자에게 이메일을 보낼 수도 있습니다. 오류가 해결되면 워크플로 사이에서 경로를 선택할 수 있습니다.

SSIS는 어떻게 작동하나요?

우리는 SSIS가 데이터 통합과 워크플로라는 두 가지 기능을 위한 플랫폼이라는 것을 알고 있습니다. 데이터 변환 작업과 워크플로 생성 작업은 모두 SSIS 패키지를 사용하여 수행됩니다. SSIS 패키지는 세 가지 구성 요소로 구성됩니다.

SSIS 작동 방식

운영 데이터

운영 데이터는 여러 데이터 소스의 데이터를 통합하여 데이터에 대한 추가 작업을 수행하는 데 사용되는 데이터베이스입니다. 저장, 보고 또는 보관을 위해 데이터 웨어하우스로 보내기 전에 현재 작업을 위해 데이터를 보관하는 장소입니다.

C의 2차원 배열 프로그램

ETL

  • ETL은 SSIS 도구에서 가장 중요한 프로세스입니다. ETL은 데이터를 데이터 웨어하우스로 추출, 변환 및 로드하는 데 사용됩니다.
  • ETL은 여러 데이터 소스에서 데이터를 꺼내어 유용한 데이터로 변환한 다음 해당 데이터를 데이터 웨어하우스에 저장하는 작업을 담당하는 프로세스입니다. 데이터는 xml 파일, 플랫 파일 또는 데이터베이스 파일 형식과 관계없이 사용할 수 있습니다.
  • 또한 데이터 웨어하우스에 저장된 데이터가 관련성이 있고 정확하며 고품질이며 비즈니스 사용자에게 유용한지 확인합니다.
  • 쉽게 접근할 수 있어 데이터 웨어하우스를 효과적이고 효율적으로 사용할 수 있습니다.
  • 또한 여러 데이터 소스에서 구조화된 데이터와 구조화되지 않은 데이터를 검색하여 조직이 데이터 기반 의사 결정을 내리는 데 도움이 됩니다.

ETL은 세 단어로 구성된 개념이지만 다음과 같은 네 단계로 나뉩니다.

SSIS 작동 방식

포착: 캡처 단계는 추출 단계라고도 합니다. 이 단계에서는 소스 데이터 또는 메타데이터를 선택하며 데이터는 xml 파일, 플랫 파일 또는 데이터베이스 파일과 같은 모든 형식이 될 수 있습니다.

미사일 발사 중지: 이 단계에서는 원본 데이터를 확인합니다. 데이터에 오류가 있는지 여부를 확인합니다. 일부 인공지능 기술을 사용하여 데이터의 오류나 불일치를 확인합니다. 간단히 말해서, 제품의 품질이 충족되는지 여부를 확인합니다.

변환: ETL의 세 번째 단계입니다. 변환은 원본 형식을 원하는 필수 형식으로 변환하는 프로세스입니다. 변환은 사용자 요구 사항에 따라 데이터를 모델링하거나 변경하는 것입니다. 변경 사항은 열 또는 행 수의 변경일 수 있습니다.

로드 및 색인: 네 번째 단계는 로드 및 인덱스입니다. 데이터를 로드하고 처리된 행 수의 유효성을 검사합니다. 데이터 로딩이 완료되면 인덱싱이 사용됩니다. 인덱싱은 데이터 웨어하우스에 로드된 행 수를 추적하는 데 도움이 됩니다. 인덱싱은 데이터의 형식이 올바른지 여부에 관계없이 데이터를 식별하는 데에도 도움이 됩니다.

데이터웨어 하우스

데이터 웨어하우스는 여러 데이터 소스의 데이터를 결합하여 구성된 완전하고 일관된 단일 데이터 저장소입니다.

데이터베이스와 데이터웨어 하우스의 차이점

대답은 '예'일 수도 있고 '아니오'일 수도 있습니다. 데이터베이스와 데이터 웨어하우스는 모두 큰 데이터 단위와 유사한 물리적 표현을 가지고 있지만 데이터 웨어하우스의 복잡한 쿼리에 대한 응답 시간은 데이터베이스보다 빠릅니다.


SQL Server 통합 서비스에 대한 요구 사항

다음은 SQL Server Integration Services를 설치하기 위한 요구 사항입니다.

  • SQL Server 설치
  • SQL Server 데이터 도구 설치

SQL Server 데이터 도구를 설치하려면 아래 단계를 따르세요.

1 단계: 링크를 클릭하세요 https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server-2017 SQL Server 데이터 도구를 다운로드하려면

2 단계: 위 링크를 클릭하시면 아래와 같은 화면이 나옵니다.

SQL Server 통합 서비스에 대한 요구 사항

위 화면에서 설치하려는 SSDT 버전을 선택하세요.

3단계: 다운로드가 완료되면 다운로드한 파일을 실행해 주세요. 다운로드한 파일을 실행하면 아래와 같은 화면이 나타납니다.

SQL Server 통합 서비스에 대한 요구 사항

4단계: 다음 버튼을 클릭하세요.

5단계: Visual Studio 2017에 설치하려는 Visual Studio 인스턴스와 도구를 선택합니다.

SQL Server 통합 서비스에 대한 요구 사항

6단계: 다음을 클릭하세요. 설치하다 단추.


SSIS 패키지란 무엇입니까?

패키지는 SSIS에서 코딩하는 기본 블록입니다. 여기서 코드는 일부 프로그래밍 언어로 코딩한다는 의미가 아닙니다. 그것은 당신이 하는 발전을 의미합니다. 개발은 SSIS 패키지에서 이루어집니다. SSIS는 주로 ETL 프로세스에 사용되며 ETL 프로세스는 SSIS 패키지 내부에서 수행됩니다.

SSIS 패키지는 세 부분으로 구성됩니다.

SSIS 패키지란 무엇입니까?
    사이
    SSIS 패키지에는 몇 가지 연결이 있으며 이러한 연결은 다양한 데이터 소스에 연결하는 데 사용됩니다.제어 흐름 요소
    SSIS 패키지는 제어 흐름 요소와 데이터 흐름 요소라는 두 가지 요소로 구성됩니다. 제어 흐름 요소는 워크플로를 처리합니다. 워크플로는 일부 작업을 단계적으로 수행하므로 제어 흐름을 통해 시퀀스가 ​​수행된다는 의미입니다.데이터 흐름 요소
    데이터 흐름 요소는 변환을 수행합니다.

SSIS 작업

SSIS 패키지에서 작업을 추가할 수 있습니다. 작업은 작업 단위이며 다양한 종류의 작업을 수행하기 위해 다양한 유형의 작업이 있습니다. 다양한 유형의 작업이 있지만 SSIS에서 사용되는 가장 일반적인 작업에 대해 설명하겠습니다.

    SQL 작업 실행
    관계형 데이터베이스에 대해 SQL 문을 실행하는 데 사용됩니다.데이터 흐름 작업
    주로 하나 이상의 데이터 소스에서 데이터를 읽고, 데이터를 변환하고, 하나 이상의 대상에 데이터를 로드하는 데 사용됩니다.Analysis Services 처리 작업
    SSAS 큐브 또는 테이블 형식 모델의 개체를 처리하는 데 사용됩니다.패키지 작업 실행
    이 작업은 동일한 프로젝트 내의 다른 패키지를 호출하는 데 사용됩니다. 호출된 패키지에 변수 값을 전달할 수도 있습니다.프로세스 작업 실행
    이를 통해 응용 프로그램이나 배치 스크립트를 SQL Server Integration Services로 실행할 수 있습니다. Microsoft Excel, Microsoft Word 등과 같은 표준 응용 프로그램을 여는 데 사용할 수 있습니다. 또한 압축 파일의 압축을 푸는 데에도 사용됩니다.파일 시스템 작업
    파일 이동, 파일 삭제, 파일 이름 바꾸기, 디렉터리 변경 등과 같은 파일 시스템에서 조작을 수행하는 데 사용할 수 있습니다.FTP 작업
    IFTP 작업은 파일 및 폴더에 대한 작업을 수행하는 데 사용됩니다. 예를 들어, FTP 서버에서 로컬 디렉터리로 파일을 보내거나 받으려면 SSIS FTP 작업이 사용됩니다.스크립트 작업
    이 작업을 통해 수행하려는 .Net 코드를 작성할 수 있습니다.메일 보내기 작업
    이 작업은 이메일을 보내는 데 사용됩니다. 작업이 실행 중인지, 오류가 발생했는지 사용자에게 알리고 싶을 때 주로 사용됩니다.

데이터 통합 ​​서비스의 몇 가지 실제 사례를 살펴보겠습니다.


데이터 흐름 작업의 예

1 단계: 먼저 Microsoft Excel에서 Excel 파일을 만듭니다. Microsoft Excel에서 학생 데이터베이스를 생성하고 학생 테이블의 필드가 학생_ID, 학생_이름, 점수 및 성별이라고 가정합니다.

SSIS 작업

2 단계: Visual Studio(SQL Server Data Tools)를 엽니다.

SSIS 작업

3단계: 파일 옵션을 클릭한 다음 새로 만들기->프로젝트로 이동합니다.

SSIS 작업

4단계: 프로젝트를 클릭하면 아래와 같은 화면이 나타납니다.

SSIS 작업

위 화면에서 패널의 가장 왼쪽에 나타나는 Integration Services를 클릭한 다음 Integration Services 프로젝트를 클릭합니다.

5단계: 클릭 후 통합 서비스 프로젝트 옵션을 선택하면 아래와 같은 화면이 나타납니다.

SSIS 작업

위 화면은 제어흐름, 데이터흐름, 매개변수, 이벤트 핸들러, 패키지 탐색기 등 5개의 탭으로 구성되어 있습니다. 우리는 이미 제어 흐름과 데이터 흐름에 대해 논의했습니다. 제어 흐름과 데이터 흐름은 모두 SSIS 패키지 내에 존재합니다.

6단계: 데이터를 가져오려면 먼저 SQL Server 데이터베이스에 테이블을 생성할 데이터베이스를 생성해야 합니다. 학생 데이터가 Excel 파일 내에서 사용 가능하다는 것을 알고 있으므로 SQL Server 데이터베이스에서 데이터를 가져오려고 합니다. 이를 달성하려면 먼저 SQL Server에서 테이블을 만들어야 합니다. SQL Server 관리 스튜디오를 엽니다.

정수를 문자열로 변환 자바

7단계: 생성 학생 데이터 베이스. 데이터베이스를 마우스 오른쪽 버튼으로 클릭한 다음 새 데이터베이스 옵션.

SSIS 작업

8단계: 아래 스크린샷에 데이터베이스 이름을 입력하세요.

SSIS 작업

저는 StudentWarehouse를 데이터베이스 이름으로 지정했습니다.

9단계: 다음을 클릭하세요. 좋아요 단추.

10단계: 이제 우리는 학생창고 데이터 베이스. 테이블을 마우스 오른쪽 버튼으로 클릭한 다음 새 테이블을 클릭합니다.

SSIS 작업

11단계: 이제 학생 ID, 학생 이름, 성적, 성별과 같은 필드를 테이블에 추가합니다. 각 행을 고유하게 식별하는 기본 키로 Student_id를 설정했습니다.

SSIS 작업

위 화면은 테이블에 4개의 필드를 추가하는 것을 보여줍니다. 테이블의 모든 필드를 추가한 후 유용한 이름을 제공하여 테이블을 저장합니다. 학생을 테이블 이름으로 제공했다고 가정해 보겠습니다.

12단계: 비주얼 스튜디오로 다시 이동합니다. 제어 흐름에는 데이터 흐름 태스크가 포함되어 있습니다. 기본 창에 데이터 흐름 태스크를 끌어서 놓습니다.

SSIS 작업

13단계: Data Flow Task를 더블클릭하면 컨트롤이 자동으로 Control Flow에서 Data Flow로 이동하므로 Control Flow는 Data Flow의 컨테이너라고 할 수 있습니다.

14단계: 이제 데이터 흐름에서 변환을 수행할 수 있습니다. 앞서 생성한 엑셀 파일에서 데이터를 추출할 것이므로, 패널의 가장 왼쪽에 나타나는 다른 소스에서 엑셀 소스를 드래그 앤 드롭하세요.

SSIS 작업

위 화면에서 Excel 소스 내부에 빨간색 십자가가 나타나는 것을 볼 수 있습니다. 이는 구성 요소가 Excel 소스로 구성되었음을 의미합니다.

15단계: 구성 요소를 구성하려면 Excel 소스를 마우스 오른쪽 버튼으로 클릭하고 아래 스크린샷에 표시된 대로 편집 옵션을 클릭합니다.

SSIS 작업

16단계: 아래 스크린샷에 표시된 세부 정보를 입력하세요.

SSIS 작업

17단계: 모든 항목을 입력하시면 아래와 같은 화면이 나옵니다.

SSIS 작업

18단계: Excel 소스를 클릭합니다.

SSIS 작업

위 화면에는 빨간색과 파란색 화살표 두 개의 화살표가 표시됩니다. 파란색 화살표는 Excel 파일에서 받은 실제 데이터를 정의하고 빨간색 화살표는 발생한 오류를 나타냅니다. 이제 변환을 수행해야 하며, 변환을 수행하기 전에 데이터베이스를 로드해야 합니다.

19단계: 데이터베이스를 로드하려면 기타 대상을 클릭한 다음 대상을 클릭합니다.

SSIS 작업

20단계: 대상을 추가한 후 소스를 대상에 연결하세요.

SSIS 작업

21단계: 위 단계에서 ADO NET 대상에 빨간색 십자가가 있는 것을 확인했습니다. 이는 구성 요소로 구성되지 않았음을 의미합니다. ADO NET 대상을 마우스 오른쪽 버튼으로 클릭한 다음 아래 스크린샷에 표시된 대로 편집 옵션을 클릭합니다.

SSIS 작업

22단계: 구성 관리자를 지정해야 합니다.

SSIS 작업

23단계: 다음을 클릭하세요. 새로운 버튼을 눌러 연결 관리자를 추가하세요. 다음을 클릭하면 새로운 버튼을 누르면 아래와 같은 화면이 나타납니다.

SSIS 작업

24단계: 서버 이름을 추가하고 SQL Server에서 데이터베이스 이름을 선택합니다.

SSIS 작업

25단계: 확인 버튼을 클릭하세요.

26단계: 데이터를 로드하려는 테이블 이름을 추가합니다.

SSIS 작업

27단계: 아래 화면에서 입력 소스 필드를 대상 소스 필드에 매핑합니다.

10100만
SSIS 작업

28단계: 매핑을 추가한 후 아래 스크린샷과 같이 소스가 대상에 연결됩니다.

SSIS 작업

29단계: 다음을 클릭하세요. 시작 단추를 클릭하여 Integration Services 프로젝트를 실행합니다. 프로젝트를 실행하면 데이터가 대상에 로드됩니다. SQL 서버 .


SQL 실행 작업의 예

  • 이전 예의 2단계부터 5단계까지 수행합니다.
  • 드래그 앤 드롭 SQL 작업 실행 메인 창의 가장 왼쪽 패널에 나타납니다.
SSIS 작업

위 화면에서 SQL 실행 태스크에 빨간색 십자가가 나타나는 것을 볼 수 있습니다. 연결 관리자 으로 구성되지 않았습니다. SQL 작업 실행 . 이를 구성하려면 연결 관리자를 추가해야 합니다.

  • 연결 관리자를 추가하려면 아래 스크린샷과 같이 연결 관리자를 마우스 오른쪽 버튼으로 클릭한 다음 새 연결 관리자를 클릭하세요.
SSIS 작업
  • 선택 OLEDB 연결 관리자 유형으로 선택한 다음 추가하다 아래 스크린샷과 같이 버튼을 누르세요.
SSIS 작업
  • 다음을 클릭한 후 추가하다 버튼을 누르면 아래 스크린샷과 같은 화면이 나타납니다.
SSIS 작업

위 화면에서 데이터 연결이 이루어지는 것을 볼 수 있습니다. 학생창고 데이터베이스는 이전 단계에서 생성한 대로 이미 사용 가능합니다. 다음을 클릭하세요. 좋아요 단추.

  • 확인 버튼을 클릭하면 아래와 같은 화면이 나옵니다.
SSIS 작업

위 화면에서는 작업 이름, 설명, SQL 문(테이블에서 수행해야 하는 SQL 작업) 등의 세부 정보를 입력해야 합니다.

  • 위 스크린샷에 다음 세부정보를 입력했습니다.
SSIS 작업

위의 경우 SQLStatement에 insert 명령을 제공했습니다.

  • 다음을 클릭하세요. 좋아요 단추.
  • SQL 실행 작업으로 구성 요소를 구성하면 아래 스크린샷에 표시된 것처럼 빨간색 십자가가 사라집니다.
SSIS 작업
  • 버튼을 클릭하여 프로젝트를 실행하세요. 시작 .
SSIS 작업
  • 다음을 클릭하면 시작 을 선택하면 아래와 같은 화면이 나타납니다.
SSIS 작업

위 화면에서 체크 표시는 SQL 작업이 성공적으로 완료되었음을 나타냅니다. 이전 단계에서 추가했던 insert 문이 실행되어 테이블에 데이터가 추가되었습니다. 즉, 학생1입니다.

  • 이 작업의 출력은 아래와 같습니다.
SSIS 작업

전제 조건

SSIS를 배우기 전에 SQL Server에 대한 기본 지식이 있어야 합니다.

청중

우리의 SSIS 튜토리얼은 초보자와 전문가를 돕기 위해 고안되었습니다.

문제

이 SSIS 튜토리얼에서는 어떤 문제도 발견하지 못할 것이라고 확신합니다. 단, 실수나 오류가 있는 경우 문의 양식에 오류를 게시해 주시기 바랍니다.