logo

SSIS チュートリアル

SSIS チュートリアル

SSIS チュートリアルでは、SQL Server Integration Services の基本概念と高度な概念を提供します。 SSIS チュートリアルは初心者と専門家向けに設計されています。

SQL Server統合サービス は、データの抽出、変換、およびデータの読み込みに使用される、高速で柔軟なデータ ウェアハウス ツールです。あるデータベースから SQL Server、Oracle、Excel ファイルなどの別のデータベースにデータを簡単にロードできます。

このチュートリアルでは、次のトピックについて説明します。


SSISとは何ですか?

  • SSIS は SQL Server Integration Services の略です。
  • これは、幅広い統合タスクを実行するために使用される Microsoft SQL Server データベース ソフトウェアで利用可能なコンポーネントです。
  • これは、データの抽出、別のデータベースへのデータのロード、データのクリーニング、集計、結合などの変換に使用されるデータ ウェアハウス ツールです。
  • SSIS ツールには、電子メール メッセージの送信、FTP 操作、データ ソースなどのグラフィカル ツールとウィンドウ ウィザードのワークフロー機能も含まれています。
  • SSIS は、幅広い変換および統合タスクを実行するために使用されます。全体として、SSIS ツールはデータ移行に使用されます。

SSIS は、主に次の 2 つの機能を実行するために使用されるツールです。

    データ統合
    SSIS は、複数のソースからのデータを組み合わせてデータ統合を実行し、統一されたデータをユーザーに提供します。ワークフロー
    ワークフローを使用していくつかのことを実行できます。場合によっては、期間、パッケージに渡されるパラメーター、またはデータベースからクエリされたデータに基づく、いくつかの特定のステップまたは特定のパスを実行する必要があります。これを使用すると、SQL Server データベースのメンテナンスを自動化し、多次元分析データを更新できます。

データ統合とは何ですか?

データ統合は、複数のソースからのデータを統合するために実行するプロセスです。データは、異種データまたは同種データのいずれかです。データは、構造化、半構造化、または非構造化のいずれかにすることができます。データ統合では、異なる異なるデータ ソースからのデータが統合されて、意味のあるデータが形成されます。

データ統合を実現するには、いくつかの方法が使用されます。

データ統合とは
    データモデリング:データ モデリングでは、まずデータ モデルを作成し、それに対して操作を実行する必要があります。データプロファイリング:データ プロファイリングは、利用可能なデータのエラー、不一致、または変動をチェックするために使用されるプロセスです。データ プロファイリングはデータ品質を保証します。データ品質とはデータの正確さ、一貫性、完全性を指します。

データ統合の利点:

データ統合とは
    データの複雑さを軽減する
    データの複雑さが軽減されるため、データをあらゆるシステムに配信できます。データ統合により、複雑さが維持され、接続が合理化され、あらゆるシステムへのデータ配信が容易になります。データの整合性
    データの整合性はデータ統合において重要な役割を果たします。データのクレンジングと検証を扱います。誰もが高品質で堅牢なデータを望んでいます。そのため、このデータ統合の概念を実現するために使用されます。データ統合は、エラー、不整合、重複を取り除くのに役立ちます。簡単なデータ連携
    アクセシビリティはデータ コラボレーションに含まれます。アクセシビリティとは、データを簡単に変換でき、ユーザーがデータをプロジェクトに簡単に統合し、結果を共有し、データを最新の状態に保つことができることを意味します。より賢明なビジネス上の意思決定
    また、より賢明な決定を下すこともできます。統合データとは、情報をより理解しやすくするために企業内で送信されるプロセスを指します。統合されたデータははるかに簡単で有益です。

なぜSSISなのか?

SSIS は次の理由で使用されます。

SSIS を選ぶ理由
    データはさまざまな宛先に並行してロードできます
    SSIS は、複数のデータ ソースからのデータを結合して、統合ビューで単一の構造を生成するために使用されます。基本的に、データの収集、複数のデータ ソースからのデータの抽出、および 1 つのデータ ソースへの結合を担当します。本格的なプログラマーの必要性を排除します
    SSSIS は、Excel から SQL Server データベースに大量のデータを読み込む機能を備えたプラットフォームです。他の製品との統合
    SSSIS ツールは、Microsoft の他の製品との緊密な統合を提供します。他のETLツールよりも安価
    SSSIS ツールは、他のほとんどのツールよりも安価です。他の基本製品、その管理性、ビジネス インテリジェンスなどに対抗することができます。データフロー内での複雑なエラー処理
    SSSIS を使用すると、データフロー内の複雑なエラーを処理できます。エラーの重大度に基づいてデータフローを開始および停止できます。エラーが発生した場合には、管理者にメールを送信することもできます。エラーが解決したら、ワークフロー間のパスを選択できます。

SSIS はどのように機能するのでしょうか?

SSIS は、データ統合とワークフローという 2 つの機能のためのプラットフォームであることがわかっています。データ変換とワークフロー作成の両方のタスクは、SSIS パッケージを使用して実行されます。 SSIS パッケージは 3 つのコンポーネントで構成されています。

SSIS の仕組み

運用データ

運用データは、複数のデータ ソースからのデータを統合して、データに対して追加の操作を実行するために使用されるデータベースです。これは、保存、レポート、またはアーカイブのためにデータ ウェアハウスにデータを送信する前に、現在の操作のためにデータが格納される場所です。

ブラウザの設定はどこで確認できますか

ETL

  • ETL は SSIS ツールで最も重要なプロセスです。 ETL は、データを抽出、変換し、データ ウェアハウスにロードするために使用されます。
  • ETL は、複数のデータ ソースからデータを抽出し、有用なデータに変換して、データ ウェアハウスに保存するプロセスです。データは、任意の形式の XML ファイル、フラット ファイル、または任意のデータベース ファイルにすることができます。
  • また、データ ウェアハウスに保存されているデータが関連性があり、正確で、高品質で、ビジネス ユーザーにとって有用であることも保証されます。
  • 簡単にアクセスできるため、データ ウェアハウスを効果的かつ効率的に使用できます。
  • また、複数のデータ ソースから構造化データと非構造化データを取得することで、組織がデータ主導の意思決定を行うのにも役立ちます。

ETL は 3 つの単語からなる概念ですが、次の 4 つのフェーズに分かれています。

SSIS の仕組み

捕獲: キャプチャフェーズは抽出フェーズとも呼ばれます。このフェーズでは、ソース データまたはメタデータが選択されます。データは、XML ファイル、フラット ファイル、データベース ファイルなどの任意の形式にすることができます。

スクラブ: このフェーズでは、元のデータがチェックされます。データにエラーがないかどうかをチェックします。いくつかの人工知能技術を使用して、データのエラーや不整合がチェックされます。一言で言えば、製品の品質が満たされているかどうかを検証します。

変身: これは ETL の第 3 フェーズです。変換は、元の形式を必要な形式に変換するプロセスです。変換とは、ユーザーの要件に従ってデータをモデル化または変更することです。変更は、列数または行数の変更のいずれかです。

ロードとインデックス付け: 4 番目のフェーズはロードとインデックスです。データをロードし、処理された行数を検証します。データのロードが完了すると、インデックス付けが使用されます。インデックス付けは、データ ウェアハウスにロードされた行数を追跡するのに役立ちます。インデックス付けは、データが正しい形式であるかどうかにかかわらず、データを識別するのにも役立ちます。

データウェアハウス

データ ウェアハウスは、複数のデータ ソースからのデータを組み合わせて形成される、単一の完全かつ一貫したデータ ストアです。

データベースとデータウェアハウスの違い

答えは「はい」でも「いいえ」でも構いません。データベースとデータ ウェアハウスはどちらも大きな単位のデータと同様の物理的表現を持っていますが、データ ウェアハウスの複雑なクエリの応答時間はデータベースよりも高速です。


SQL Server 統合サービスの要件

SQL Server Integration Services をインストールするための要件は次のとおりです。

  • SQLサーバーをインストールする
  • SQL Server データ ツールをインストールする

SQL Server データ ツールをインストールするには、次の手順に従います。

ステップ1: リンクをクリックしてください https://docs.microsoft.com/en-us/sql/ssdt/previous-releases-of-sql-server-data-tools-ssdt-and-ssdt-bi?view=sql-server-2017 SQL Server データ ツールをダウンロードします。

ステップ2: 上記リンクをクリックすると、以下の画面が表示されます。

SQL Server 統合サービスの要件

上の画面で、インストールする SSDT のバージョンを選択します。

ステップ 3: ダウンロードが完了したら、ダウンロードしたファイルを実行します。ダウンロードしたファイルを実行すると、次のような画面が表示されます。

SQL Server 統合サービスの要件

ステップ 4: 「次へ」ボタンをクリックします。

ステップ5: Visual Studio 2017 にインストールする Visual Studio インスタンスとツールを選択します。

SQL Server 統合サービスの要件

ステップ6: クリックしてください インストール ボタン。


SSIS パッケージとは何ですか?

パッケージは、SSIS でコーディングするための基本的なブロックです。ここでのコードとは、何らかのプログラミング言語でコーディングしていることを意味するものではありません。それはあなたが行う開発を意味します。開発は SSIS パッケージで行われます。 SSIS は主に ETL プロセスに使用され、ETL プロセスは SSIS パッケージ内で実行されます。

SSIS パッケージは 3 つの部分で構成されます。

SSIS パッケージとは
    接続
    SSIS パッケージにはいくつかの接続があり、これらの接続はさまざまなデータ ソースに接続するために使用されます。制御フロー要素
    SSIS パッケージは、制御フロー要素とデータ フロー要素の 2 つの要素で構成されます。制御フロー要素はワークフローを処理します。ワークフローとは、いくつかのタスクを段階的に実行することを意味し、シーケンスは制御フローを通じて実行されます。データフロー要素
    データ フロー要素は変換を実行します。

SSIS タスク

SSIS パッケージでは、タスクを追加できます。タスクは作業の単位であり、さまざまな種類の作業を実行するためにさまざまな種類のタスクがあります。タスクにはさまざまな種類がありますが、SSIS で使用される最も一般的なタスクについて説明します。

    SQLタスクの実行
    これは、リレーショナル データベースに対して SQL ステートメントを実行するために使用されます。データ フロー タスク
    これは主に、1 つまたは複数のデータ ソースからデータを読み取り、データを変換するために使用され、データを 1 つまたは複数の宛先にロードすることもできます。Analysis Services 処理タスク
    SSAS キューブまたは表形式モデルのオブジェクトを処理するために使用されます。パッケージタスクの実行
    このタスクは、同じプロジェクト内の他のパッケージを呼び出すために使用されます。呼び出されたパッケージに変数値を渡すこともできます。プロセスタスクの実行
    これにより、アプリケーションまたはバッチ スクリプトを SQL Server Integration Services として実行できます。 Microsoft Excel、Microsoft Wordなどの標準アプリケーションを開くために使用できます。また、圧縮ファイルを解凍するためにも使用されます。ファイル システム タスク
    ファイルの移動、ファイルの削除、ファイル名の変更、ディレクトリの変更など、ファイル システム内の操作を実行するために使用できます。FTPタスク
    IFTP タスクは、ファイルとフォルダーに対する操作を実行するために使用されます。たとえば、FTP サーバーからローカル ディレクトリにファイルを送受信する場合は、SSIS FTP タスクが使用されます。スクリプトタスク
    このタスクを使用すると、実行する .Net コードを作成できます。メール送信タスク
    このタスクは電子メールの送信に使用されます。これは主に、タスクが実行中かエラーが発生したかをユーザーに通知する場合に使用されます。

データ統合サービスの実例をいくつか見てみましょう。


データ フロー タスクの例

ステップ1: まず、Microsoft ExcelでExcelファイルを作成します。 Microsoft Excel で学生データベースを作成し、学生テーブルのフィールドが学生 ID、学生名、マーク、性別であるとします。

SSIS タスク

ステップ2: ビジュアル スタジオ (SQL Server データ ツール) を開きます。

例外処理Java
SSIS タスク

ステップ 3: 「ファイル」オプションをクリックし、「新規」->「プロジェクト」に移動します。

SSIS タスク

ステップ 4: プロジェクトをクリックすると、次のような画面が表示されます。

SSIS タスク

上の画面で、パネルの左端に表示される「Integration Services」をクリックし、「Integration Services Project」をクリックします。

ステップ5: をクリックした後 統合サービスプロジェクト オプションを選択すると、次のような画面が表示されます。

SSIS タスク

上記画面は、「コントロールフロー」「データフロー」「パラメーター」「イベントハンドラー」「パッケージエクスプローラー」の5つのタブで構成されています。制御フローとデータ フローについてはすでに説明しましたが、制御フローとデータ フローは両方とも SSIS パッケージ内に存在します。

ステップ6: データをインポートするには、まず SQL Server データベースにテーブルを作成するデータベースを作成する必要があります。学生データは Excel ファイル内で利用できることがわかっているので、そのデータを SQL Server データベースにインポートしたいと考えています。これを実現するには、まず SQL Server にテーブルを作成する必要があります。 SQL Server 管理スタジオを開きます。

ステップ7: を作成します。 学生 データベース。データベースを右クリックし、 新しいデータベース オプション。

SSIS タスク

ステップ8: 以下のスクリーンショットにデータベース名を入力します。

SSIS タスク

データベース名として StudentWarehouse を指定しました。

ステップ9: クリックしてください わかりました ボタン。

ステップ 10: ここで、テーブルを作成します。 学生倉庫 データベース。テーブルを右クリックし、[新しいテーブル] をクリックします。

SSIS タスク

ステップ 11: ここで、student_id、student_name、marks、gender などのフィールドをテーブルに追加します。 Student_id を各行を一意に識別する主キーとして設定します。

SSIS タスク

上の画面は、テーブルに 4 つのフィールドを追加することを示しています。テーブルにすべてのフィールドを追加した後、便利な名前を付けてテーブルを保存します。テーブル名として Student を指定したとします。

ステップ 12: ビジュアル スタジオに戻ります。制御フローにはデータ フロー タスクが含まれており、データ フロー タスクをメイン ウィンドウにドラッグ アンド ドロップします。

SSIS タスク

ステップ 13: データ フロー タスクをダブルクリックすると、コントロールは自動的にコントロール フローからデータ フローに移動するため、コントロール フローはデータ フローのコンテナーであると言えます。

ステップ 14: これで、データ フローで変換を実行できるようになりました。先ほど作成したExcelファイルからデータを抽出したいので、パネルの一番左に表示されている他のソースからExcelソースをドラッグ&ドロップします。

SSIS タスク

上の画面から、Excel ソース内に赤い×印が表示されていることがわかります。これは、コンポーネントが Excel ソースで構成されていることを意味します。

ステップ 15: コンポーネントを設定するには、以下のスクリーンショットに示すように、Excel ソースを右クリックし、[編集] オプションをクリックします。

SSIS タスク

ステップ 16: 以下のスクリーンショットに示されている詳細を入力します。

SSIS タスク

ステップ 17: すべての詳細を入力すると、次のような画面が表示されます。

SSIS タスク

ステップ 18: Excel ソースをクリックします。

SSIS タスク

上の画面には、赤と青の 2 つの矢印が表示されています。青い矢印は Excel ファイルから受け取る実際のデータを定義し、赤い矢印は発生したエラーを示します。次に、変換を実行する必要があります。変換を実行する前に、データベースをロードする必要があります。

ステップ 19: データベースをロードするには、「その他の宛先」をクリックしてから、宛先をクリックします。

SSIS タスク

ステップ 20: 宛先を追加した後、ソースを宛先に接続します。

SSIS タスク

ステップ21: 上記の手順では、ADO NET 宛先に赤い×印が付いていることに気付きました。これは、コンポーネントが構成されていないことを意味します。以下のスクリーンショットに示すように、ADO NET 宛先を右クリックし、[編集] オプションをクリックします。

SSIS タスク

ステップ22: 構成マネージャーを指定する必要があります。

SSIS タスク

ステップ23: クリックしてください 新しい ボタンをクリックして接続マネージャーを追加します。をクリックすると、 新しい ボタンを押すと、次のような画面が表示されます。

SSIS タスク

ステップ24: サーバー名を追加し、SQL Server からデータベース名を選択します。

SSIS タスク

ステップ25: 「OK」ボタンをクリックします。

ステップ26: データをロードするテーブル名を追加します。

SSIS タスク

ステップ27: 以下の画面で、入力ソースのフィールドを宛先ソースのフィールドにマッピングします。

Javaで配列を初期化する方法
SSIS タスク

ステップ28: マッピングを追加すると、以下のスクリーンショットに示すように、ソースが宛先に接続されます。

SSIS タスク

ステップ29: クリックしてください 始める ボタンをクリックして、Integration Services プロジェクトを実行します。プロジェクトを実行すると、データが宛先にロードされます。 SQLサーバー


SQL実行タスクの例

  • 前の例のステップ 2 からステップ 5 の手順に従います。
  • をドラッグアンドドロップします。 SQLタスクの実行 メインウィンドウの左端のパネルに表示されます。
SSIS タスク

上の画面では、SQL 実行タスクに赤十字が表示されていることがわかります。これは、 接続マネージャー で構成されていません SQLタスクの実行 。これを構成するには、接続マネージャーを追加する必要があります。

  • 接続マネージャーを追加するには、以下のスクリーンショットに示すように、接続マネージャーを右クリックし、[新しい接続マネージャー] をクリックします。
SSIS タスク
  • を選択 OLEDB 接続マネージャーの種類として選択し、 追加 以下のスクリーンショットに示すように、ボタンをクリックします。
SSIS タスク
  • をクリックした後、 追加 ボタンを押すと、以下のスクリーンショットに示す画面が表示されます。
SSIS タスク

上の画面では、次のデータ接続が確認されています。 学生倉庫 データベースは前の手順で作成したようにすでに使用可能です。クリックしてください わかりました ボタン。

  • 「OK」ボタンをクリックすると、以下のような画面が表示されます。
SSIS タスク

上の画面では、タスクの名前、説明、SQL ステートメント (テーブルに対して実行する必要がある SQL タスク) などの詳細を入力する必要があります。

  • 上のスクリーンショットに次の詳細を入力しました。
SSIS タスク

上記の場合、SQLStatement に挿入コマンドを提供しました。

  • クリックしてください わかりました ボタン。
  • SQL 実行タスクを使用してコンポーネントを構成すると、以下のスクリーンショットに示すように、赤い十字が消えます。
SSIS タスク
  • をクリックしてプロジェクトを実行します。 始める
SSIS タスク
  • をクリックすると、 始める 、次のような画面が表示されます。
SSIS タスク

上の画面では、チェックマークは SQL タスクが正常に完了したことを示しています。前の手順で追加した挿入ステートメントが実行され、データがテーブルに追加されます。つまり、student1です。

  • このタスクの出力を以下に示します。
SSIS タスク

前提条件

SSIS を学習する前に、SQL Server の基本的な知識を持っている必要があります。

観客

SSIS チュートリアルは、初心者と専門家を支援するように設計されています。

問題

この SSIS チュートリアルでは問題が見つからないことを保証します。ただし、間違いや誤りがある場合は、お問い合わせフォームにエラーを投稿してください。