データベースは膨大な量のデータで構成されています。データは RDBMS のテーブル内でグループ化され、各テーブルには関連するレコードがあります。ユーザーにはデータがテーブルの形式で保存されているように見えますが、実際には、この膨大な量のデータはファイルの形式で物理メモリに保存されます。
とは ある ファイル?
ファイルは、次のような二次ストレージに記録される関連情報の集合に名前が付けられます。 磁気ディスク 、 磁気テープ、 そして 光ディスク 。
ファイル構成とは何ですか?
ファイル構成とは、ファイルを構成するさまざまなレコード間の論理的関係、特に特定のレコードの識別およびアクセスの手段を指します。簡単に言うと、ファイルを特定の順序で保存することをファイル編成と呼びます。 ファイル構造 ラベルとデータ ブロック、および論理制御レコードの形式を指します。
ファイル整理の目的
- これは、レコードの選択を高速化するのに役立ちます。つまり、プロセスが高速化されます。
- さまざまなレコードの挿入、削除、更新などのさまざまな操作がより高速かつ簡単になります。
- これにより、さまざまな操作を通じて重複レコードを挿入することができなくなります。
- 最小限のコストで記録やデータを非常に効率的に保存するのに役立ちます。
ファイル構成の種類
ファイルを整理するためにさまざまな方法が紹介されています。これらの特定の方法には、アクセスまたは選択に基づいて長所と短所があります。したがって、要件に従って最適なファイル編成方法を決定するのはすべてプログラマの責任です。
ファイル構成のいくつかのタイプは次のとおりです。
- シーケンシャルファイル構成
- ヒープファイルの構成
- ハッシュファイルの構成
- B+ ツリー ファイル構成
- クラスタ化されたファイル構成
- ISAM (索引順次アクセス方式)
この記事の以降のセットでは、各ファイル編成方法の違いと利点/欠点とともに、各ファイル編成について説明します。
シーケンシャルファイル構成
ファイル編成の最も簡単な方法は、シーケンシャル方法です。この方法では、ファイルが順番に次々に保存されます。このメソッドを実装するには 2 つの方法があります。
リンクリストJava
1. パイルファイル方式
この方法は非常に単純で、レコードをシーケンスで、つまりテーブルに挿入される順序で次々に保存します。
パイルファイル方式
文字列jsonオブジェクト
新しいレコードの挿入: R1、R3 などから R5 および R4 までをシーケンス内の 4 つのレコードとします。ここで、レコードはテーブル内の行にすぎません。新しいレコード R2 をシーケンスに挿入する必要があるとします。その場合、それは単にファイルの最後に配置されます。
新しいレコードの挿入
2. ソートファイル方式
このメソッドでは、名前自体が示すように、新しいレコードを挿入する必要がある場合は常に、ソート (昇順または降順) で挿入されます。レコードの並べ替えは、次のいずれかの基準に基づいて行うことができます。 主キー または他のキー。
ソートされたファイルの方法
新しいレコードの挿入: R1、R3 など、R7 と R8 までの 4 つのレコードのソートされたシーケンスが既存であると仮定します。新しいレコード R2 をシーケンスに挿入する必要があるとします。このレコードはファイルの最後に挿入され、シーケンスが並べ替えられます。
新しいレコードの挿入
シーケンシャルファイル構成の利点
- 大量のデータを高速かつ効率的に処理する方法。
- シンプルなデザイン。
- ファイルは簡単に保存できます 磁気テープ つまり、より安価なストレージメカニズムです。
シーケンシャルファイル構成の欠点
- 必要な特定のレコードにジャンプすることはできませんが、順番に移動する必要があるため、時間の無駄になります。
- ソートされたファイル方式は、レコードのソートに時間とスペースがかかるため、非効率的です。
ヒープファイルの構成
ヒープファイルの構成 データブロックを扱います。この方法では、レコードがファイルの末尾のデータ ブロックに挿入されます。この方法では、並べ替えや順序付けは必要ありません。データ ブロックがいっぱいの場合、新しいレコードは他のブロックに保存されます。ここで、他のデータ ブロックは次のデータ ブロックである必要はありませんが、メモリ内の任意のブロックにすることができます。新しいレコードを保存および管理するのは DBMS の責任です。
ヒープファイルの構成
新しいレコードの挿入: ヒープ R1、R5、R6、R4、R3 に 4 つのレコードがあり、最後のデータ ブロック、つまりデータ ブロック 3 がいっぱいであるため、新しいレコード R2 をヒープに挿入する必要があるとします。 DBMS によって選択されたデータ ブロックのいずれか (データ ブロック 1 としましょう)。
新しいレコードの挿入
ヒープ ファイル組織内のデータを検索、削除、または更新したい場合は、ファイルの先頭から要求されたレコードを取得するまでデータを走査します。したがって、データベースが非常に大きい場合、レコードの検索、削除、更新には時間がかかります。
ヒープファイル構成の利点
- レコードのフェッチと取得は、順次レコードよりも高速ですが、これは小規模なデータベースの場合に限られます。
- 大量のデータをロードする必要がある場合 データベース 一度に複数のファイルを作成する場合は、このファイル編成方法が最適です。
ヒープファイル構成の欠点
- 未使用のメモリブロックの問題。
- 大規模なデータベースでは非効率的です。
結論
結論として、適切なファイル構成を選択することが重要です。 データベース管理システム (DBMS) 。ランダムな構造は柔軟性を提供しますが、断片化につながる可能性がありますが、順序付けられたアクセスにはシーケンシャルな配置の方が適しています。インデックス作成によりバランスが取れ、クラスタリングにより特定のクエリの効率が向上し、ハッシュ構造により高速アクセスが最大化されます。効率を維持するには定期的なメンテナンスが必要です。選択は、特定のアプリケーションの要件に基づいて行う必要があります。 DBMS のパフォーマンスを最高にするには、戦略を慎重に組み合わせることが必要な場合があります。
アルファベットから数字へ
ファイル整理に関するよくある質問
Q.1: ファイル構成とは何ですか?
答え:
文字を文字列に変換する
ファイル編成は基本的に、ファイルの識別とレコードへのアクセスを容易にする、さまざまなレコード間の関係です。
Q.2: ファイル整理の 4 つの方法とは何ですか?
答え:
ファイル整理の方法としては、
- 一連
- ランダム
- シリアル
- インデックス付きシーケンシャル
Q.3: シーケンシャル ファイル構成とヒープ ファイル構成の違いは何ですか?
答え:
シーケンシャル ファイル構成とヒープ ファイル構成の簡単な違いは、シーケンシャル ファイル構成ではデータが適切な順序で配置されるのに対し、ヒープ ファイル構成ではデータが任意の順序で配置されることです。
詳細については、を参照してください。 DBMS ファイル構成 – セット 2 | DBMS でのハッシュ化 。