#18_1 テキストファイルの種類
データベースとファイルの種類
「データベース」という言葉はみなさんご存知かと思います。2次元の表で表されることが多く、下のような形のものを一般的に指します。
このようなデータベースの各項目(列要素)を「フィールド」、それに対して各データ(業要素)を「レコード」と表現します。
このデータベースの表現のルールが、そのままてきすtファイルにも当てはまります。
テキストファイルの内容にも「フィールド」と「レコード」という概念があるのですが、縦方向の区切り方(フィールドの区切り方)によって、テキストファイルは「区切り文字形式」と「固定長フィールド形式」に分類されます。
まず、「区切り文字形式」とはタブやセミコロン(;)、スペースやカンマなどの区切り文字で書くデータが区切られているテキストファイルです。具体的には、以下のようなものになります。
このようなカンマで区切られたファイルをcsvファイルと呼びます。
次に、「固定長フィールド形式」を紹介します。これは、各フィールド(列)ごとにデータサイズが統一された形式であり、各フィールドのデータサイズが等しいため、結果的に行(レコード)ごとのサイズも等しくなります。