文字コードについて

1バイト文字と2バイト文字

パソコンの中で、文字は文字コードで表されています。文字コードは、0と1の並び(デジタルデータ)で表されています。例えば、「a」は(01100001)、「1」は(00110001)のように、8桁の01の並び(8ビット=1バイト)で1文字が表されます。これで2=256通りの文字がコード化できます。アルファベットや数字・記号など128通りの文字は、世界共通で使えるよう規格化されています。残り128通りのコードは、規格化されていないので各国でそれぞれ必要な文字を登録します。日本では、ここに仮名文字(アイウエオ)を当てていました。かつては、コンピューターが使える文字は、この256文字がすべてでした。これを1バイト文字といいます。世界共通の128文字は、現在でもコンピューターの基本文字です。

 これでは日本語の平仮名や漢字は入り切れません。そこで、16ビット(2バイト)で1文字を表すコード体系を作りました。例えば「あ」は(1000001010100000)のようになります。コンピューターのCPUが16ビット処理をするようになり、これを使って日本語ワープロが作られました。16ビットなら216=65536通りの文字が登録できます。JISコードでは、ここに平仮名・カタカナ・漢字の他、英数記号もすべてコード化しています。これを2バイト文字といいます。1バイト文字の2文字分で、1文字を表すので、1バイト文字が混在すると、読み取りが面倒になります。ワープロでは、英数記号も含めて、すべて2バイト文字で記録します。

フォントについて

実際に表示する文字の形を表すデータを、フォントといいます。コードからフォントを選び、画面表示や印刷に使います。このフォントデータは、かつては縦横に並んだ点で表示していました。1バイト文字では、最低8×8=64個の点の集まりで文字の形を表現できました。しかし、漢字などの2バイトコード文字は、最低でも16×16の点が必要でした。画面上でも倍の幅になるので、全角文字と言いました。英数記号やカタカナは16×8のフォントも用意し、日本語文字の半分の幅を持つフォントも用意し、これを半角文字と言いました。過去形で表現しているのは、ワープロで言う「全角・半角」は、現在では別の意味だからです。現在では、1バイト文字を半角文字・2バイト文字を全角文字、といいます。実は、ワープロで使っている半角文字は、2バイトコードの文字なので、「全角文字」なのです。

Windowsのフォント

Windowsでは、2バイト文字も1バイト文字も混在して使えます。ただし、半角カナ文字は使用に制限があります。また多くのフォントが任意の大きさで使えます。これは、文字の形を点でなく線で登録してある(ベクトルフォント)ので、大きさを変えても1つのフォントで済むのです。windows以前は、サイズが異なるとフォントデータも別のものを使いました。パソコンとプリンターで別々にフォントデータを持つので、画面で見たものと印字したものと形も異なりました。windowsでは、プリンターはフォントを必要としません。パソコンが作った画像イメージを、そのまま印刷します。これは、活字印刷から写植印刷になったのと似ています。

プロポーショナルフォント

windowsでは、文字の大きさ・形に制限が無くなりました。文字の大きさは、「ポイント」という印刷業界で使われていた単位で表されます。通常は8ポイントから409ポイントまで、任意の大きさの文字が使えます。これらのポイントで共通なのは、文字の高さです。横幅は、文字によって異なります。
Officeという文字を見て下さい。大文字のOが一番横幅が大きく、fやiは幅が狭いのです。こういう表現は、活字のタイプライターではできません。高級な写植文字でしか使えなかったものが、windowsでは標準で使えます。これを、プロポーショナルフォントといいます。文字によって横幅が異なるのです。日本語の文字も同様です。画数によって文字幅は異なります。プロポーショナルフォントを使うということは、ワープロなどの行の文字数という考え方は、変えざるを得ません。1行何文字、という設定は意味がないのです。文字によって何文字並ぶかは、違ってきます。行に入る文字数の計算は、コンピューターの仕事になります。

固定ピッチフォント

原稿用紙のように、縦にも横にも文字数を固定して印刷したい、という場合は固定ピッチフォントも用意されています。「MSPゴシック」のように、フォント名にPがあるものがプロポーショナルフォント、「MSゴシック」のようにPが無いものが固定ピッチフォント、という区別もあります。しかし、Microsoft社の日本語フォントだけで、一般的ではありません。Pが無くともプロポーショナルフォントが殆どです。固定ピッチフォントは、「MSゴシック」と「MS明朝」だけと思った方が良いでしょう。ワードでも、初期設定はプロポーショナルフォントを使うようになっていましたが、「横が揃わない!」というワープロ派の苦情で、最近のワードは初期設定では固定ピッチフォントを使うようになっています。しかし、多くのフォントがプロポーショナルフォントです。この方が、高級なフォントなのです。ワープロ専用機で打った文章か、パソコンで打った文章なのかの区別は、プロポーショナルフォントを使っているかどうかで判別できるのです。

ワードの文字揃え

ワードのような、パソコンのワープロでの文字揃えにスペースを多用するのは間違いです。プロポーショナルフォントを使っている場合は、文字数を数えてスペースを挟んで揃えようとしてもうまくいきません。文字揃えは、TABやインデントで設定します。半角文字は全角文字の半分の横幅、というワープロの概念も通用しません。パソコンとワープロは異なるものです。タイプライターと写植編集機の違いです。パソコンはワープロとして使う場合も、ワープロ専用機より高級な進んだ環境なのです。

戻る   ○次へ