株式会社 SSKPC

A00035 2000/01/01
2バイト文字
1文字を2バイトのコードで表す文字体系のこと。通常は4桁の16進数で表記する。日本語の漢字やひらがななど文字数が多い文字体系に使われる。これに対して半角のアルファベットやカタカナなどを1バイト文字という。  1バイト(8ビット)で表現できるのは256通りだが、2バイトだと6万5536通りにもなる。アルファベットのように文字の種類が少ない場合は、1バイトの文字コードで十分。しかし、漢字は使用頻度の最も多い第1水準で約3000字、続く第2水準で約3400字あるなど極めて文字数が多い。このため、2バイトで表現する文字コードが用意された。  現在主に使われている2バイト文字コードは国ごとに別々に定めてあり、例えばシフトJISコードのテキストは標準的な中国語環境では正しく表示できない。そのため、世界各国の文字体系に対応できる統一的な文字コードとしてユニコードが開発された。しかし、日本語と中国語で字体の異なる文字が同じコードに割り当てられているなどの問題点がある。