毎月残存量を気にする人も多いであろうスマホのデータ容量、5GBや10GBといった記載がされていますが、これらは「ギガバイト」という情報量に関する単位です。
私のような昭和生まれには、少し前のフロッピーディスク時代の「キロバイト(kB)」なんて単位がとても懐かしく感じられますが、そもそもこの「バイト」という単位は何を表すのでしょうか?
今回はデータやメモリなどの容量に使われる単位「バイト(byte)」の意味や、「キロバイト、メガバイト、ギガバイト」などSI接頭辞の付いた単位について紹介します。
情報量の単位バイトとは
バイト(byte)はデジタルコンピュータの情報量を表す単位です。「キロ」や「メガ」といったSI接頭辞がつきますが、バイト自体は特にSIで定義された単位ではありません。
単位記号
[byte]※全て小文字
バイトの定義
そもそもコンピュータのデータ処理には、全て0と1だけを使う2進法が使われています。この0か1の1文字のデータ量を「ビット(bit)」と呼び、コンピュータ情報量の最小単位となっています。
本記事のテーマである「バイト(byte)」は8 bitの情報量を表す単位で、式で表すと以下の通りです。
1 byte = 8 bit
なぜ8bitかと言うと、アルファベット(大文字、小文字)や数字、記号といったいわゆる「半角文字」が表現できる情報量だからです。つまりバイト(byte)とは、コンピュータの世界において半角文字1文字を表現するための単位ということになります。
私たちがパソコンなど使う際目にする、最も小さな単位というイメージですね。
ちなみに日本人が使うひらがなや漢字といった「全角文字」は1バイトでは表現できません。2バイトの情報量が必要になります。
byteとKB、MB、GBなどの関係
あえて英語表記で書いていますが、スマホやパソコンを購入する際、データ容量が32 GBだの64 GBだのと書かれていて、これらは「32ギガバイト」「64ギガバイト」と読みます。
ギガというのはSI接頭辞と呼ばれる倍量単位の1つ(109倍を意味します)ですから、そのまま書くなら「32 Gbyte」で良さそうなものですよね?なぜわざわざ大文字のB表記に変えるのでしょうか?
参考記事:SI接頭辞についてはこちらの記事で詳しく解説しています↓↓↓
SI接頭辞(SI接頭語)とは?一覧まとめと変換方法、覚え方を紹介!SI接頭辞(SI接頭語)とは?一覧まとめと変換方法、覚え方を紹介!
じつはデジタルの世界で使われる接頭辞の意味合いは、通常のSI定義とは少し異なります。
先ほど書いた通り、デジタルの世界では0と1の2進法が全てのベースとなっています。従って、データの倍量を表す際も2の累乗(2n乗)を使った方が都合が良いのです。
例えばキロバイト(KB)。通常のSI定義では「キロ=1000倍」という意味ですが、デジタルの世界では下式となります。
1 KB = 210 byte = 1024 byte
要は、SIにおけるキロ=1000倍に近い数字であることから、便宜上「キロバイト」という単位を使っているのです。
またメガバイト(MB)は、キロバイトの更に210倍ですから、下式となります。
1 MB = 210 KB =10242 byte
どうでしょう?本項目の冒頭で書いた「なぜわざわざ大文字のB表記に変えるのでしょうか?」という質問の答えについて、察しが付くのではないでしょうか?
もし1 kbyteという単位を作るとしたら、それは1 kbyte = 1000 byteになってしまいます。
そうではなく、デジタルの規則に則った単位ですよと言うのを表すために、敢えて210倍の倍量単位に大文字のBを使ったと考えられます。
こう覚えておくと便利なのが、SDカードや外付けHDDなど記憶媒体を購入する時です。
私自身も経験があるのですが、例えば1 TBの容量と謳われたHDDを購入してパソコンに繋いでみると、容量が実際には900GB程度しかない!騙されたのか!?なんて焦ったことはありませんか?
もちろん、多少の容量は最初からシステムなどで使われていると思いますが、パソコンで空き容量を調べると、「バイト」で記載された数値と「GB(機種によってはTBなど)」で記載された数値が異なることがわかります。
次項で「バイト(byte)」と「KB,MB,GBなどの倍量単位」にどれほど差があるのか、一覧表でまとめてみますね。
バイトの倍量単位一覧表
バイト(byte)数とKB、MBなどの倍量単位との間の関係をまとめた表が以下になります。ギガ以上の単位についても記載してありますので、参考にしてみて下さい。
倍量単位 | 読み方 | バイト数 | SIの場合の倍数 |
KB | キロバイト | 210 1,024 | 103 1,000 |
MB | メガバイト | 220 1,048,576 | 106 1,000,000 |
GB | ギガバイト | 230 1,073,741,824 | 109 1,000,000,000 |
TB | テラバイト | 240 1,099,511,627,776 | 1012 1,000,000,000,000 |
PB | ペタバイト | 250 1,125,899,906,842,620 | 1015 1,000,000,000,000,000 |
EB | エクサバイト | 260 1,152,921,504,606,850,000 | 1018 1,000,000,000,000,000,000 |
ZB | ゼタバイト | 270 1,180,591,620,717,410,000,000 | 1021 1,000,000,000,000,000,000,000 |
YB | ヨタバイト | 280 1,208,925,819,614,630,000,000,000 | 1024 1,000,000,000,000,000,000,000,000 |
キロレベルでは24バイトしか変わりませんが、単位が大きくなるにつれてその差も膨大になっていきます。
1 TBと1 Tbyte(SIの倍数を使った場合を便宜上こう書いておきます)の違いなんて100 Gbyte近くなってますしね。
そう考えると、本来外付けHDDなどの表記は本来「Tbyte」の方で書かないといけないんじゃないかと思うんですがね。厳密には誤認表示にならないのかしら。。。と、ちょっと違う方向で気になってしまいます。
まとめ
バイト:デジタルコンピュータの情報量を表す単位。1 byte = 8 bitを意味する。8bitはアルファベットなど半角文字1文字分の情報量。単位記号は[byte]。
KB,MB,GBなどはバイトの倍量単位であるが、接頭辞の意味がSIによる定義とは異なり、1 KB = 210 =1024 byteを意味する。
この定義に従うと、1 MB = 1024 KB、1 GB = 1024 MBとなる。
210