通常、日本語は 1 文字 2 バイトで表現されている。 だから日本語のテキスト・ファイルのサイズは大ざっぱに言って、 文字数×2バイトと考えれば良い (実際には空白や改行、 また英数字など 1 バイトで表現される文字などもあるので、 あくまでも概算である)。
文書の文字数を概算するのは簡単だから (一行○文字、一ページ○行、 ○ページ)、 文書の文字情報をテキスト・ファイルにした際のサイズの概算ができることになる。