- ...
タベースになる1
- 野口悠紀男氏は、著作の中で文書作成のソフトウェア
として 5 つのタイプのものをあげているが、その 5 番目は「メーラ」となって
いる。「メーラをあえて文書作成ソフトとして評価対象としたのは、文書管理機
能が優れているためである。(中略) 管理機能の点でいえば、他の四つのタイプ
のソフトウェアに比べて、遜色のないものである。」
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
ディレクトリィに保存してあるが2
- GraceMail の
場合は Mail/ginbox に保存してあるであろう。
しかし、すぐ後に説明する理由 (文字コードの問題) によって、
grep では検索ができない。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
のようにしてしまうわけである3
- きちんとした印刷文書の場合には、
単語の途中でハイフンを入れて次の行に続ける
-- この作業を hyphenation と呼ぶ -- とか、
単語間の空白を調整してちょうど行の終りに単語の終りが来るようにする、
などの工夫をするが、
タイプライターなどで作成する文書では、行の終りが近づいたら、
適当な単語の終りで改行してしまう。
英文のテキスト・ファイルはこの「作法」に則って作成されるのが普通である。
例えば前回の実験に使った Gutenberg テキストを見よ。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... 以上のことと少し関係するが4
- 英語の文章では行の終りは、
単語間の空白のように単語の切目を意味することが多いが
(例外は hyphenation してある場合)、
日本語の文章では行の終りは、単語の切目を意味しない。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
「形態素5
- 意味を有する最小の言語形態のことを形態素という。
英語で言う morpheme.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
またそれだけでは十分でないこと6
- 例えば、
「東洋一」が「東洋」「一」なのか、「東」「洋一」なのか、
文脈を見ないと判断できない。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...このうち文字コードの問題だけは比較的簡単に解決できる
7
- nkf, less, mule などのコマンドも、
日本語テキスト・ファイルの文字コードを自動判別して
適切に処理するようになっている。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ... 桂田の用意したコマンドを利用できるようにする8
- 日常的に lgrep を使いたい人は、
.cshrc にこのコマンドを書いておくと良い。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Namazu9
-
Namazu について知りたければ、ホームページ
http://www.namazu.org/ を見よ。
なお、情報処理 II のページにもいくつか説明を用意してある。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
をあげておこう10
- なお、この著者のホームページ
http://www.horagai.com/ にも色々載っている。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.