Next: 2.5 課題6
Up: 2 レポート講評
Previous: 2.3 課題4
- 「Gutenberg テキスト」の意味を取り違えた人がいた。「Gutenberg プロ
ジェクトで電子化されたテキスト」の意味である。
桂田が講義のために持ってきたのはいずれも小説を電子化したもの。
全然関係ないファイルを調べた人は「授業を聴いていない人」。
- すぐできることしかやらない人が多かった。
「文字が別の記号に置き換えられた場合、出現頻度情報から解読するこ
との可能性について考えよ」や「単語の使用頻度の癖のようなものがあ
ると思われるが、そのことを Gutenberg テキストで実際に調べてみよ」
は無視された格好。自分の頭を働かせて分析するのは苦手でしょうか。
この課題については、そのうち情報処理IIのページに解答例を出すこと
にしますので、興味ある人は見てください。
- レポートを送るのが後になるのだったら、それこそ gnuplot で図示して
それを見て考えるとか、工夫して欲しかった。
- ただ単にコンピューターの出力を見せて、「ほとんど同じでした」では
分析になっていない。例えば、そこから出現頻度上位3文字を各テキスト
でピックアップしてみて、順位がほとんど同じであることを指摘した人が
いたが、そういうのが「分析」である。
- 単語の出現頻度を調べた人がいなかったのはなぜだろう。
tr のトラブルがあったから?
- ``Romeo and Juliet'' なんて入手して調べてくれた人もいた。ちょっと
嬉しい。
- 本当に暗号化して復号するなど自分でやれば完璧なのだが。そういう問題を
出すべきだったか、、、
Next: 2.5 課題6
Up: 2 レポート講評
Previous: 2.3 課題4
Masashi Katsurada
平成20年10月18日