オブジェクトコードの書式
オブジェクトコードの書式が改定されます。
トークンは1字記号、単語文字列、テキストの3種類です。
1字記号は B, b, F, f, N, V, P, ! です。大文字と小文字のあるものは開始と終了の対です。B, b はブロック、F, f は関数呼び出しです。対にならないものとしては、N は予約語、V は変数、P は前置詞です。N には2個、V と P には1個の単語文字列が続きます。! はオブジェクトコードの終端です。これはファイルの終端の扱いが環境によっては問題になることを回避します。
変数 V は廃止されました。姓が context である名前を変数として使います。
単語文字列は、1字以上の安全なアルファベットを小括弧 () で囲ったものです。安全な文字とは、小数点(ピリオド)、英語圏10進数数字、英語圏アルファベット大文字、英語圏アルファベット小文字です。
テキストは、0個以上のそこそこ安全な文字素を、ASCIIコードの2番と3番で囲ったものです。そこそこ安全な文字素が何であるかは検討課題です。現状では、LF(ASCIIコードで10進数の10)は安全である、16進数で 0x20 以上の文字は安全である、という実装になっています。
最近の実装では UTF-8 のマルチバイト文字の判定が少し厳密になりました。ただし、個々のオクテットが UTF-8 を構成するオクテットとして正しいかを見ているだけで、文字列としての正しさは見ていません。
実装によってはテキストが UTF-8 の文字列として正しいかどうかを確認するかもしれません。この実装は推奨されますが、保証はされません。
閉じる小括弧と安全な文字、ASCIIコード3番とそこそこ安全な文字素は、ロケールにかかわらず区別できることがおそらく期待できます。
トークン間には冗長な空白文字を入れることが許容されます。
- 最終更新:2008-06-16 21:59:53
