エディタでmboxファイルを開くと、各メッセージが次から始まるようです。~から以下は空白で、次は住所と日付です。これはmbox構文の一部ですか、それともEメール形式の仕様の一部ですか?RFC 2822? ~によるとmboxに関するWikipediaの記事、mbox RFCはありません。コロンはありませんか?~からUUCPに関連していますか?
いくつかのmboxを解析する必要がありますが、コロンがない場合を処理する方法を知りたいです。~から。
答え1
私はmbox形式の詳細な調査をしました。短い答えは、mbox形式を指定するRFCはありませんが、1970年代半ばからテキストファイルにまとめられた複数のメールメッセージを分離するためにFrom + spaceが使用されたことです。
Bell Labsの最初のUnixバージョン(1971年11月)にはメールコマンドがありましたが、ソースコードが失われてどのように機能したのかわかりません。 mboxが表示されます3番目のバージョン。ソースコードはUnix第5版(1974年6月から)From
回復したものを見ると、メッセージを区別するために+␣マークが使用されていることを確認できます。構文は、From、空白、空白のない名前、およびctime文字列(人が読める24文字のタイムスタンプ)です。
+行は、From
送信者が入力したメッセージの前に追加され、次に受信者のメールボックスに追加される送信プロセスによって導入されます。この慣行はその後、かつて人気があった郵便配達プログラムを含む成功した郵便配達プログラムにつながった。メールを送信UnixのBerkeleyバリエーションに由来
Berkeley Unixの初期バージョンはBell Labsバージョンを補完しました。 1979年3月にリリースされた2番目のBerkeleyソフトウェアリリースには、すでに洗練されたメールプログラムが含まれており、後でsendmailを形成するファイル構造の始まりを見ることができます。コードは次のとおりです。head.c
+␣マークを識別し、From
いくつかの修正を適用します。名前は17文字以下でなければなりません(sendmailの時代には保持されません)、日付の終わりと改行の間にさらに多くのテキストがあるかもしれません(これはそうです)。
sendmailの後継者、例:キューメールFrom
は、電子メールメッセージで+␣で始まる処理行を含むmboxの構文を定式化しました。さまざまなmbox形式。