处理电子邮件标题中的空白行

Handling blank lines in email headers

本文关键字:空白 电子邮件 标题 处理      更新时间:2023-10-16

遇到一些不符合RFC的邮件

authentication-results: spf=none (sender IP is ) smtp.mailfrom=**@********.**;
Content-Type: multipart/related;
    boundary="_004_2039b206f2a54788ba6a101978bd3f82DBXPR07MB013eurprd07pro_";
    type="multipart/alternative"
MIME-Version: 1.0

例如,上面的邮件在标题中有一个空行(在Content-Type之前)。严格遵守RFC的库(例如https://github.com/mikel/mail)将无法解析它们。Apple Mail、Thunderbird确实能处理这类邮件。

我试着浏览雷鸟的代码库,不熟悉c++,我只是设法找到https://github.com/mozilla/releases-comm-central/blob/1f2a40ec2adb448043de0ae96d93b44a9bfefcd1/mailnews/mime/src/mimemsg.cpp

谁能告诉我雷鸟代码库中邮件解析发生的部分,或者任何处理此类非投诉邮件的开源库/应用程序。

编辑:

空行的Hexdump。它包含一个空格

00013e0: 2a2a 2a2a 2a2a 2e2a 2a3b 0d0a 200d 0a43  ******.**;.. ..C
00013f0: 6f6e 7465 6e74 2d54 7970 653a 206d 756c  ontent-Type: mul
0001400: 7469 7061 7274 2f72 656c 6174 6564 3b0d  tipart/related;.

参考Ruby库中的Ruby代码不符合RFC, RFC允许将多行合并为单个标题行。规则是,延续页眉行(折叠页眉)应该以空格开始——确切的细节在RFC 5322"折叠空白和注释"一节中。

最有可能的问题是Ruby代码在解析之前读取每一行并修剪空白—因此无法检测到额外的行实际上属于前一个头—然而,额外的行并不向头添加任何内容(因为它只包含一个空格),但它是有效的语法。

编辑:

不兼容行为在提交17783f8536fc09b926c7425dbacfc35e0e851ef5中引入。引入的副作用之一是拆分头文件&

页眉
CRLF = /rn/
white_space = %Q|x9x20|
WSP = /[#{white_space}]/
header_part, body_part = raw_source.split(/#{CRLF}#{WSP}*#{CRLF}(?!#{WSP})/m, 2)

这个问题是在commit a2a45597bce66ebe788cedaaab848a37bd04b25a中提出的,但共识是不破坏现有的行为。