如何获取 json 文件的字符编码类型
How to get the character coding type of a json file?
我要从jsoncpp获取json字符串的字符编码类型:UTF-8,ANSI还是UNICODE?如何获取 json::value 的字符编码类型?提前感谢!
任何字符串都只是一个字节序列,可能符合一些基本规则(空终止符、json 禁止的符号等)。没有神奇的方法来确定使用哪种编码来形成字符串,因为编码只是表示字符串二进制数据的一种方法。因此,json 字符串编码应该由 json 颁发者指定(也许在文档中),或者有关它的信息应该是 json 的一部分(如果由于某种原因不同的字符串具有不同的编码)。
确定字符串的字符编码非常复杂。请参阅此SO答案以选择正确的应用程序。
Apache Tika - 内容分析工具包可能是最先进的工具包之一,根据以下引用:
Apache Tika™ 工具包从一千多种不同的文件类型(如 PPT、XLS 和 PDF)中检测并提取元数据和文本。所有这些文件类型都可以通过单个界面进行解析,使 Tika 可用于搜索引擎索引、内容分析、翻译等等。您可以在下载页面上找到最新版本。
可以使用这些库中的每一个来分析 JSON 字符串,从而生成一个(可能的)可用于进一步处理的 CharSet。
相关文章:
- 将字符指针十六进制转换为字符串并保存在文本文件C++中
- 如何在C++中确定文本文件中的元素是字符还是数字
- 如何在 C++ 中从文件中读取字符数组(带有一些空格)
- 如何从文本文件中读取数值,直到遇到字符类型?
- 使用 fopen 打开 .pak 文件并使该文件应用于 const 无符号字符* (C++)
- 如何像在 C++ 中处理数组一样对 .txt 文件中的字符进行寻址?
- 尝试将字符串从文件读取到无符号字符向量中
- 如何在C++中反转文本文件中字符的顺序?
- 生成随机.txt文件,10行,10列。充满随机:"*"、"#"、"@"。然后将随机字符替换为'P'
- 如何存储 unicode 字符并将其输出到文件?
- 无法将整个文本文件复制到字符数组
- C++逐个字符读取二进制文件字符
- 如何将所有文件字符转换为大写或小写
- 如何通过C 读取CHAR的文件字符
- 无法写入文件字符指针
- 在 c++ 中逐个从文件字符读取
- Boost:如何检查文本文件字符编码/字符集
- 文件字符编码
- c++ -读取文件字符时的无限循环
- 创建一个大尺寸的char类型数组并复制文件字符