一些遗留代码依赖于平台的默认字符集进行翻译。对于“西方世界”中的 Windows 和 Linux 安装,我知道这意味着什么。但是考虑到俄罗斯或亚洲平台,我完全不确定他们平台的默认字符集是什么(只是 UTF-16?)。
因此,我想知道执行以下代码行时会得到什么:
System.out.println("Default Charset=" + Charset.defaultCharset());
PS:
我不想在这里讨论字符集的问题以及它们与 Unicode 的区别。我只想收集什么操作系统会导致什么特定的字符集。请只发布具体的值!
这是用户特定的设置。在许多现代 Linux 系统上,它是 UTF-8。在 Mac 上,它是 MacRoman。在美国的 Windows 上,它通常是 CP1250,在欧洲它是 CP1252。在中国,您经常会发现简体中文(Big5 或 GB*)。
但这是系统默认值,每个用户都可以随时更改。这可能是解决方案:使用系统属性启动应用程序时设置编码
file.encoding
请参阅此答案如何做到这一点。我建议把它放到一个启动你的应用程序的小脚本中,这样用户默认值就不会受到污染。