首页 › 标签存档: › i18n

字符集和编码III: tricky cifs

CIFS是SMBFS的后继,SAMBA共享最好还是用CIFS内核模块,smbfs已经deprecated了(最近的内核已经没有smbfs module了)。

一台Linux服务器,上面同时有locale为GBK和UTF-8的中文文件名,其上samba服务器的设置为unix charset=cp[......]

Read more

字符集和编码II: fat/msdos/vfat

具体到文件名乱码的问题,需要明确两点

  1. 第一,文件名作为一个字符串,需要被编码后存入文件系统;
  2. 第二,Linux内核无非是个特殊的应用程序,它读取文件名,再把文件名以编码后的形式传递出去。

但Linux内核只能逐字节处理编码流(而Windows NT内核是UCS-2的,逐2字节处理编码流),[......]

Read more

字符集和编码 I:formalization

按:原文主要关于fat/vfat,于07.6.15写在未名上。另外之前也写过关于cifs字符集的问题,有回复说选项有问题,于是就研究了下我当时为什么那么设字符集。研究的结果是,用映射的概念来解释字符集的问题无比有力及方便~~所以改了下未名的文章,再加上cifs的内容。

随着UNICODE和UT[......]

Read more