5C問題とは、2バイト文字の2バイト目の値が「5C」である文字を正しく解釈できないアプリで発生する現象のこと。2バイト目の「5C」を「\」と解釈するため発生する。「機能」「性能」「ソース」「表示」などのよく使う単語で引っかかるので注意。
5C問題の発生する文字
SJIS (37文字)
―ソЫ噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭
MS932 (42文字)
―ソЫⅨ噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭偆砡纊犾
―ソЫ噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭
MS932 (42文字)
―ソЫⅨ噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭偆砡纊犾
「Ⅸ偆砡纊犾」はMS932のみ。
※SJIS・MS932を指定して5C文字をファイル出力するプログラムを作成して確認した。
Ⅸはいわずと知れた13区のNEC特殊文字です。纊犾はIBM拡張文字です。偆砡は、89-92区のNEC選定IBM拡張文字です。この2文字については115-119区のIBM拡張文字ではなく、あえて89-92区のNEC選定IBM拡張文字を使用したときにのみ問題が生じます。よって特に意識しない限りは一般的には以下と考えていいと思います。
一般的な5C問題文字 (40文字)
―ソЫⅨ噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭纊犾
―ソЫⅨ噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭纊犾
|