文字コード‎ > ‎

5C問題

5C問題とは、2バイト文字の2バイト目の値が「5C」である文字を正しく解釈できないアプリで発生する現象のこと。2バイト目の「5C」を「\」と解釈するため発生する。「機能」「性能」「ソース」「表示」などのよく使う単語で引っかかるので注意。

5C問題の発生する文字
SJIS (37文字)
―ソЫ噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭
MS932 (42文字)
―ソЫ噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭偆砡纊犾
偆砡纊犾」はMS932のみ。
※SJIS・MS932を指定して5C文字をファイル出力するプログラムを作成して確認した。

はいわずと知れた13区のNEC特殊文字です。纊犾はIBM拡張文字です。偆砡は、89-92区のNEC選定IBM拡張文字です。この2文字については115-119区のIBM拡張文字ではなく、あえて89-92区のNEC選定IBM拡張文字を使用したときにのみ問題が生じます。よって特に意識しない限りは一般的には以下と考えていいと思います。

一般的な5C問題文字 (40文字)
―ソЫ噂浬欺圭構蚕十申曾箪貼能表暴予禄兔喀媾彌拿杤歃濬畚秉綵臀藹觸軆鐔饅鷭纊犾

815c
835c
845c Ы
875c
895c
8a5c
8b5c
8c5c
8d5c
8e5c
8f5c
905c
915c
925c
935c
945c
955c
965c
975c
985c
995c
9a5c
9b5c
9c5c
9d5c
9e5c
9f5c
e05c
e15c
e25c
e35c
e45c
e55c
e65c
e75c
e85c
e95c
ea5c
ed5c
ee5c
fa5c
fb5c