内外総合通信社は地方紙の記事をまとめて読める便利なサイトなのだけれども、そこで提供されている RSS ファイルは、XML 宣言の encoding属性の値が "shift-jis" になっている (アンダーバーであるはずのものがハイフンになっている) ので、一部頭の硬いXMLパーサはこの RSS をパースしてくれない。いや、頭の固いというか、It is a fatal error when an XML processor encounters an entity with an encoding that it is unable to process
と仕様書に書いてあるので、理解できないエンコーディング実体であるところの "shift-jis" について DocumentBuilderFactory が例外を投げるのはもっともだ。でも、 "Shift" と "JIS" の間はハイフンでなくアンダーバーで繋げましょうというのは、出典はどこにあるのだろう。RFC か何かか。