Project

General

Profile

Feature #1951

Updated by nobu (Nobuyoshi Nakada) about 7 years ago

=begin 
  #747と#802で議論された、openのBOM指定拡張ですが、現在の仕様は、 

 
  * BOMを捨てる 
 
  * BOMを見てencodingを設定する 
 
  という2つの機能が混在しています。 

 このために、たとえば「`UTF-8-BOM`」という指定でも、 
 
 
  このために、たとえば「UTF-8-BOM」という指定でも、 
  BOMがUTF-16LEを示していた場合には実際に返ってくるStringはUTF-16LEになってしまいます。 


 
 
 
  この問題に対する解決案として、 

 
  * UTF-*-BOM はBOMを捨てるだけ。別のencodingだった場合は例外 
 
  * `BOM|UTF-*`を追加、これが現在の`UTF-*-BOM`相当の動作 BOM|UTF-*を追加、これが現在のUTF-*-BOM相当の動作 (BOMを見る OR `UTF-*`と指定、というイメージ) UTF-*と指定、というイメージ) 
  というものを考えています。 

 
  皆さんはどのように思われますか? 
 
 =end 

Back