> из CP-1252 в CP-1251
Ты где-то реально такое встретил или сам пример придумал? :) CP-1252 это западноевропейские языки, а CP-1251 - кириллические. Каждый язык имеет своё множество кодировок, и перекодировать можно только в пределах одного языка.
зы. я когда-то вплотную юзал енцу, так вот скажу, что это лучший инструмент по детектированию кодировок из всех что я видел. Только ему желательно подсовывать для анализа текст хотя бы с нескольким десятком слов, тогда ты получишь практически 100% попадание. Чем короче текст - тем ниже результат. Ну и канешно же не совать какие-нибудь китайские иероглифы в надежде что получишь ридну мову :) Енца использует эвристику и довольно умна, но не на столько же чтоб ещё и вычислять подвохи :)
Re: Автоопределение кодировки
> из CP-1252 в CP-1251
Ты где-то реально такое встретил или сам пример придумал? :) CP-1252 это западноевропейские языки, а CP-1251 - кириллические. Каждый язык имеет своё множество кодировок, и перекодировать можно только в пределах одного языка.
зы. я когда-то вплотную юзал енцу, так вот скажу, что это лучший инструмент по детектированию кодировок из всех что я видел. Только ему желательно подсовывать для анализа текст хотя бы с нескольким десятком слов, тогда ты получишь практически 100% попадание. Чем короче текст - тем ниже результат. Ну и канешно же не совать какие-нибудь китайские иероглифы в надежде что получишь ридну мову :) Енца использует эвристику и довольно умна, но не на столько же чтоб ещё и вычислять подвохи :)
Mozilla/5.0 (Windows; U; Windows NT 6.1; ru; rv:1.9.2.10) Gecko/20100914 Firefox/3.6.10 GTB7.1