Enhanced encoding detection when parsing HTML (or XML) document.
authorFrederic Jolliton <frederic@jolliton.com>
Thu, 8 Sep 2005 03:16:59 +0000 (03:16 +0000)
committerFrederic Jolliton <frederic@jolliton.com>
Thu, 8 Sep 2005 03:16:59 +0000 (03:16 +0000)
commit418cb367ec4650597efb696504a0ac4d726eca14
tree38c7af9af92460253df5365ec72776d2cf31b61a
parent7d3e15d92702aa4bb7327e3dfe9f3737dd1b46de
Enhanced encoding detection when parsing HTML (or XML) document.

 * Enchanced encoding detection algorithm, to check BOM, XML declaration
   and "http-equiv" meta element. Moved to misc module.

 * Fixed bug in guessXmlCharacterEncoding when passing an Unicode string
   (skip offset was missing from the return value.)
git-archimport-id: frederic@jolliton.com--2005-main/tx--main--0.1--patch-13
htmlparser.py
htmltree.py
misc.py
xpath_prompt.py