html2poで扱えるタグを増やす

http://translate.sourceforge.net/wiki/toolkit/index
ここで配っているやつをいれてみた。
debianだと 0.10.1 かな

いくつかタグがうまく取り出せない上に、po2htmlで元に戻せないのがあったので調べてみた

/usr/bin/html2po
from translate.convert import html2po
from translate.convert import convert

html2poで translate.storage import html というのを読み込んでいて
怪しそうな部分があった

class htmlfile(HTMLParser, base.TranslationStore):
  UnitClass = htmlunit
  markingtags = ["p", "title", "h1", "h2", "h3", "h4", "h5", "h6", "th", "td", "div", "li", "dt", "dd", "address", "caption"]
  markingattrs = []
  includeattrs = ["alt", "summary", "standby", "abbr", "content"]

  def __init__(self, includeuntaggeddata=None, inputfile=None):

ということで、html2poで上のfrom2つの次の行に

from translate.convert import html2po
from translate.convert import convert
html2po.html.htmlfile.markingtags.extend(['strong','i','a','tt','img','u','b'])

if __name__ == '__main__':
  html2po.main()

こんなかんじで markingtags をふやせばいいみたいだ。

タグをふやして作ったやつでも、po2htmlは変更無しで元に戻せた。数個のファイルだけど。。。

改行の近辺がどうもあやしいきもするが。。。