OmegaT 使ってみました (Using OmegaT)

I have just translated the plain text using OmegaT. To be honest, this is the first time I used OmegaT for my work. I have used it for testing, it was to confirm the usage. This time, I have to translate a sort of "important notice" for users which is in plain text.

I am familiar with Open Language Tools Editor (OLT Editor) which was opensourced by Sun. It has been used daily for our translation either internally or externally by our contracted translation vendors. The biggest difference is the file format I am working on. On OLT Editor, I need a xliff. That is, I have to use a filter to convert the original format to xliff file. xliff is a short name for XML Localization Interchange File Format, and the spec is available here. Since it is based on the standard, it can be shared across the projects complying to the standard. In fact, most of the Sun documents translated by our organization are translated on OLT Editor, and a translation memory called TMX (Translation Memory eXchange) is generated and shared across the projects and releases. In other words, once we translate, review, correct, that translated contents will be our assets, and we do not want to waste them. We can leverage that effort to any other project or release. Actually, 50 - 60% of the translation has been leveraged in our organization. The process is automated from leveraging the past translation, translating the new contents, and uploading TMX to the main server.

On the other hand, sometimes I feel it is too time-consuming to translate just one page. In that case, I realized OmegaT is so handy. I do not have to create another format from the source file. If the source is html, I can work on it directly. I do not have to look into the glossary file separately. If I put the glossary file in the glossary folder in my project, and there is a match in the segment, the glossary entry appears to glossary window. TMX is generated and I can reuse it for the updates. Hummm, looks like
everything is going well, and I feel like living all with OmegaT!

The concerns are how I can manage TMX ? How can I merge multiple TMX files into one, sorting out the terms, keeping the consistency ? It is true we can put as many TMX files as we like into tmx folder so that they can be leveraged in the translation. But, if we work in a team, we needed to integrate multiple TMX files by individuals into one master TMX. When I asked this question to other teams in my organization, actually, it is NetBeans team, they pointed me the TMX merge tool. It looks nice, but should I download NetBeans and plugin ? ... it makes me intimidated.

Also, I wanted more keyboard short cut on the interface. Yes, I am a keyboard person ! I love vi! I love command line ! I like to move cursors up and down without any meaning while thinking what to write ... it's just like the way I play with mah-jong pieces while I am waiting for my turn in a game. Oh, I know I stepped out of the topic. Let me play with OmetaT for a while. I want to encourage the community members to use opensourced translation tools, and I'm sure OmegaT will be the 1st candidate.


OmegaT を使って翻訳してみました。実は、仕事で OmegaT を本格的に使うのは初めてです。これまでは、テストのためや使用方法を知るために試してみたことはありました。今回、 3.0 の重要なお知らせ (ODF の互換性に関するもの) を翻訳したのですが、それがプレインテキストだったので、試してみたのでした。

今までは Sun がオープンソースした Open Language Tools Editor (OLT Editor) を使ってきました。このツールは、Sun 社内でも契約している翻訳会社さんでも、ほぼ毎日、ほとんどのドキュメントの翻訳で使っています。一番大きな違いは、OLT では xliff という書式のファイルを使うことです。すべてのファイルは、フィルタを使って、この形式にしてから翻訳します。xliff とは「XML Localization Interchange File Format」の頭文字語で、ここにある標準に従ったものです。標準に沿ったものであれば、プロジェクトやリリースをまたいで使い回すことができます。実際、xliff を翻訳した結果として生成される TMX (Translation Memory eXchange) ファイルは、ほぼすべてのプロジェクトで共有されています。いったん翻訳し、品質を評価・保証したものは「財産」です。せっかく翻訳したのだから、残しておきたい。Sun 社内ではどうかというと、平均して 50 - 60% の翻訳結果は再利用しています。英語ファイルが準備されると、過去の翻訳から再利用できる部分を日本語に置き換え、残りを翻訳し、メモリーを作成してデータベースにアップロードする、という一連の処理は自動化されています。

うーん、便利そ〜、と思いますよね。でもその一方、1 ページだけプレーンテキストで訳したいんですよ、という場合には、こんな大きなシステムを使うのは面倒臭いわ! というのが本音。これまでは自分で訳す場合はメモリーは作らないでいたのですが、今回、OmegaT を使ってみて考え方を変えました。直後に更新があって助かったというのもありますが、何より、フォーマットを気にしないで翻訳できたのが嬉しかった。HTML ファイルを翻訳するのだったら中間ファイルを作らなくても、直接そのファイルを読み込んで訳文ファイルを作れます。また、用語集を読み込んでおけば、該当する用語があった場合、用語ウィンドウに対訳候補が出てくるので便利。TMX ファイルも生成されるので、アップデートにも使えたし。おぉ、いいことずくめじゃないですか、OmegaT !

でもね、心配もあるんです。TMX が複数あったら、それをどうやって 1 つのファイルにマージするの ? たとえば複数の人で作業した場合、用語や表現の統一をしたいですよね。それはどうやって? というのが疑問。社内の人に聞いてみたところ、NetBeans チームの人が TMX マージツールを教えてくれました。お、よさそうだけど... NetBeans にプラグイン !? それはちょっとびびってしまうなぁ (すみません)。何かいい方法ないですかねぇ。

あと、キーボードショートカットがもっと欲しいなぁ。そう、わたし、キー入力大好きなんです! vi 大好き! コマンドラインさいこー ! vi の編集モードで、キーを上下左右に動かしながら、ぼーっと考え事するの好きで���。これって、麻雀で自分の番を待ってるときに牌をシャカシャカいじる感じに似てるかも。... おっと話がそれてしまいました。もう少し OmegaT をさわってみようと思います。これから、もっとコミュニティーのみなさんにもオープンソースの翻訳ツールを紹介したいと思っているんですよね。OmegaT は有力候補です。



I am so glad you at last used OmegaT for real. When was it when I made my presentation in the Yoga office ? Almost 2 years and a half ago ? OmegaT was going to release 1.6 with the first implementation of the segmentation rules. It was such a huge improvement.

Now, the code is evolving so quickly. The version in the developer's repository has on demand matching which means that loading a project is _much_ faster than with the normal version. It also can use Lucene for better matching with stemmers.

Also, the beta version (1.8) uses OOo's spellchecker internally (hunspell).

OmegaT is still an application for lone translators. There are plenty of things to develop on the collaboration side. But most of the need have been "analysed" and are registered in the "RFE" section of the SourceForge page.

The only thing OmegaT needs is (more) volunteers to implement RFEs, fix bugs, write more doc (even though the current manual is not so bad). etc.

I really hope your article will contribute to convince more people of using OmegaT, and eventually contribute.

Thank you so much :) Merci !


Posted by Jean-Christophe Helary on 6月月 05日, 2008年 at 01:13 午後 JST #

No, you don't need NetBeans for TMXMerge :-)

JC, OmegaT uses Hunspell if you can use native libraries, otherwise it falls to MySpell.

Posted by Dmitri Gabinski on 6月月 05日, 2008年 at 03:18 午後 JST #




« 4月 2014