翻訳APIの使い勝手と翻訳精度は一致しない

■ついったークライアントをVBで作っていくと、自分が使いたいように作りこめるということもあって、いろいろ欲が出てくる。今まで専用クライアントを使っておらず、もっぱらtwitter.comから直接使っているので、そちらとの比較で。

 Retweetという、自分がウォッチしている人のログエントリを、自分のログをウォッチしている人に転送するアクションがあって、そのとき、Retweetであることを示すために'RT'というマークを入れる慣習がある。webのインタフェースだとこのRTというマークが自動的に入らないので、ちょっと面倒ということがあってそのあたり自動化できるといいなあ、といった些細なことから、英文のエントリを自動翻訳できるといいなあ、とか。

 自動翻訳といっても、それ用のソフトが手元にあるわけではないので、ローカルには処理できないし、もちろん自前で翻訳エンジンを作るのも無理。というわけで素直にオンラインでAPIを公開している翻訳エンジンを探す。
 見つかったのはBing, Yahoo, Google。Bingは.NETでVisual Studioとの親和性も高い。YahooはGetメソッドの引数として翻訳したい文書を渡すとRSSで結果を返してくれる(それ以外のフォーマットもある)。GoogleはAJAX。
 とりあえずとっつきやすいBingを試した。アプリケーションIDを取得して、Visual StudioにI/Fコードを生成させて、と翻訳させてみたらこれがひどい。
 単語レベルで翻訳はできているようなのだけど、構文レベルはダメなようで、ちょっと使えない。

 VBでクライアントを作っているとはいっても、表示にはWebBrowserクラスを使っているので、その中でJavaScriptは使えたりする。ただ、AJAXだとJavascriptの実装部分が大きくなってしまうのと、VBのソースコードの中での扱いが面倒になってくるので、まずはとっつきやすいYahooのAPIを触る。

 Yahoo-PipeのAPIはかなり単純なもので、 http://pipes.yahoo.com/poolmmjp/ej_translation_api?_render=rss&text=[翻訳対象] という格好で投げかけると応答がRSSの形式で返されるので、あとはRSSをパーシングすればいい。
 こちらの翻訳精度は、まあ機械翻訳だし、とある程度納得できるもので、twitterのように140字制限の中では機械翻訳程度でもだいぶいいところまでいくのかもしれない。ただ、Yahooの翻訳エンジンは翻訳に失敗すると翻訳語のテキストを何も返さなくなってしまう。省略、圧縮、twitterならではの表現が混ざっていることが原因らしい。

 翻訳に失敗する場合は、前処理でオリジナルの英文を編集してから再翻訳できる実装にした。もしかしたらGoogleならもっと高い精度で、翻訳の失敗もなく応答してくれるのかもしれないけれど、今はとりあえずYahooのAPIで済ましている。正直なところはBingがYahoo並の精度で翻訳してくれるのがいいんだけど、欲しいのは「使える翻訳」であって便利なAPIではないから。

Copyright (C) 2008-2015 Satosh Saitou. All rights reserved.
戻る
■キーワード
日記::一覧展開
2016.06
2016.05
2015.12
2015.11
2015.08
2015.07
2015.06
2015.05
NTPを整備する (2015.05.02)
2015.04
2015.03
2015.02
2015.01
2014.12
PHPでDMC (2014.12.13)
jouornald (2014.12.07)
2014.11
2014.10
2014.09
RaspberryPi B+ (2014.09.06)
2014.08
2014.07
2014.06
2014.05
2014.04
2014.03
2014.02
2014.01
ISCP (2014.01.11)
2013.12
2013.11
2013.10
2013.09
2013.08
2013.07
Fedora19 (2013.07.20)
2013.06
Google Cloud Print (2013.06.30)
wiringPi (2013.06.01)
2013.05
2013.04
2013.03
Fedora18 (2013.03.09)
2013.02
Backupその後 (2013.02.24)
Backup (2013.02.17)
2013.01
2012.12
2012.11
2012.10
2012.09
2012.08
2012.07
2012.06
2012.05
2012.04
2012.03
2012.02
2012.01
2011.12
2011.11
2011.10
2011.09
2011.08
2011.07
2011.06
2011.05
2011.04
2011.03
2011.02
2011.01
2010.12
2010.11
2010.10
2010.09
2010.08
2010.07
2010.06
2010.05
2010.04
2010.03
2010.02
2010.01
2009.12
2009.11
2009.10
2009.09
2009.08
2009.07
2009.06
2009.05
2009.03
2009.02
2009.01
2008.12
2008.11
2008.10
2008.09
2008.08
2008.07
2008.06
2008.05
2008.04
2008.03
音が小さい (2008.03.30)
2008.02
1998.11
作成:2009.07.26
公開:2009.08.15

Valid XHTML 1.1

loading image reserved place