英語を書いたり話したりする時の頭の中を考える

昨年の前期の未踏でコーパスのプロジェクトを提案してみて結局は落ちてしまったのですが、

  • 母のためにのろのろ開発していた
  • 「あれどうなったの?」と聞かれた
  • アートもいいけど硬派なプログラムも書きたいぞ

ということで、久しぶりに考えています。アルスの準備しなきゃなのに…。

以下ぞろぞろ書いてみます。

母親が翻訳者で、この名詞を修飾するのはどの形容詞、あの動詞にはこの副詞がいいかしらなどとよくぶつぶつ言っています。

コーパスを使うと、コロケーションについていろいろ知ることができて、いまだと、やや汎用ですがウェブをコーパス的に使えて便利。今年の年初に楽しく読んだ『Google 英文ライティング』もその要領。

Google 英文ライティング: 英語がどんどん書けるようになる本

Google 英文ライティング: 英語がどんどん書けるようになる本

いわゆるコーパスだと、もう少しきめ細かく、品詞で指定できたり、何語以内に出てくる語のランキングなどを出せたりします。名古屋大学の滝沢先生の朝日ウィークリーの連載がよい感じ。著書も出ていて、今読んでいるところです。

コーパスで一目瞭然―品詞別 本物の英語はこう使う! (コーパスの本)

コーパスで一目瞭然―品詞別 本物の英語はこう使う! (コーパスの本)

ウェブ上の文章をコーパスのように品詞を指定したりして検索できたらいいのに、と春先に作ってみたのですが、一昨日までここにいたのに、昨日みたらいなかった・・・(−−)あとでまたデプロイしておきます。どこに行ったんだろう。

もうちょっと便利になるといいなと思って、母と私程度ですが、英文の書き方や話し方を観察しています。

で、日本語英語入り乱れているんじゃないかなというのが今の仮説。最終的にはどっちかになるのだけれど、考えている途中には入り乱れていそう。たとえば、朝学校に来るときに、電線を地中に埋める工事をしているのを見て、これを英語にしたいとします。

I saw 工事? 埋める? wire underground.

みたいな感じで考えます。何ていうんじゃというところが日本語で残っています。

機械翻訳で訳してみると「埋める」が「fill」になっていて、目的語の「電線」を考慮していないことがわかります。これはコーパスで解消できる問題。少なくとも候補提示はできる。なので、英語を書こうとしている環境で、wire と相性のよい動詞の候補がいっぱい出てきたらよいんじゃないかな。例文が列挙されて、出現頻度を見て選ぶくらいは私にもできる。

文の中に「?」と書いてプログラムとお話しながら英文作れたら自然なんじゃなかろうか。Microsoftのチャット英訳ボットはおばかですがインタラクティブなのはいい感じ。昨日見つけました。

http://www.microsofttranslator.com/user/bot/

人と話す時も、「毛抜き」って言えなくて、「How can I say "毛抜き?" in English」みたいな感じで、毛を抜くやつーって話になるし。「毛抜き?」でプログラムに伝わればよし。上等なコンテキストは考慮できていないのですが、プリミティブな解決策としてはこれはこれで役に立ちそう。少なくとも翻訳20数年な母はスーパーコーパスほしそうにしているので(^^;

あと、外国語でうまく言えない時に画像検索して絵を見せるというのも何かに使えないかな。かな漢の絵バージョン?これ2003年、以前学校にいた時から妄想していますが、どうしたらいいかわからない・・・。

ああ、妄想はほどほどにして、今日は記事を書きに行く日。

よい一日を!