2007年03月31日
Googleさんの技術でアイヌ語訳ができないだろうか
ゆうきまさみさんのブログ経由で知りました。
アイヌの遺産「金成マツノート」の翻訳打ち切りへ -asahi.com-
アイヌ民族の英雄叙事詩・ユーカラが大量に書き残され、貴重な遺産とされる「金成(かんなり)マツノート」の翻訳が打ち切りの危機にある。言語学者の故・金田一京助氏と5月に亡くなった萱野茂氏が約40年間に33話を訳した。さらに49話が残っているが、事業を続けてきた北海道は「一定の成果が出た」として、文化庁などに07年度で終了する意思を伝えている。
.........
これまでのペースでは、全訳するのに50年程度かかりかねない。文化庁は、「一つの事業がこれだけ続いてきたことは異例」であり、特定の地域だけ特別扱いはできないという。これをうけ、北海道は30年目を迎える07年度で終了する方針を関係団体に伝えた。
この国はダメかもわからんね -ゆうきまさみのスケッチブック-
そこに特別なものがあるなら、特別扱いすればいいじゃないかと思うのだが、それにしても、こういう事業に年間1500万円しか予算でてないとはビックリだ。まず「年に数百万」というのがそもそも小さすぎる規模だ。これでは翻訳事業が長くかかるのは仕方がない。そこで、だ。翻訳を済ませるだけであれば、COEだ。どこかの大学が金成マツノートの翻訳を核にしたアイヌ文化研究の総合研究プロジェクトを立ち上げる。そしてCOEを申請する。数百万どころか数千万円の規模で金がおりる。翻訳事業に専念する人員を十数人は当てることができる。
その後はその大学で金成マツ研究所か何かを設立し、アイヌ文化の総合研究を行う。これしかないだろう。
--- コメント欄 ---
年数百万円を28年間と書くと、とても大きな事業をしていたような印象を受けるのですが、たった一人分の人件費程度なんですよ。
テコ入れしなければ失われる民族的文化遺産に対して、年間1人の人件費程度ですか。
すごいですね...例えばアメリカや中国なんかで、日本文化を理解するための研究事業に1人しか割り当ててなかったとしたら、まさに文化庁の人達は(別に文句は言えないですが)屈辱に感じると思うんですが、同じことを自国民である民族に対して行うと。
なんかマジで「スクラップ&スクラップ!」しかないのかなあという気もしてきてしまいますね。
こういう感覚がまかり通るので、保守がかった人達が言う「在日韓国人はダメ、韓国系日本人ならOK」みたいな論理は胡散臭さ爆発になっちゃうんですけどね。
まあそう書きつつ私も別次元から「在日は国籍取得すべき」派なんだけど...。
解決法として、Web2.0時代のネットの住人で、かつ「自称」技術者の立場から見てみると、
アイヌの遺産「金成マツノート」の翻訳打ち切りへ : casual fragments - 徒然的断片 -
そういうわけで、私ならば、金成マツノートを管理している方に許可を得て、その全文を、Web上で公開することを提案する。そうすれば、アイヌ語を今から習得してでも、何年何十年かかろうと翻訳してやるというものが現れるだろう。少なくともこのニュースをブログで扱う人は少なくないのだから、原文に自由にアクセスできさえするのなら、翻訳してみようとする者も出てくるだろう。金を出さないなら、テクストの囲い込みを止めろと。
「お前らがやらないなら俺がやる」――結局はここに行き着くのではないだろうか。
これに共感しました。
まさにCGM時代の解決策ですね。
Wikipedia的に、大勢の叡智と小さな余暇を集めつつ、進めるというのもいいかもしれません。
うちの家内も「多少」アイヌ語読めるので、協力できるかもしれないし(いや、彼女は100%やらんだろうが)。
(そもそもまだテキスト化されていないという可能性もあるけど。ローマ字化されているとはいえ、発音補助記号とかUnicodeで表記可能なのかも判らないし。)
もう一つ思ったのは、技術屋だからこう考えちゃうんですけど、この事業、Googleとかでできないでしょうか。
Googleの機械翻訳エンジンは、言語間の文法変換エンジンをひとつひとつ用意するのではなく、いろいろな言語間の翻訳事例を食べさせて、それで機械的に適切な訳の候補をリコメンドさせるロジックなのだそうだ。
ということは、原理的には日本語とアイヌ語の間でも可能なはず。
自動翻訳できるようにするのにどの程度のテキスト量が必要なのかは知らないし、またユーカラの1話の長さもよく判らないので、33話分で十分なのかは不明です。
が、別に金成マツノートだけが日本語/アイヌ語対照テキストではないだろうし、また別に最初から全部機械でできるとは思っていない、飽くまで人手で最後はやりつつもその補助として活用する、という位置付けなので、別にある程度の結果が出るだけのテキスト量があれば十分ではないかと思います。
それこそ、上で提案されているCGM・Wikipedia的な翻訳ムーブメントの手助けになる程度の性能があれば十分だと思います。
まともな結果が出るかどうかはやってみないと判らないけど、それを試すためにGoogleのDBへ対照テキストを流し込むことはGoogleの中の人にしかできないことなので、協力できないだろうかなあ。
Googleとしても、推進している純粋技術的アプローチが、Web2.0といった先端の分野だけでなく、アカデミックな文化事業にも貢献できる事をアピールできる機会かなと思ったり。
というか、元々Googleは、人類の「智」を再構築しようとしているはずなのだから、うってつけのテーマではないのだろうかと。
んで、Googleを話題に出したんで思ったんだけど、Google対抗とか言って国主導で高い金つぎ込んで誰が使うかも判らない国産検索エンジン作るくらいなら、ちゃんと自国の文化研究に投資しろよと。
Google独占は確かに問題だけど、でも別に他にプレーヤーはYahooもMSNも百度もいるわけなのだから、そんなところに金つける必要ないだろうと。
それくらいなら、今やらないと失われる自国文化にテコ入れしろよと。
それでも金出さないと言うのなら、せめてテキスト公開やGoogleからのオファーがあったりした時は、拒絶せず公開して欲しい。
国が巨額を投じてGoogle対抗!とかいって検索エンジン開発している裏で、国が見捨てた民族の文化事業にGoogleが手を差し伸べる、みたいな構図ができたりしたら面白いなあ。
どっちが政府としての資格があるよ?見たいな感じで、Googleの世界政府化構想に一歩近づくかも。
Excerpt: Googleさんの技術でアイヌ語訳ができないだろうか みたいな...
Weblog: ここギコ!
Tracked: 2007年04月02日 14:03
Excerpt: 自分の子供に「お前は"少子化を解決するために"に産んだ」とか言うつもり? -練習...
Weblog: ここギコ!
Tracked: 2007年04月17日 14:02
Excerpt: イヨマンテ禁止撤回 道52年前の通達廃止 クマの霊を神に送るアイヌ民族の儀式(04/28 07:08) 1990年に胆振管内白老町のアイヌ民族博物館で...
Weblog: アイヌ民族関連報道クリップ
Tracked: 2007年04月30日 23:30
Excerpt: 思ってたんだけど、昔話やら伝承やら民間芸能やら、口承や口伝で伝えられた...
Weblog: ここギコ!
Tracked: 2007年05月15日 15:06
Excerpt: Googleすげえwwww :F速VIP(・ω・)y- ...
Weblog: ここギコ!
Tracked: 2007年11月15日 12:58
Excerpt: 8世紀から伝わるクチコミ「ベオウルフ」&俳優とCG問題? - 目指せ!...
Weblog: ここギコ!
Tracked: 2008年09月07日 14:35
Excerpt: 水村美苗「日本語が亡びるとき」は、すべての日本人がいま読むべき本だと思...
Weblog: ここギコ!
Tracked: 2008年11月10日 22:24
![[ここギコ!]](http://kokogiko.net/logo.png)



・「定義できない」とのたまうものを自説根拠の説明の中で延々と使う不誠実(笑)(むにゅう!)
・絵文字標準化でのキャリア批判に思うこと(kokogiko)
・文化は変わっていくのは当たり前だからこそ、今問われているのはリアルタイムの選択(むにゅう!)
・絵文字標準化でのキャリア批判に思うこと(ひゅ〜)
・絵文字標準化でのキャリア批判に思うこと(kokogiko)
・文化は変わっていくのは当たり前だからこそ、今問われているのはリアルタイムの選択(kokogiko)
・文化は変わっていくのは当たり前だからこそ、今問われているのはリアルタイムの選択(むにゅう!)
・文化は変わっていくのは当たり前だからこそ、今問われているのはリアルタイムの選択(むにゅう!)
・文化は変わっていくのは当たり前だからこそ、今問われているのはリアルタイムの選択(むにゅう!)