2007年03月31日

Googleさんの技術でアイヌ語訳ができないだろうか

Posted by nene2001 at 11:15 / Tag(Edit): ainu language translate google / 0 Comments: Post / View / 7 TrackBack / Google Maps このエントリーを含むはてなブックマーク

ゆうきまさみさんのブログ経由で知りました。

アイヌの遺産「金成マツノート」の翻訳打ち切りへ -asahi.com-

アイヌ民族の英雄叙事詩・ユーカラが大量に書き残され、貴重な遺産とされる「金成(かんなり)マツノート」の翻訳が打ち切りの危機にある。言語学者の故・金田一京助氏と5月に亡くなった萱野茂氏が約40年間に33話を訳した。さらに49話が残っているが、事業を続けてきた北海道は「一定の成果が出た」として、文化庁などに07年度で終了する意思を伝えている。
  .........
これまでのペースでは、全訳するのに50年程度かかりかねない。文化庁は、「一つの事業がこれだけ続いてきたことは異例」であり、特定の地域だけ特別扱いはできないという。これをうけ、北海道は30年目を迎える07年度で終了する方針を関係団体に伝えた。

この国はダメかもわからんね -ゆうきまさみのスケッチブック-

そこに特別なものがあるなら、特別扱いすればいいじゃないかと思うのだが、それにしても、こういう事業に年間1500万円しか予算でてないとはビックリだ。

金成マツノート問題 -塾講師のつぶやき-

まず「年に数百万」というのがそもそも小さすぎる規模だ。これでは翻訳事業が長くかかるのは仕方がない。そこで、だ。翻訳を済ませるだけであれば、COEだ。どこかの大学が金成マツノートの翻訳を核にしたアイヌ文化研究の総合研究プロジェクトを立ち上げる。そしてCOEを申請する。数百万どころか数千万円の規模で金がおりる。翻訳事業に専念する人員を十数人は当てることができる。

その後はその大学で金成マツ研究所か何かを設立し、アイヌ文化の総合研究を行う。これしかないだろう。

--- コメント欄 ---

年数百万円を28年間と書くと、とても大きな事業をしていたような印象を受けるのですが、たった一人分の人件費程度なんですよ。

テコ入れしなければ失われる民族的文化遺産に対して、年間1人の人件費程度ですか。
すごいですね...例えばアメリカや中国なんかで、日本文化を理解するための研究事業に1人しか割り当ててなかったとしたら、まさに文化庁の人達は(別に文句は言えないですが)屈辱に感じると思うんですが、同じことを自国民である民族に対して行うと。
なんかマジで「スクラップ&スクラップ!」しかないのかなあという気もしてきてしまいますね。
こういう感覚がまかり通るので、保守がかった人達が言う「在日韓国人はダメ、韓国系日本人ならOK」みたいな論理は胡散臭さ爆発になっちゃうんですけどね。
まあそう書きつつ私も別次元から「在日は国籍取得すべき」派なんだけど...。

解決法として、Web2.0時代のネットの住人で、かつ「自称」技術者の立場から見てみると、

アイヌの遺産「金成マツノート」の翻訳打ち切りへ : casual fragments - 徒然的断片 -

そういうわけで、私ならば、金成マツノートを管理している方に許可を得て、その全文を、Web上で公開することを提案する。そうすれば、アイヌ語を今から習得してでも、何年何十年かかろうと翻訳してやるというものが現れるだろう。少なくともこのニュースをブログで扱う人は少なくないのだから、原文に自由にアクセスできさえするのなら、翻訳してみようとする者も出てくるだろう。金を出さないなら、テクストの囲い込みを止めろと。

「お前らがやらないなら俺がやる」――結局はここに行き着くのではないだろうか。

これに共感しました。
まさにCGM時代の解決策ですね。
Wikipedia的に、大勢の叡智と小さな余暇を集めつつ、進めるというのもいいかもしれません。
うちの家内も「多少」アイヌ語読めるので、協力できるかもしれないし(いや、彼女は100%やらんだろうが)。
(そもそもまだテキスト化されていないという可能性もあるけど。ローマ字化されているとはいえ、発音補助記号とかUnicodeで表記可能なのかも判らないし。)

もう一つ思ったのは、技術屋だからこう考えちゃうんですけど、この事業、Googleとかでできないでしょうか。
Googleの機械翻訳エンジンは、言語間の文法変換エンジンをひとつひとつ用意するのではなく、いろいろな言語間の翻訳事例を食べさせて、それで機械的に適切な訳の候補をリコメンドさせるロジックなのだそうだ。
ということは、原理的には日本語とアイヌ語の間でも可能なはず。
自動翻訳できるようにするのにどの程度のテキスト量が必要なのかは知らないし、またユーカラの1話の長さもよく判らないので、33話分で十分なのかは不明です。
が、別に金成マツノートだけが日本語/アイヌ語対照テキストではないだろうし、また別に最初から全部機械でできるとは思っていない、飽くまで人手で最後はやりつつもその補助として活用する、という位置付けなので、別にある程度の結果が出るだけのテキスト量があれば十分ではないかと思います。
それこそ、上で提案されているCGM・Wikipedia的な翻訳ムーブメントの手助けになる程度の性能があれば十分だと思います。
まともな結果が出るかどうかはやってみないと判らないけど、それを試すためにGoogleのDBへ対照テキストを流し込むことはGoogleの中の人にしかできないことなので、協力できないだろうかなあ。
Googleとしても、推進している純粋技術的アプローチが、Web2.0といった先端の分野だけでなく、アカデミックな文化事業にも貢献できる事をアピールできる機会かなと思ったり。
というか、元々Googleは、人類の「智」を再構築しようとしているはずなのだから、うってつけのテーマではないのだろうかと。

んで、Googleを話題に出したんで思ったんだけど、Google対抗とか言って国主導で高い金つぎ込んで誰が使うかも判らない国産検索エンジン作るくらいなら、ちゃんと自国の文化研究に投資しろよと。
Google独占は確かに問題だけど、でも別に他にプレーヤーはYahooもMSNも百度もいるわけなのだから、そんなところに金つける必要ないだろうと。
それくらいなら、今やらないと失われる自国文化にテコ入れしろよと。
それでも金出さないと言うのなら、せめてテキスト公開やGoogleからのオファーがあったりした時は、拒絶せず公開して欲しい。

国が巨額を投じてGoogle対抗!とかいって検索エンジン開発している裏で、国が見捨てた民族の文化事業にGoogleが手を差し伸べる、みたいな構図ができたりしたら面白いなあ。
どっちが政府としての資格があるよ?見たいな感じで、Googleの世界政府化構想に一歩近づくかも。

Related query words in Google & Yahoo
Related Books from Amazon
Trackback to this entry
TrackBack URL :
Trackbacks
アイヌ語翻訳Google云々は無理だ
Excerpt: Googleさんの技術でアイヌ語訳ができないだろうか みたいな...
Weblog: ここギコ!
Tracked: 2007年04月02日 14:03
支えるものの少なくなった文化は、どうすればいいんだろうね
Excerpt: 自分の子供に「お前は"少子化を解決するために"に産んだ」とか言うつもり? -練習...
Weblog: ここギコ!
Tracked: 2007年04月17日 14:02
イヨマンテ禁止撤回 道52年前の通達廃止(04/28 07:08)
Excerpt: イヨマンテ禁止撤回 道52年前の通達廃止 クマの霊を神に送るアイヌ民族の儀式(04/28 07:08) 1990年に胆振管内白老町のアイヌ民族博物館で...
Weblog: アイヌ民族関連報道クリップ
Tracked: 2007年04月30日 23:30
口承伝承ってのは、最古のオープンソースだよな
Excerpt: 思ってたんだけど、昔話やら伝承やら民間芸能やら、口承や口伝で伝えられた...
Weblog: ここギコ!
Tracked: 2007年05月15日 15:06
Google翻訳の結果がすごすぎる件だけど
Excerpt: Googleすげえwwww :F速VIP(・ω・)y- ...
Weblog: ここギコ!
Tracked: 2007年11月15日 12:58
口承伝承 - 人類最古のオープンソースを守っていこう
Excerpt: 8世紀から伝わるクチコミ「ベオウルフ」&俳優とCG問題? - 目指せ!...
Weblog: ここギコ!
Tracked: 2008年09月07日 14:35
「亡びつつある日本の言語」と「日本語」、そして「普遍語」につらつら思うこと
Excerpt: 水村美苗「日本語が亡びるとき」は、すべての日本人がいま読むべき本だと思...
Weblog: ここギコ!
Tracked: 2008年11月10日 22:24
Comments
コメントはありません。
Post a comment












Remember personal info? 
2007年03月
Su Mo Tu We Th Fr Sa
        1 2 3
4 5 6 7 8 9 10
11 12 13 14 15 16 17
18 19 20 21 22 23 24
25 26 27 28 29 30 31

About Me

Navigation

Search
Google
Web
kokogiko.net
Archives
Recent Entries
Recent Comments
Recent Trackbacks
姫路のオモシロ寿司屋(ここギコ!)
0系こだまとひかりレールスターに乗ってきた ドクターイエローも見た
姫路のオモシロ寿司屋(ここギコ!)
位置情報ベース広告AdLocalへ一般からも入札が可能に
「定義できない」とのたまうものを自説根拠の説明の中で延々と使う不誠実(笑)(ここギコ!)
文化は変わっていくのは当たり前だからこそ、今問われているのはリアルタイムの選択
現代アイヌの政治運動は利権獲得のためのようだな。(むにゅう!の平和大好き! はてな基地)
文化は変わっていくのは当たり前だからこそ、今問われているのはリアルタイムの選択
的外れですた恥ずかしい Googleは世界標準の絵文字を作ろうとしてるわけではない、少なくとも、今のところ(ここギコ!)
絵文字標準化でのキャリア批判に思うこと
すごい職場の活性法(これが答えだ)
人員がクラスタ化できている職場と言うのはうらやましい そろそろ限界です
文化は変わっていくのは当たり前だからこそ、今問われているのはリアルタイムの選択(ここギコ!)
大和民族の定義云々について
歴史のダイナミズムの元では右翼こそ変わらなければならない(ここギコ!)
右翼はアイヌや沖縄を包摂する論理を構築すべきではないのか
右翼はアイヌや沖縄を包摂する論理を構築すべきではないのか(ここギコ!)
大和民族の定義云々について
政治と祭祀が不可分と考えるなら、全ての祭祀を引き受けるのが筋(ここギコ!)
大和民族の定義云々について
Hatena bookmarked
My del.icio.us

Banners

Syndication
Powered by
Get it!!