人工うなぎ諸語

スワデシュ・リストで翻訳する物語:黒い鳥と犬たちの話

これはなに?

簡単な文法が分かっていて、スワデシュ・リストの語が訳せればどんな言語でも翻訳できるように物語を書きました。

「作り始めの人工言語でなんとかスワデシュ・リストの語彙を造語したけど翻訳する物語が無い・・・」というときなどに使えるかもしれません。使い道が思いついたらご自由にお使いください。

つじつまが合うように頑張ったけど内容はよく分かりません。どなたかもっとハッピーな話を書いてください。

物語(本文)

黒い鳥と犬たちの話

遠くの山に大きい男と小さい男が暮らしていました。大きい男は3匹の犬を飼っていました。小さい男は黒い鳥を飼っていました。彼らは森で生き物たちを狩って、他の人々に生き物の肉や皮を与えていました。寒い日のこと、他の人が大きい男に言いました。「小さい男は悪い人だ。お前の妻を殺してしまった。」
大きい男は思いました。「私が彼を殺してしまおう。」

その日の夜、彼は小さい男と湖に来ました。彼は言いました。「私はお前は悪い人だと聞いた。私がお前を殺してしまおう。」
小さい男は言いました。「私は悪くない。誰がそんなことをお前に言ったのか。」
大きい男は言いました。「私はお前が怖い。私がお前を殺してしまおう。」
彼らは戦い、大きい男が小さい男を押し、小さい男は湖に落ちてしまいました。小さい男は言いました。「お前も悪い人だ。私もお前を殺してしまおう。」
彼は大きい男を引っ張り、湖に落としてしまいました。彼らは湖の中で死んでしまいました。黒い鳥が二人を見ていました。彼は彼らが戦って死んでしまったことを知りました。彼は男の犬たちのところへ飛びました。

山に着くと、3匹の犬が見えました。彼は犬たちに言いました。「男たちが戦って死んでしまった。」
犬は言いました。「私たちを飼っていた男は良い人だ。お前は間違っている。悪いのはお前を飼っていた男だ。」
そして、犬たちは鳥の翼に噛みつきました。鳥は彼らを怖がり、空に飛んでいきました。

鳥は言いました。「彼らは私を殺してしまうだろう。私はどうやって彼らと戦おうか。」
そうして木の上で眠りました。

昼、鳥が空を飛んでいると、犬たちが道を歩いているのが見えました。
犬は鳥を見て言いました。「こっちにこい!お前の頭を噛んでやろう。」
鳥は言いました。「いや、山で生き物を食べよう。土のなかで小さな生き物がたくさん眠っている。」
鳥と犬たちは山へ歩いていきました。

山に着くと鳥は言いました。「この土を掘れ。」
犬は土を掘りました。すると、鳥は大きな石を押し、一匹の犬が石に当たって死んでしまいました。他の犬たちは言いました。「お前は悪い鳥だ!こっちへ来い!お前の尾を噛んでやろう。」
「いや、川に行こう。お前たちの足が土で汚れている。」

川に着くと、犬は水で足を洗いました。鳥は言いました。「お前の腹も汚れている。」
犬は水で腹を洗いました。鳥は言いました。「お前の背中も汚れている。」
犬たちは言いました。「背中を洗ったら私は流されてしまう。」
鳥は言いました。「お前の足を縄で木の枝に結んで、流されないようにしてやろう。」
一匹の犬の足を結ぶと、犬は川で背中を洗いました。すると鳥は枝を折って、犬は流されていってしまいました。他の犬は言いました。「お前は悪い鳥だ!こっちにこい!お前の足を噛んでやろう。」
鳥は言いました。「いや、お前の脚が濡れている。木が燃えていて暖かいからあそこへ行こう。」
犬と鳥は木へ歩いていきました。

鳥は言いました。「お前の脚が乾いていない。燃えている木の近くで歌って遊ぼう。」
鳥と犬は木のまわりを回って歌って遊びました。犬は言いました。「私の脚はもう乾いている。私はここで眠ろう。」
犬が眠ると、鳥は燃えている木を押し倒しました。犬は燃えて死んでしまいました。鳥も足が燃え、尾が燃え、翼が燃えて死んでしまいました。そうして生き物は全員死んでしまいました。

蛇足(補足など)

この話は、筆者が新しく言語を創作しはじめ、文法を決め、スワデシュ・リストを埋め、さあなにか物語でも翻訳しようかと思ったけどこの語彙だけでは訳せそうなものが無く、「もう造語するの飽きた!!」と思って書いた物語です。

統語論もある程度できあがっていることを想定していますが、複雑な文は単文に分ければどうとでもなるはず。

ご自身の人工言語の使い心地(?)を試したい、という方はご自由に再利用してください。

内容は、なんとかつじつまの合う文を組み合わせただけなのでよく分かりません。けどなんかこういうの民話とかにありそうじゃないですか?知らないけど……

内容が物騒なのは、限られた語彙の中で良い感じにオチをつけるのが難しかったからです。話の展開を作れそうな動詞が致命的な他動詞ばかりだったのでこんなふうになってしまいました。もっと穏やかな物語が書けないか考えています。もし思いついたら皆さんで書いて共有してくださるとうれしいです。

というか、ふつうに限られた語彙で物語を作るのは結構楽しいです。みなさんもスワデシュ・リストの語彙を使って自分だけの最強の物語を作ろう!

JOL2021-2 ツツバ語の数詞解説

日本言語学オリンピック2021の第2問、ツツバ語の数の問題の解説記事です。

JOL2021ははじめてオンライン形式で開催されました。当日配布された問題用紙では言語名が伏せられていたり表記が置き換えられたりしています。この記事では後に公開された スペシャルエディション をもとに解説をします。

どんな問題?

ツツバ語の数の表現とそれらが表す数がバラバラな順番で与えられています。これらを対応させながらツツバ語の数の表現の仕組みを明らかにし、問題ア、イに解答します。
問題アでは、1-12がデータ(a)-(j)から推論されるツツバ語の数の表現の規則に沿っているかどうか、沿っているならばそれがどんな数を表しているかを解答します。問題イでは与えられた4つの数をツツバ語に翻訳します。

解き方

解答するためには以下の4つのポイントを押さえることが重要です。

  1. 数の表現がどのような要素から成っているか
  2. 数の表現がどのような構造を持っているか
  3. それぞれの要素がどんな役割(意味)を持っているか
  4. この言語の数体系の底(何進法を採用しているか)

4番の底の決定は数の問題に特徴的です。10進法がもっとも一般的ですが、20進法を用いる言語も多くあります。*1IOLでは12進法や6進法の言語が出題されたこともあります。
底は日本語の ‘いち’ ‘に’ … ‘きゅう’ のような、その言語の数体系で1桁になる数(ゼロを除く)を表す要素がいくつ見つかるかを手がかりにアタリを付けておくと楽です。そのような要素をここでは基本数と呼びます。一般的にn進法の数体系ではn-1個の基本数があります。

データの分節

まずは与えられた数の表現をいくつかの要素に分けていきます。この解説ではスペースで区切られた部分を語と呼びます。i の3語目 ŋavuleb̼ituna には a の eb̼itu が含まれているので ŋavul-eb̼itu-na のように分けられます。h の二語目の vaab̼ituna を根拠に ŋavul-e-b̼itu-na とすることもできます。このようにして十数個の要素を取り出すことができます。

構造の分析

データを切り分けたら、基本数と位を表す部分がどこか考えながら構造を分析します。構造の分析はさらに 1. 語の内部の構造 2. 語の並べ方 というふたつの側面に分かれます。まずは 1. 語の内部の構造 を調べます。

語の構造は概ね4パターンあるようです。

  1. . e- で始まるもの
  2. . ŋavul- で始まるもの
  3. . vaa- で始まるもの
  4. . ŋalsaŋavul で始まるもの

  5. oalu は例外っぽいのでおいておきます。

構造はパターンごとにこんな感じになっています。

e- itu
sua
oalu
lima
ono
rua
tol
ati
tea?
ŋavul- e- (-na)
vaa-
ŋalsaŋavul

itu や sua などの9つは ŋavul(-e) や vaa- のあと、e- のあとに現れるという共通点を持っていることから、似た機能を持っていると推測できます。数も多く、これらが基本数だと考えるのが自然です。基本数が少なくとも9つあるので、底は10以上だと分かります。 vaa- と ŋavul- は ‘にひゃくよんじゅう’ の太字部のように位を示す部分でしょう。どの言語でも大きい位から順番に並べられる傾向があるため、vaa- は底の二乗の位、ŋavul- は底の一乗の位だと予想します。
パターン1は最も単純な構造であるため一桁の数を表していると分かります。語末に -na が付くことはありません。パターン2は語末に -na が付くことがあるようです。f のŋavuloalu にのみ e- が無いこと、d の oalu のみ他のパターンに合っていないことから、e- は oalu の前には付かず、oalu はパターン1に属すものだと判断できます。パターン3は概ねパターン2と同じですが、vaa- の後にはe- は常に現れません*2

これまでの情報から、問題アの12、 16が適切な表現でないと分かります。 語の内部の構造が分かったのでそれがどのように配列されているかを見ます。こちらはまだ分からない部分が多いので特徴をさらう程度にとどめます。

  • パターン3 (vaa-) → パターン2 (navul-) → パターン1 (基本数) の順に現れる
  • おなじパターンがふたつ並ぶことがある
  • ŋalsaŋavul はパターン3やパターン2の部分に現れる

対応

ここまでツツバ語の数の表現がどのような要素から成り立っているか、それがどのように並べられているかを見てきました。ここからは与えられたデータをヒントにそれぞれの要素がどんな機能・意味を持っているかを明らかにしながら a-j を対応させます。
上述のとおり a) eb̼itu、 b) esua はもっとも単純なパターンなので基本数の7、 9のどちらかに対応していると考えられます。vaa- は ŋavul- よりも大きい位を表していると予想されるため、a、b の次に大きいのは vaa- を含まない e) ŋavulerua ŋavuletolna eono、 f) ŋavuloalu ŋavulesuana esua で、26か89だと予想できます。

底の特定

残りの対応を明らかにするためには底が分からなければなりません。底を特定する方法はいくつかあり、ひとつめは基本数から底を推測し、 7、 9、 26、...、800 を底で割ったあまりとツツバ語のデータa-j の1の位を比較して確かめる方法です。ツツバ語がn進法を採用しているとすると、7、9、26、...、800 を n で割ればツツバ語での一の位の数がわかります。この頻度の分布がツツバ語のデータ a-j の一の位の頻度の分布と一致していればツツバ語がn進法を採用している可能性があります。基本数が9個あることが分かっているので、まずは底が10の場合を試してみます。a-jの1の位の頻度は以下のようになっています。

1の位 出現回数
eb̼itu 2
esua 2
無し 2
oalu 1
eono 1
etea 1
elima 1

対して、7、 9、 26、...、800を10で割った時のあまりは以下のようになります。

あまり 出現回数
0 2
7 2
9 2
1 1
5 1
6 1
8 1

どちらも二回出現しているものが3つあるため、10進法は十分ありそうです。よくある数体系ですし、10で割り切れている場合が二つあるのもポイントが高いです(0は表現されないことが多く、どれがどれかわからない1~9とは異なるので)。11以上の数を試しても良いですが、時間がかかるのでほどほどにしましょう1
もう一つの方法は f と b の差が底の倍数としてふさわしくなるような f と b の値を探すという方法です。b と f は1の位が共通しているため、fと b の差、すなわち ŋavuloalu ŋavulesuana esua − esua は底となんらかの整数の積になっているはずです。b = 7 の場合と b = 9 の場合、f = 26 の場合と f = 89 の場合の 2×2 = 4 通りの差を取ってみます。

b = 7 b = 9
f = 26 26 − 7 = 19 26 − 9 = 17
f = 89 89 − 7 = 82 89 − 9 = 80

f - b は底の倍数なので、f = 26 のときは底ともう片方の整数の組み合わせは (1, 19), (1, 17) のどれかだということになります。底が1、17、19になることは考えづらいので f = 89 だと分かります。
f = 89 かつ b = 7 のときは (1, 82), (2, 41) がありえますが、いずれもなさそうです。f = 89 かつ b = 9 のときは (1, 80), (2, 40), (4, 20), (5, 16), (8, 10) があります。基本数の数から底は10, 16, 20, 40, 80に絞れます。一つ目の方法にならってあまりの分布が一致するか確認すると底は10だとわかります。
今回はたまたま一つ目の方法が上手くはまったので二つ目の方法のほうが面倒ですが、二つ目のほうが安心感があるかもしれません。二つ目の方法は底を特定する以外の場面でも役に立ちます。

さて、これでツツバ語の数体系は10進法を採用しているらしいことが分かりました。一つ目の方法を使ったときも、f と b の差が10の倍数になる組み合わせは b = 9f = 89 しかありません。消去法によりa = 7e = 26がわかります。同時に基本数の b̼itu = 7、 sua = 9、 ono = 6 も分かりました。1の位に eb̼itu が入っている i) vaatol vaav̼atna ŋavuleono ŋavuleb̼ituna eb̼itu = 367でしょう。 底が10と分かったことで、ŋavul- の位が10の倍数、vaa- の位が100の倍数であることが予想できます。c) vaaoalu は800、oalu = 8 だと推測します。そうであれば d) vaalima vaaonona oalu = 508 でしょう。

ここまでで分かったことを整理します。

数の表現の対応
a) eb̼itu = 7
b) esua = 9
c) vaaoalu = 800
d) vaalima vaaonona oalu = 508
e) ŋavulerua ŋavuletolna eono = 26
f) ŋavuloalu ŋavulesuana esua = 89
g) ŋalsaŋavul vaaruana ŋavleb̼itu = ?
h) vaaono vaab̼ituna navuletol ŋavulev̼atina etea = ?
i) vaatol vaav̼atina navuleono ŋavuleb̼ituna eb̼itu = 367
j) vaarua vaatolna ŋavulesua ŋalsaŋavulna elima = ?


残りの候補: 170、 295、 631

基本数
6: |ono
7: |b̼itu
8: |oalu
9: |sua

ここで f、 i の10の位(ŋavul- の付いた部分)に注目します。

f) ŋavul-oalu  ŋavul-e-sua-na e-sua
   10-8 10-e-9-na   e-9
   ‘89’

i) vaa-tol  vaa-v̼ati-na   ŋavul-e-ono    ŋavul-e-b̼itu-na  e-b̼itu
   100-?    100-?-na    10-e-6      10-e-7-na       e-7
   ‘367’

両方とも -na の無い部分では10の位の数が、-na の付いた部分では10の位の数より1大きい数が入っています。d) vaalima vaaonona oalu = 508 で vaalima のあとに vaaonona が入っていることから lima = 5 であると推測します。j = 295とするといい感じになります。h の100の位が vaaono vaab̼ituna なので h = 631、消去法で g = 170と分かります。また、c、 gなどから、より下の位に数が無いときは -na の部分が現れないことがわかります。
全ての対応が完了したところで、ŋalsaŋavul が何を表しているか考えてみましょう。g では vaaruana = 200 の直前、jでは ŋavulesua = 90 の直後に現れていることから、ŋalsaŋavul = 100だと分かります。逆に、100を表すときには *vaatea ではなく ŋalsaŋavul を用います。

数の表現の対応
a) eb̼itu = 7
b) esua = 9
c) vaaoalu = 800
d) vaalima vaaonona oalu = 508
e) ŋavulerua ŋavuletolna eono = 26
f) ŋavuloalu ŋavulesuana esua = 89
g) ŋalsaŋavul vaaruana ŋavleb̼itu = 170
h) vaaono vaab̼ituna navuletol ŋavulev̼atina etea = 631
i) vaatol vaav̼atina navuleono ŋavuleb̼ituna eb̼itu = 367
j) vaarua vaatolna ŋavulesua ŋalsaŋavulna elima = 295
基本数
1: |tea
2: |rua
3: |tol
4: |v̼ati
5: |lima
6: |ono
7: |b̼itu
8: |oalu
9: |sua

解答

こたえは公式の解答にのっているので省略します。
(ア)の19にミスがあり、「正 ŋalsaŋavul...」となるべきところが「正 etea...」になっていました。今は修正されています。


  1. 11から50までは分布が一致するのは21と26のみで、どちらも割り切れているものは2つありません(たぶん)

*1:https://wals.info/chapter/131

*2:e- は独立した要素ではなく基本数の一部で、vaa- の後と oalu の前で消えるとも分析できます。

国際言語学オリンピックのようすがわかる動画置き場

おひさしぶりです。書くたびおひさしぶりになっています。

この間国際言語学オリンピック(IOL)の動画を拾い集めてくる機会があり、せっかくなので公開しておきます。

あんまりIOLの雰囲気がどんな感じか知られてなさそうなのでちょうどよさそう。参考になれば嬉しいです。

見逃してるっぽい動画とかチャンネルがあったら教えていただけると助かります。

2019年韓国・ヨンイン大会

韓国のヨンインで行われた大会の様子です。いいかんじにまとまっています。なつかしい。
良い感じなんだけどここに埋め込むと最初の一秒くらいしか音声が流れないので公式Facebookから見てください。

2017年アイルランド・ダブリン大会

良い感じの動画です。3分で現地でのイベントを網羅してるっぽいです。
端々から陽っぽさを感じる……

こっちはRTÉ(アイルランド放送協会)のニュースっぽいです。ダブリン大会が取り上げられています。インタビューとかが多めで言オリの紹介がちゃんとされてます。英語だけど

2015年ブルガリア・ブラゴエヴグラト大会

IOL2015の公式YouTubeチャンネルらしきものにたくさんのっています。

その中ではこれが一番まとまっています。オープニングのBGMがすごい。
火を回すやつのパフォーマンスとか花火とかもあってすごい。
excursionがめちゃくちゃ楽しそう。

ちゃんと団体戦の様子とかも載っています。

2014年中国・北京大会

中国です。遠足タイムが長めの動画。万里の長城に遠足に行ったのか……。というかチャンネル名がMatholympOrgなのなんで?

2011年アメリカ・ピッツバーグ大会

IOL2011の公式Facebookらしきものにインタビューとか開会式とかがたくさん上がっています。

開会式の様子。2019の半分くらいしか参加者がいなそうでIOLの成長を感じます。


こんなかんじでした。ここに無い年度の動画とかをご存じでしたら教えていただけると助かります。

言オリ風自作問題2 インドネシア語の語対応

APLO直前なので応援のために語対応の問題を作りました(?) たぶんJOLの簡単な問題って感じだと思います。

インドネシア語の語対応

前回の問題はてなブログに直接書いたんですがポロロッカという問題投稿サイトが優秀だったのでこっちに投稿しています。こっちで解くのがおすすめです。

ヒントが付けられたり、自動でジャッジしてくれたりします。すごい。

問題

一応ここにも問題を載せておきます。

でも自動ジャッジしてくれるのでポロロッカで解くのがおすすめです。

解答も載せたけどちょっとずつヒント見られたりするのでポロロッカで解くのがおすすめです。

以下にインドネシア語の語句が12個与えられている。

  1. air mata
  2. air putih
  3. batu
  4. batu merah
  5. bulu mata
  6. hari merah
  7. hari pertama
  8. matahari
  9. Merah Putih
  10. nasi goreng
  11. nasi putih
  12. rumah pertama

以下にその意味がランダムな順番で並んでいる。

焼き飯, 石, 太陽, 涙, インドネシア国旗, 白米, 休日, まつげ, 最初の日, 最初の家, 赤い石, 真水

(a) どれがどれに対応するか示しなさい。

(b) 次の語句をインドネシア語に訳しなさい

  1. 赤い目
  2. 石造りの家
  3. 玄米

インドネシア語オーストロネシア語族のマレー・ポリネシア語群に属する。 インドネシア国旗は上半分が赤、下半分が白の旗である。

解答・解説

解説も載せておきます。ほぼコピペです

言語学オリンピックでよく出題される「語対応」などと呼ばれるパターンの問題です。

(a)

  1. 涙(目の水)
  2. 真水(白い水)
  3. 赤い石
  4. まつげ(「目の毛」cf. ま「目」+つ「~の」+げ「毛」)
  5. 休日(「赤い日」、カレンダーの色から?)
  6. 最初の日
  7. 最初の家
  8. 太陽(「日の目」)
  9. インドネシア国旗(「赤白」)
  10. 焼き飯(焼いた米)
  11. 白米(白い米)

(b)

  1. hari
  2. air
  3. mata merah
  4. rumah batu
  5. nasi merah(「赤い米」。nasi merahで検索すると赤い玄米の写真が見つかる)

アドバイス

  • 注を見ましょう。 大事。インドネシア国旗=「赤白」は注が無いと厳しそう。

  • (b)の「日」「水」「赤い目」は、与えられているデータの中に「日」「水」「目」という語が含まれていることを示唆しており、「涙」を「目の水」と分解するためのヒントにもなります。

  • 「石」のような基本的な単語は一語だろうと予想して手掛かりにできると強い。

  • 頻度解析は時間がかかるので行き詰まって手が動かなくなったときにやると良い?

解き方の手順(参考)

雑手順説明です

batu=「石」と仮定すると、batu merah=「赤い石」と分かり、さらに語順が主要部+付加部だと分かる。

hari merahとMerah Putihがmerahを含んでいるが、Merah Putihのほうが固有名詞っぽいし、他に「赤」が主要部になりそうな選択肢がないためputih=白とわかる。

nasi putih、air putihのどちらかが「白米」だが、air putihが「白米」だとするとair mata=「焼き飯」、mata=「焼き?」となるが、「焼き」を含みそうな選択肢は3つもありそうに思えない。 nasi putih=「白米」とするとgoreng=「焼き」、nasi=米となる。

ここで残りの選択肢について頻度解析をすると、

air 2 0
mata 1 2
putih 0 1
bulu 1 0
hari 2 1
merah 0 1
pertama 0 2
rumah 1 0

涙=目+水

真水=真+水 ((b)を見ると「水」があるため、「真水」は二語であると予想できる)

まつげ=目+毛

休日=休み?+日

最初の日=最初+日

太陽=?+日

最初の家=最初+家

とすると、

被修飾語 修飾語
0 2
2 0
0 1
1 0
休み 0 1
3 0
最初 0 2
1 0

頻度を見るとair、hariのどちらかが「水」、「日」っぽく、mata、pertamaが「目」「最初の」のどちらかっぽく、bulu、rumahが「毛」「家」のどちらかっぽい。

まずair putihとhari merahが解釈できるようにする。air=「日」、hari=「水」と仮定するとhari merah=「赤い水」となりよくわからない。日と水を逆にしてair putih=「白い水」ならまだ「真水」っぽいのでこっちにしておく。

mata=「最初の」、pertama=「目」とすると、air mata=「最初の水」がよく分からない。逆にすると、air mata=「目の水(=涙)」hari pertama=「最初の日」となり都合が良い。

matahariはmata+hariとなっており、文字通りには「日の目」となるが、まあ目は丸いし、「太陽」なら一単語っぽさもある。

残りもbulu mata=まつげ、rumah pertama=「最初の家」だとわかる。

おわり

みなさんも自作言オリ風問題作りましょう!

APLOの人々は頑張ってください!

自作言語学オリンピック風問題:バク文字

おひさしぶりです。
バク文字という文字を作ったのでついでに言語学オリンピック風の問題も作りました。Twitterで上げたものに少し修正を加えてあります。
初めに問題を示して、解き方を順に説明しながらそのあとに解答を出すのでもし行き詰まったらこの記事を少しずつ読みながら解いてみてください。最後に問題でわからない部分の説明もするので暇だったら読んでください。

2020/05/06 追記:解説と解答を一部修正しました。

問題

以下にバク文字と発音表記で書かれた単語がある。

f:id:karngati:20200418112841p:plain

問題a 9~12の空欄に当てはまる発音表記を書きなさい。いくつか候補が考えられる場合はそのうちひとつを示しなさい。
問題b 13~16の単語をバク文字で書きなさい。
問題c バク文字の表記規則を説明しなさい。

バク文字は架空の文字体系であり、ここに示された単語と発音は架空の言語のものである。以下に発音記号の注釈を加える。
<ɨ>はのスの母音。<:>は直前の母音が長いことを表す。<ŋ>ははんこのンの音、またはsingのngの音。<ʁ>(Rを上下反転した記号)は有声口蓋垂摩擦音で、フランス語のパリのrの音。

問題概観

言オリにまあまあよくでる文字の問題です。過去記事でも解説しています。
難易度は国際大会の易~標準くらい?
JOL予選突破を目指すなら80分~90分で解き終えたら十分そう?自分では解けないのでよくわかりません……

解説

自分ではこの文字を完全に知っているので逆に解説が難しいんですががんばって解説してみます。分からないところがあったら聞いてください。

まず一目で横書きであることが推測できます。どうやら母音の種類が少ないようなのでこれから手を付けましょう。
4. aʁa:mpat、1. kaatɨなどから発音表記aがバク文字ʌに対応すると 分かります。
同様に3.gɨkkele:kなどからeを、7.mo:mvɨŋkoを手掛かりにoを特定できます。ɨはとりあえず置いておいて、ここで子音に移りましょう。

1.kalŋatɨ、2.soŋka:lve:などからkに対応するバク文字がわかります。3の発音表記にもkがありますが数が足りないのでもしかすると特定の条件でkが書かれない、または違う文字であらわされるかもしれません。
同様に、lやpなどバク文字で複数回でてきていて分かりやすいやつから特定していきます。

このようにして、発音表記で母音の直前にある(=音節頭の)子音を表す文字をすべて特定することができます。
では母音の長短や音節末の子音はどのように表記されるのでしょうか。あるいは全く書かれないのでしょうか。

ここからまだ役割が特定できていない文字について見ていきます。
いまのところ

  1. :みたいなやつ
  2. sの上側が長く伸びてるやつ
  3. 上につく線
  4. 下につく線
  5. ʃを左右反転させたやつ

の六つの記号が残っています。これらを順番に見てその役割を決定していきます。

まず記号1です。これが現れるところをすべて確かめます。

番号 発音表記
1 ŋa
1
3 ke
4 a
5 to
7 ko

すべてが短母音で、しかも終わりに子音がついていません。
つぎに記号2です。同様に見ると、これらはすべて音節末に鼻音またはlがついています。記号3も同様ですが、記号2は短母音、記号3は長母音です。
同様に記号4と記号5は音節末が-p/t/kで、それぞれ長母音と短母音です。
これをまとめると以下のようになります。

  長母音 短母音
末子音なし 記号なし 記号1
-m/n/ŋ/l 記号2 記号3
-p/t/k 記号5 記号4

音節末の-m/n/ŋ、-p/t/kは語末以外では次の子音に逆行同化していますね。逆に語末ではどれも表記上は区別できません。そういうこともあります。

残った記号6は音節の頭に子音がないことを表しているようです。

ここまですすめばもうわかっているでしょうが、ɨは母音字をなにも書かないことで示されているようですね。

これでバク文字の解読は終了です。

解答

問題a
9. kɨkkɨ:vɨ:(m/n/ŋ/l)
10. va:(m/l)mode:
11. sa(ŋ/l)ŋɨla:(p/t/k)
12. o:ppema:

問題b

f:id:karngati:20200418135409j:plain

問題c

  • 文字は音節ごとに左から右へ横書きする。
  • 音節の初めの子音を書く。初めに子音が無ければ<o>を書く。
  • 母音の長さ、音節末の子音の種類に合った記号をつける(画像参照)
  • その右に母音を書く。母音がɨならば何も書かない。

その他
音節末の子音はその次の音節のはじめの子音にあわせて調音点が変化する。(これは問題cに書いても良いですが必須ではありません(表記の規則ではないので))

f:id:karngati:20200418152906j:plain

言オリだったらたぶんバク文字の子音字と発音の対応をを全部書いたりする必要はありません。書いても減点されることは無いと思います。

おわり

バク文字は音節構造を直接表記する文字体系を作ろうと思い立って作りました。こういう文字体系って実在するんですかね?もし何かご存じでしたら教えてほしいです。
使い捨てにするにはもったいないので多少改良して既存の自作架空言語とかに使っていきたいですね。

問題に出てきた単語は問題として解けるように捏造したものです。無い言語だとこういうことができるので作問がしやすくてうれしいですね。みなさんもどんどん文字や言語を自作して言オリ風問題を作りましょう!!

ちなみに、Twitterには#ロゼッタゲームというタグがあり、こういう問題がたくさんツイートされています。ここにある問題も解いてみて、もし問題を作ったらこのタグで公開しましょう!え、このタグできたのもう3年前なの……時代……

JOL2020-2 ツングース諸語の音対応の解説

お久しぶりです。
この記事は2020年日本言語学オリンピックの第二問、エウェンキ語・オロチ語・ナーナイ語の音対応の問題の解説記事です。
解説なので自分で解いてみてから読んだり解きながら行き詰まったら読んだりしてください。
誤りや質問などがあればコメントかTwitterへお願いします。
問題はこちらからどうぞ。

問題について

ツングース諸語の3言語(問題に従って以下それぞれEk、Oc、Naと略します)から音対応を示す語の組が16組与えられています。
これらのデータから音対応のパターンを見つけて、それに当てはまるような選択肢を選びます。

この問題のように複数の言語の比較をする問題はどちらかというと珍しい気がします。

音対応は標準語の o, e に対する沖縄方言の u, i のような複数の言語の間での規則的な音の対応関係のことです。

難易度

国内予選としてはやや簡単?
できれば早めに解いてほかの問題に時間を割きたい

使う情報

  • 与えられた16組の語
  • 空欄[11]~[20]の選択肢

選択肢や問題も重要な手掛かりになります!

方針

  1. 音対応のパターンを見つける
  2. このパターンを適用しながら選択肢を絞る

1は音対応を扱う問題では不可欠な作業です。
またこの解説では1が終わってから2へ進んでいますが、パターンがわかり次第選択肢を削るやり方が効率的だと思います。

表記について

ところで、与えられているデータの中に、abc...といったラテン文字のほかにə ŋ ʥのような文字があります。
言オリではしばしばこのような文字が使われ、大抵は注釈がつきますが、今回のように一切注がなかったり必要最小限の情報しか与えられないことがあります。
このような文字は国際音声記号IPA*1での使い方に基づいていることが多く、IPAでこの文字がどのような音を表すか知っていると問題を解きやすくなることがあります。ə、ŋ、ʥはそれぞれIPAでは中舌中央母音「ハンガー」のンの音「ジャッジ」のジの子音を表します。
また、調音方法や調音点などの基本的な音声学の知識は、直接問われることは少ないにせよ様々な問題に役立ちます。
これらについては入門書がたくさん出版されていますし、もし余裕があれば一度触れておくことをおすすめします。

解説

どこから手を付ければよいかわからないときはまず分析の対象を絞りましょう。ここではとりあえず母音の対応を見ます。
三つの言語のn番目の母音同士のすべての組み合わせ(6パターン)を挙げました。実際に解くときもまずは全パターン列挙しています。

Ek Oc Na
a a a 八、犬、口、いくつ、娘
o o o 泣く、銛、魚皮、忘れる
i i i
i i u いくつ、重い
u u u 八、跳ぶ、唇、
ə ə ə 唇、風、胸

空欄[11]など、どの選択肢でも母音が共通している場合はデータとして利用できます。 わからない母音の対応は以下です。

Ek Oc Na
u o/u u 跳ぶ
u u/i u
i u/i u 風、娘
u/i i u

この四つの空欄も上の六つのパターンのいずれかに当てはまるはずです。 これで選択肢[12]c、[15]ad、[19]ab、[20]bdを削除することができます。


一通りデータに目を通したところで「犬」を意味する語が他とは少し違う対応をしていることに気づいたかもしれません。

Ek Oc Na
ŋinakin inaki inda

これはEkとOcにおいては本来「犬」を意味していた部分のうしろに-kin、-kiという他の要素(指小辞のような)がくっついた形が新しく一語として定着したからだと想像できます(日本語における 子+ども のように)。Naのindaに対応するのはEkのŋina-、Ocのina-の部分だとすると納得がいきそうです。


次は子音です。まずは語頭の子音から比較します。3言語すべて共通している場合を除くと以下の3つが挙げられます。

Ek Oc Na
x いくつ、重い
x x p 足跡
ŋ

ここでは"∅"は「子音が無い」という意味です。
空欄の語もこのパターンに従うはずなので、[12]、[14]、[15]、[20]の選択肢が絞れます。
次に語末の子音の比較です。データにはnしかでてきていませんね。

Ek Oc Na
n n n
n -

「犬」では-kinと-kiを比較しているのでNaのデータはありません。あまり決定的な発見ができませんでしたが、EkにnがあってOcにはないというようなパターンがありうることがわかりました。

次に語中の子音です。解答において重要な子音連続を含むもののみを挙げます。

Ek Oc Na
n n nd
n ? nd
? ŋ ŋg
ŋ ? ŋg 泣く
? ŋb 忘れる
mm ŋm
bg bb gb
? bb gb 魚皮
? pp kp
rg gg jg 重い
rg gg ? 太った
rk kk (jk) 跳ぶ

これらのパターンは、ナーナイ語の子音連続を AB とすると次のように分類できそうです。ただし「忘れる」は例外的なのでまだ含めていません。

  1. A : A : AB(犬~泣く)
  2. BA : BB : AB(口~八)
  3. rB : BB : jB(重い~跳ぶ)
  4. kt : kt : kt (足跡)

ここで個々の選択肢を検討していきます。

[11] 語中子音からc
[12] 語頭が x : x :p となるb。語中も適切
[13] 語中子音から c
[14] 語頭子音からbdのいずれか、m : mm : mのような語中子音のパターンはないのでd
[15] 語頭子音からc
[16] 語中子音が jgとなっているd
[17] 語中子音からa
[18] 保留 (aとcではなさそう?)
[19] 語中子音と i : i : u の対応からc
[20] 語頭子音からaもしくはd、dは語末のtがおかしいのでa

音対応のパターンをかなりきっちり挙げたのでかなり簡単に選べました。

ここで[18]が残りました。[18]の選択肢は mŋ : gb/ŋŋ/bŋ/mm : ŋbです。手がかりがないようですが、解答が出せるとするとやはり[18]も上で見た語中子音連続のパターンのどれかに当てはまっているはずです。
これを自信を持って決定するにはおそらく音声学もしくは音韻論の基礎的な知識が必要です。上のパターンはA, Bの調音点、調音法によって一般化できます。1ではAが鼻音でBはAと同器官的な破裂音、2はAが両唇音でBは軟口蓋音、3はBが軟口蓋破裂音です(早口)。
このようにとらえると、[18]は2番目のパターンに似ていることがわかります。このパターンではOcは必ずBの両唇音が重なるので、d. ommo-であると予想できます。
このことに気が付かなかったとしても、Ocで違う子音が連続している例は「足跡」しかないので二択にまでは絞れるかもしれません。

まとめ

  • 音韻対応の問題ではパターンを書き出す
  • 母音/子音、語頭/語中/語末のように分けて調べる

類題

IOL2007-5 : トルコ語タタール語の比較です。今回の問題よりやや難。

関連記事

fulfom.hatenablog.com

zohe.hatenablog.com

*1:IPA Phoneticsというアプリがあり、記号当てゲームなどができて楽しいのでおすすめ

JOL2018第5問 キリル文字・モンゴル文字・チベット文字の解説

 

ブログ始めました。最初は2018年の言語学オリンピック日本予選(iolingjapan2018.pdf - Google ドライブ)から第5問のキリル文字モンゴル文字チベット文字の問題の解説です。

ミスや分かりづらいところがあったら指摘してもらえると嬉しいです。

 

公式サイトの大会成績によると平均点は20点満点の12.39点だそう。

 

前提知識

  • ある文字で区別されているものが他でも区別されているとは限らない
  • 子音と母音を独立して書くローマ字のような文字体系のほかにも、子音だけを記したり、子音に記号をつけて母音を表したりするものなどがある
  • 語の始め、中、終わりで字形が変わる文字もある

などを知っていることが望ましいです。

キリル文字などの知識が有れば役に立ちますが、必ずしも必要ではないためここでは個別の文字の知識はないということにして解き進めます。

 

解説

方針

この問題の目標は、選択肢を絞れるようにキリル文字モンゴル文字キリル文字チベット文字それぞれの対応関係を明らかにすることです。

  • 確実なデータから対応を特定する
  • 対応させられたら色を塗る

でやっていきます。色ペンは本番でも使えますし他の問題でも役立つので大量に持っていきましょう。

ふつう文字の問題では書き進める方向を考えなければなりませんが、今回は事前知識が無ければ右も左も分からないのでとりあえず左から右、上から下だと仮定しておいて行き詰まったら仮説を立て直すことにしましょう。


ここでは便宜上各選択肢をこう呼ぶことにします。

f:id:karngati:20191202153907j:image

 

 
モンゴル文字

まずはモンゴル文字から始めます。一目で縦書きらしいのが分かります。とりあえず一番目立っている金曜日の一番上の文字を青で示します。上の仮定に従うとキリル文字のбに対応しそうなのでこれも青で塗りました。少し怪しいですが3番もマークしておきます。

f:id:karngati:20191202142529j:image

文字は一対一で対応しているとは限らないため数が合わなくてもひとまず問題ありません。1番の選択肢は土曜日に入りそうです。

土曜日のモンゴル文字が分かったのでこれをよく見てみると、2個目の青の上にある文字(赤色)が日曜日にも含まれていることが分かります。位置関係からキリル文字のмに対応していると予想します。

f:id:karngati:20191202142602j:image

少し形が違いますが、4番にはこれが二つ出てきています。恐らく語頭なので形が変わっているのでしょう。мを二つ含む火曜日に入りそうです。


日曜日と土曜日にはяも共通して出てきているのでこれも対応させられそうです。黄緑で塗りました。

f:id:karngati:20191202142635j:image

繰り返しますが、一対一で対応しているとは限らないので多少の誤差は仕方ありません。


ここで、残っている2番3番5番と月水木にそれぞれ青のモンゴル文字キリル文字のвが一度ずつ出てきていることに注目します。青いモンゴル文字はбとвの両方に対応しているようです。単語内の位置もちょうどいいですね。


残りヒントになりそうなキリル文字はа、р、гあたりですが、аは沢山あっても対応するモンゴル文字が未だよくわからず、рは選択肢のモンゴル文字のなかに4番の一番下の文字に似た文字が見つかりません。語中、語尾で形が変わっているのかもしれません。

гなら2番と4番に黄色で示したものが共通していますね。2番を水曜日に入れます。

f:id:karngati:20191202142742j:image


残り選択肢は二つですが、ここから絞るのは少し難しいと思います。3番だけ青の字形が違うのは語末に来ているからだと推測したり、5番の方が青の位置が真ん中寄りにあることを根拠にしたりすると3番を木曜日、5番を月曜日にできます。

f:id:karngati:20191202143115j:image

完成!

 

チベット文字

火曜日に二つ含まれている文字(赤色)がмっぽいですね。Bにも似ているのがあるので取り敢えず赤で塗っておきます。Bに二つある文字(青)がбで、これが土曜日だと予想できます。Cの方が語形が短そうですしм(赤色)も後ろのほうにあるのでCは日曜日、Bは土曜日に入れます。

f:id:karngati:20191202143127j:image

青とбの数が合っていませんが、これもまた一対一対応ではないからでしょう。説明が大変になってきたのでここで2回以上出てきているチベット文字に色を塗ります。

f:id:karngati:20191202143215j:image

たくさん塗れました。


色々攻め方がありそうですが、ここでは火曜日のデータから黒色がрだと仮定し、同じ黒を含むEを水曜日にとします。すると紫色はвに当たりそうです。

f:id:karngati:20191202143234j:image

ここで、チベット文字の青と紫はキリル文字のбかвのどちらかに対応していると予想できます。先ほどのモンゴル文字でбもвが区別されていなかったことを考えると自然です。

そう仮定をおくと、初めに青があるDが金曜日、後ろの方にあるAが水曜日だと分かります。黄緑がгに対応しそうなのも根拠になります。

f:id:karngati:20191202143253j:image

完成!

まとめ

いかがでしたか?

この解説では途中で立てた仮説が全て正解でしたが、そんなふうに解き進められることは滅多にないので立てたり立て直したりしながら進めます。

 

おまけ

今回の問題はキリル文字モンゴル文字で書かれたモンゴル語とその語源となるチベット語の対応でした。

この記事では個別の文字の知識がないことを前提に解説をしましたが、キリル文字を少し知っているとбとв(ラテン文字で言うとbとv)が同じ字になったり、母音であるaがチベット文字で書かれていなかったりするのに納得できたりして有利になるかもしれません。

モンゴル語チベット語の語形が違うのは容易に想像のつくところですが、キリル文字モンゴル語は口語、モンゴル文字は文語で書かれているらしく、どれも微妙に違う語形になっているそうです。

問題中の3番のвに対応する文字の形が違うのは語末だからではなく、文語では後に違う母音が付いているからだそうです。こんなのやってられるか。

追記 モンゴル文字の月曜日の字が間違っているらしいと言う情報を得ました(вは本来これではないらしい)(参考:http://chinabuddhismencyclopedia.com/en/index.php/Days_of_the_Week_in_Mongolian_%2526_Buryat:_Planetary_and_Numbered_Names