人工うなぎ諸語

言オリ風自作問題2 インドネシア語の語対応

APLO直前なので応援のために語対応の問題を作りました(?) たぶんJOLの簡単な問題って感じだと思います。

インドネシア語の語対応

前回の問題はてなブログに直接書いたんですがポロロッカという問題投稿サイトが優秀だったのでこっちに投稿しています。こっちで解くのがおすすめです。

ヒントが付けられたり、自動でジャッジしてくれたりします。すごい。

問題

一応ここにも問題を載せておきます。

でも自動ジャッジしてくれるのでポロロッカで解くのがおすすめです。

解答も載せたけどちょっとずつヒント見られたりするのでポロロッカで解くのがおすすめです。

以下にインドネシア語の語句が12個与えられている。

  1. air mata
  2. air putih
  3. batu
  4. batu merah
  5. bulu mata
  6. hari merah
  7. hari pertama
  8. matahari
  9. Merah Putih
  10. nasi goreng
  11. nasi putih
  12. rumah pertama

以下にその意味がランダムな順番で並んでいる。

焼き飯, 石, 太陽, 涙, インドネシア国旗, 白米, 休日, まつげ, 最初の日, 最初の家, 赤い石, 真水

(a) どれがどれに対応するか示しなさい。

(b) 次の語句をインドネシア語に訳しなさい

  1. 赤い目
  2. 石造りの家
  3. 玄米

インドネシア語オーストロネシア語族のマレー・ポリネシア語群に属する。 インドネシア国旗は上半分が赤、下半分が白の旗である。

解答・解説

解説も載せておきます。ほぼコピペです

言語学オリンピックでよく出題される「語対応」などと呼ばれるパターンの問題です。

(a)

  1. 涙(目の水)
  2. 真水(白い水)
  3. 赤い石
  4. まつげ(「目の毛」cf. ま「目」+つ「~の」+げ「毛」)
  5. 休日(「赤い日」、カレンダーの色から?)
  6. 最初の日
  7. 最初の家
  8. 太陽(「日の目」)
  9. インドネシア国旗(「赤白」)
  10. 焼き飯(焼いた米)
  11. 白米(白い米)

(b)

  1. hari
  2. air
  3. mata merah
  4. rumah batu
  5. nasi merah(「赤い米」。nasi merahで検索すると赤い玄米の写真が見つかる)

アドバイス

  • 注を見ましょう。 大事。インドネシア国旗=「赤白」は注が無いと厳しそう。

  • (b)の「日」「水」「赤い目」は、与えられているデータの中に「日」「水」「目」という語が含まれていることを示唆しており、「涙」を「目の水」と分解するためのヒントにもなります。

  • 「石」のような基本的な単語は一語だろうと予想して手掛かりにできると強い。

  • 頻度解析は時間がかかるので行き詰まって手が動かなくなったときにやると良い?

解き方の手順(参考)

雑手順説明です

batu=「石」と仮定すると、batu merah=「赤い石」と分かり、さらに語順が主要部+付加部だと分かる。

hari merahとMerah Putihがmerahを含んでいるが、Merah Putihのほうが固有名詞っぽいし、他に「赤」が主要部になりそうな選択肢がないためputih=白とわかる。

nasi putih、air putihのどちらかが「白米」だが、air putihが「白米」だとするとair mata=「焼き飯」、mata=「焼き?」となるが、「焼き」を含みそうな選択肢は3つもありそうに思えない。 nasi putih=「白米」とするとgoreng=「焼き」、nasi=米となる。

ここで残りの選択肢について頻度解析をすると、

air 2 0
mata 1 2
putih 0 1
bulu 1 0
hari 2 1
merah 0 1
pertama 0 2
rumah 1 0

涙=目+水

真水=真+水 ((b)を見ると「水」があるため、「真水」は二語であると予想できる)

まつげ=目+毛

休日=休み?+日

最初の日=最初+日

太陽=?+日

最初の家=最初+家

とすると、

被修飾語 修飾語
0 2
2 0
0 1
1 0
休み 0 1
3 0
最初 0 2
1 0

頻度を見るとair、hariのどちらかが「水」、「日」っぽく、mata、pertamaが「目」「最初の」のどちらかっぽく、bulu、rumahが「毛」「家」のどちらかっぽい。

まずair putihとhari merahが解釈できるようにする。air=「日」、hari=「水」と仮定するとhari merah=「赤い水」となりよくわからない。日と水を逆にしてair putih=「白い水」ならまだ「真水」っぽいのでこっちにしておく。

mata=「最初の」、pertama=「目」とすると、air mata=「最初の水」がよく分からない。逆にすると、air mata=「目の水(=涙)」hari pertama=「最初の日」となり都合が良い。

matahariはmata+hariとなっており、文字通りには「日の目」となるが、まあ目は丸いし、「太陽」なら一単語っぽさもある。

残りもbulu mata=まつげ、rumah pertama=「最初の家」だとわかる。

おわり

みなさんも自作言オリ風問題作りましょう!

APLOの人々は頑張ってください!

自作言語学オリンピック風問題:バク文字

おひさしぶりです。
バク文字という文字を作ったのでついでに言語学オリンピック風の問題も作りました。Twitterで上げたものに少し修正を加えてあります。
初めに問題を示して、解き方を順に説明しながらそのあとに解答を出すのでもし行き詰まったらこの記事を少しずつ読みながら解いてみてください。最後に問題でわからない部分の説明もするので暇だったら読んでください。

2020/05/06 追記:解説と解答を一部修正しました。

問題

以下にバク文字と発音表記で書かれた単語がある。

f:id:karngati:20200418112841p:plain

問題a 9~12の空欄に当てはまる発音表記を書きなさい。いくつか候補が考えられる場合はそのうちひとつを示しなさい。
問題b 13~16の単語をバク文字で書きなさい。
問題c バク文字の表記規則を説明しなさい。

バク文字は架空の文字体系であり、ここに示された単語と発音は架空の言語のものである。以下に発音記号の注釈を加える。
<ɨ>はのスの母音。<:>は直前の母音が長いことを表す。<ŋ>ははんこのンの音、またはsingのngの音。<ʁ>(Rを上下反転した記号)は有声口蓋垂摩擦音で、フランス語のパリのrの音。

問題概観

言オリにまあまあよくでる文字の問題です。過去記事でも解説しています。
難易度は国際大会の易~標準くらい?
JOL予選突破を目指すなら80分~90分で解き終えたら十分そう?自分では解けないのでよくわかりません……

解説

自分ではこの文字を完全に知っているので逆に解説が難しいんですががんばって解説してみます。分からないところがあったら聞いてください。

まず一目で横書きであることが推測できます。どうやら母音の種類が少ないようなのでこれから手を付けましょう。
4. aʁa:mpat、1. kaatɨなどから発音表記aがバク文字ʌに対応すると 分かります。
同様に3.gɨkkele:kなどからeを、7.mo:mvɨŋkoを手掛かりにoを特定できます。ɨはとりあえず置いておいて、ここで子音に移りましょう。

1.kalŋatɨ、2.soŋka:lve:などからkに対応するバク文字がわかります。3の発音表記にもkがありますが数が足りないのでもしかすると特定の条件でkが書かれない、または違う文字であらわされるかもしれません。
同様に、lやpなどバク文字で複数回でてきていて分かりやすいやつから特定していきます。

このようにして、発音表記で母音の直前にある(=音節頭の)子音を表す文字をすべて特定することができます。
では母音の長短や音節末の子音はどのように表記されるのでしょうか。あるいは全く書かれないのでしょうか。

ここからまだ役割が特定できていない文字について見ていきます。
いまのところ

  1. :みたいなやつ
  2. sの上側が長く伸びてるやつ
  3. 上につく線
  4. 下につく線
  5. ʃを左右反転させたやつ

の六つの記号が残っています。これらを順番に見てその役割を決定していきます。

まず記号1です。これが現れるところをすべて確かめます。

番号 発音表記
1 ŋa
1
3 ke
4 a
5 to
7 ko

すべてが短母音で、しかも終わりに子音がついていません。
つぎに記号2です。同様に見ると、これらはすべて音節末に鼻音またはlがついています。記号3も同様ですが、記号2は短母音、記号3は長母音です。
同様に記号4と記号5は音節末が-p/t/kで、それぞれ長母音と短母音です。
これをまとめると以下のようになります。

  長母音 短母音
末子音なし 記号なし 記号1
-m/n/ŋ/l 記号2 記号3
-p/t/k 記号5 記号4

音節末の-m/n/ŋ、-p/t/kは語末以外では次の子音に逆行同化していますね。逆に語末ではどれも表記上は区別できません。そういうこともあります。

残った記号6は音節の頭に子音がないことを表しているようです。

ここまですすめばもうわかっているでしょうが、ɨは母音字をなにも書かないことで示されているようですね。

これでバク文字の解読は終了です。

解答

問題a
9. kɨkkɨ:vɨ:(m/n/ŋ/l)
10. va:(m/l)mode:
11. sa(ŋ/l)ŋɨla:(p/t/k)
12. o:ppema:

問題b

f:id:karngati:20200418135409j:plain

問題c

  • 文字は音節ごとに左から右へ横書きする。
  • 音節の初めの子音を書く。初めに子音が無ければ<o>を書く。
  • 母音の長さ、音節末の子音の種類に合った記号をつける(画像参照)
  • その右に母音を書く。母音がɨならば何も書かない。

その他
音節末の子音はその次の音節のはじめの子音にあわせて調音点が変化する。(これは問題cに書いても良いですが必須ではありません(表記の規則ではないので))

f:id:karngati:20200418152906j:plain

言オリだったらたぶんバク文字の子音字と発音の対応をを全部書いたりする必要はありません。書いても減点されることは無いと思います。

おわり

バク文字は音節構造を直接表記する文字体系を作ろうと思い立って作りました。こういう文字体系って実在するんですかね?もし何かご存じでしたら教えてほしいです。
使い捨てにするにはもったいないので多少改良して既存の自作架空言語とかに使っていきたいですね。

問題に出てきた単語は問題として解けるように捏造したものです。無い言語だとこういうことができるので作問がしやすくてうれしいですね。みなさんもどんどん文字や言語を自作して言オリ風問題を作りましょう!!

ちなみに、Twitterには#ロゼッタゲームというタグがあり、こういう問題がたくさんツイートされています。ここにある問題も解いてみて、もし問題を作ったらこのタグで公開しましょう!え、このタグできたのもう3年前なの……時代……

JOL2020-2 ツングース諸語の音対応の解説

お久しぶりです。
この記事は2020年日本言語学オリンピックの第二問、エウェンキ語・オロチ語・ナーナイ語の音対応の問題の解説記事です。
解説なので自分で解いてみてから読んだり解きながら行き詰まったら読んだりしてください。
誤りや質問などがあればコメントかTwitterへお願いします。
問題はこちらからどうぞ。

問題について

ツングース諸語の3言語(問題に従って以下それぞれEk、Oc、Naと略します)から音対応を示す語の組が16組与えられています。
これらのデータから音対応のパターンを見つけて、それに当てはまるような選択肢を選びます。

この問題のように複数の言語の比較をする問題はどちらかというと珍しい気がします。

音対応は標準語の o, e に対する沖縄方言の u, i のような複数の言語の間での規則的な音の対応関係のことです。

難易度

国内予選としてはやや簡単?
できれば早めに解いてほかの問題に時間を割きたい

使う情報

  • 与えられた16組の語
  • 空欄[11]~[20]の選択肢

選択肢や問題も重要な手掛かりになります!

方針

  1. 音対応のパターンを見つける
  2. このパターンを適用しながら選択肢を絞る

1は音対応を扱う問題では不可欠な作業です。
またこの解説では1が終わってから2へ進んでいますが、パターンがわかり次第選択肢を削るやり方が効率的だと思います。

表記について

ところで、与えられているデータの中に、abc...といったラテン文字のほかにə ŋ ʥのような文字があります。
言オリではしばしばこのような文字が使われ、大抵は注釈がつきますが、今回のように一切注がなかったり必要最小限の情報しか与えられないことがあります。
このような文字は国際音声記号IPA*1での使い方に基づいていることが多く、IPAでこの文字がどのような音を表すか知っていると問題を解きやすくなることがあります。ə、ŋ、ʥはそれぞれIPAでは中舌中央母音「ハンガー」のンの音「ジャッジ」のジの子音を表します。
また、調音方法や調音点などの基本的な音声学の知識は、直接問われることは少ないにせよ様々な問題に役立ちます。
これらについては入門書がたくさん出版されていますし、もし余裕があれば一度触れておくことをおすすめします。

解説

どこから手を付ければよいかわからないときはまず分析の対象を絞りましょう。ここではとりあえず母音の対応を見ます。
三つの言語のn番目の母音同士のすべての組み合わせ(6パターン)を挙げました。実際に解くときもまずは全パターン列挙しています。

Ek Oc Na
a a a 八、犬、口、いくつ、娘
o o o 泣く、銛、魚皮、忘れる
i i i
i i u いくつ、重い
u u u 八、跳ぶ、唇、
ə ə ə 唇、風、胸

空欄[11]など、どの選択肢でも母音が共通している場合はデータとして利用できます。 わからない母音の対応は以下です。

Ek Oc Na
u o/u u 跳ぶ
u u/i u
i u/i u 風、娘
u/i i u

この四つの空欄も上の六つのパターンのいずれかに当てはまるはずです。 これで選択肢[12]c、[15]ad、[19]ab、[20]bdを削除することができます。


一通りデータに目を通したところで「犬」を意味する語が他とは少し違う対応をしていることに気づいたかもしれません。

Ek Oc Na
ŋinakin inaki inda

これはEkとOcにおいては本来「犬」を意味していた部分のうしろに-kin、-kiという他の要素(指小辞のような)がくっついた形が新しく一語として定着したからだと想像できます(日本語における 子+ども のように)。Naのindaに対応するのはEkのŋina-、Ocのina-の部分だとすると納得がいきそうです。


次は子音です。まずは語頭の子音から比較します。3言語すべて共通している場合を除くと以下の3つが挙げられます。

Ek Oc Na
x いくつ、重い
x x p 足跡
ŋ

ここでは"∅"は「子音が無い」という意味です。
空欄の語もこのパターンに従うはずなので、[12]、[14]、[15]、[20]の選択肢が絞れます。
次に語末の子音の比較です。データにはnしかでてきていませんね。

Ek Oc Na
n n n
n -

「犬」では-kinと-kiを比較しているのでNaのデータはありません。あまり決定的な発見ができませんでしたが、EkにnがあってOcにはないというようなパターンがありうることがわかりました。

次に語中の子音です。解答において重要な子音連続を含むもののみを挙げます。

Ek Oc Na
n n nd
n ? nd
? ŋ ŋg
ŋ ? ŋg 泣く
? ŋb 忘れる
mm ŋm
bg bb gb
? bb gb 魚皮
? pp kp
rg gg jg 重い
rg gg ? 太った
rk kk (jk) 跳ぶ

これらのパターンは、ナーナイ語の子音連続を AB とすると次のように分類できそうです。ただし「忘れる」は例外的なのでまだ含めていません。

  1. A : A : AB(犬~泣く)
  2. BA : BB : AB(口~八)
  3. rB : BB : jB(重い~跳ぶ)
  4. kt : kt : kt (足跡)

ここで個々の選択肢を検討していきます。

[11] 語中子音からc
[12] 語頭が x : x :p となるb。語中も適切
[13] 語中子音から c
[14] 語頭子音からbdのいずれか、m : mm : mのような語中子音のパターンはないのでd
[15] 語頭子音からc
[16] 語中子音が jgとなっているd
[17] 語中子音からa
[18] 保留 (aとcではなさそう?)
[19] 語中子音と i : i : u の対応からc
[20] 語頭子音からaもしくはd、dは語末のtがおかしいのでa

音対応のパターンをかなりきっちり挙げたのでかなり簡単に選べました。

ここで[18]が残りました。[18]の選択肢は mŋ : gb/ŋŋ/bŋ/mm : ŋbです。手がかりがないようですが、解答が出せるとするとやはり[18]も上で見た語中子音連続のパターンのどれかに当てはまっているはずです。
これを自信を持って決定するにはおそらく音声学もしくは音韻論の基礎的な知識が必要です。上のパターンはA, Bの調音点、調音法によって一般化できます。1ではAが鼻音でBはAと同器官的な破裂音、2はAが両唇音でBは軟口蓋音、3はBが軟口蓋破裂音です(早口)。
このようにとらえると、[18]は2番目のパターンに似ていることがわかります。このパターンではOcは必ずBの両唇音が重なるので、d. ommo-であると予想できます。
このことに気が付かなかったとしても、Ocで違う子音が連続している例は「足跡」しかないので二択にまでは絞れるかもしれません。

まとめ

  • 音韻対応の問題ではパターンを書き出す
  • 母音/子音、語頭/語中/語末のように分けて調べる

類題

IOL2007-5 : トルコ語タタール語の比較です。今回の問題よりやや難。

関連記事

fulfom.hatenablog.com

zohe.hatenablog.com

*1:IPA Phoneticsというアプリがあり、記号当てゲームなどができて楽しいのでおすすめ

JOL2018第5問 キリル文字・モンゴル文字・チベット文字の解説

 

ブログ始めました。最初は2018年の言語学オリンピック日本予選(iolingjapan2018.pdf - Google ドライブ)から第5問のキリル文字モンゴル文字チベット文字の問題の解説です。

ミスや分かりづらいところがあったら指摘してもらえると嬉しいです。

 

公式サイトの大会成績によると平均点は20点満点の12.39点だそう。

 

前提知識

  • ある文字で区別されているものが他でも区別されているとは限らない
  • 子音と母音を独立して書くローマ字のような文字体系のほかにも、子音だけを記したり、子音に記号をつけて母音を表したりするものなどがある
  • 語の始め、中、終わりで字形が変わる文字もある

などを知っていることが望ましいです。

キリル文字などの知識が有れば役に立ちますが、必ずしも必要ではないためここでは個別の文字の知識はないということにして解き進めます。

 

解説

方針

この問題の目標は、選択肢を絞れるようにキリル文字モンゴル文字キリル文字チベット文字それぞれの対応関係を明らかにすることです。

  • 確実なデータから対応を特定する
  • 対応させられたら色を塗る

でやっていきます。色ペンは本番でも使えますし他の問題でも役立つので大量に持っていきましょう。

ふつう文字の問題では書き進める方向を考えなければなりませんが、今回は事前知識が無ければ右も左も分からないのでとりあえず左から右、上から下だと仮定しておいて行き詰まったら仮説を立て直すことにしましょう。


ここでは便宜上各選択肢をこう呼ぶことにします。

f:id:karngati:20191202153907j:image

 

 
モンゴル文字

まずはモンゴル文字から始めます。一目で縦書きらしいのが分かります。とりあえず一番目立っている金曜日の一番上の文字を青で示します。上の仮定に従うとキリル文字のбに対応しそうなのでこれも青で塗りました。少し怪しいですが3番もマークしておきます。

f:id:karngati:20191202142529j:image

文字は一対一で対応しているとは限らないため数が合わなくてもひとまず問題ありません。1番の選択肢は土曜日に入りそうです。

土曜日のモンゴル文字が分かったのでこれをよく見てみると、2個目の青の上にある文字(赤色)が日曜日にも含まれていることが分かります。位置関係からキリル文字のмに対応していると予想します。

f:id:karngati:20191202142602j:image

少し形が違いますが、4番にはこれが二つ出てきています。恐らく語頭なので形が変わっているのでしょう。мを二つ含む火曜日に入りそうです。


日曜日と土曜日にはяも共通して出てきているのでこれも対応させられそうです。黄緑で塗りました。

f:id:karngati:20191202142635j:image

繰り返しますが、一対一で対応しているとは限らないので多少の誤差は仕方ありません。


ここで、残っている2番3番5番と月水木にそれぞれ青のモンゴル文字キリル文字のвが一度ずつ出てきていることに注目します。青いモンゴル文字はбとвの両方に対応しているようです。単語内の位置もちょうどいいですね。


残りヒントになりそうなキリル文字はа、р、гあたりですが、аは沢山あっても対応するモンゴル文字が未だよくわからず、рは選択肢のモンゴル文字のなかに4番の一番下の文字に似た文字が見つかりません。語中、語尾で形が変わっているのかもしれません。

гなら2番と4番に黄色で示したものが共通していますね。2番を水曜日に入れます。

f:id:karngati:20191202142742j:image


残り選択肢は二つですが、ここから絞るのは少し難しいと思います。3番だけ青の字形が違うのは語末に来ているからだと推測したり、5番の方が青の位置が真ん中寄りにあることを根拠にしたりすると3番を木曜日、5番を月曜日にできます。

f:id:karngati:20191202143115j:image

完成!

 

チベット文字

火曜日に二つ含まれている文字(赤色)がмっぽいですね。Bにも似ているのがあるので取り敢えず赤で塗っておきます。Bに二つある文字(青)がбで、これが土曜日だと予想できます。Cの方が語形が短そうですしм(赤色)も後ろのほうにあるのでCは日曜日、Bは土曜日に入れます。

f:id:karngati:20191202143127j:image

青とбの数が合っていませんが、これもまた一対一対応ではないからでしょう。説明が大変になってきたのでここで2回以上出てきているチベット文字に色を塗ります。

f:id:karngati:20191202143215j:image

たくさん塗れました。


色々攻め方がありそうですが、ここでは火曜日のデータから黒色がрだと仮定し、同じ黒を含むEを水曜日にとします。すると紫色はвに当たりそうです。

f:id:karngati:20191202143234j:image

ここで、チベット文字の青と紫はキリル文字のбかвのどちらかに対応していると予想できます。先ほどのモンゴル文字でбもвが区別されていなかったことを考えると自然です。

そう仮定をおくと、初めに青があるDが金曜日、後ろの方にあるAが水曜日だと分かります。黄緑がгに対応しそうなのも根拠になります。

f:id:karngati:20191202143253j:image

完成!

まとめ

いかがでしたか?

この解説では途中で立てた仮説が全て正解でしたが、そんなふうに解き進められることは滅多にないので立てたり立て直したりしながら進めます。

 

おまけ

今回の問題はキリル文字モンゴル文字で書かれたモンゴル語とその語源となるチベット語の対応でした。

この記事では個別の文字の知識がないことを前提に解説をしましたが、キリル文字を少し知っているとбとв(ラテン文字で言うとbとv)が同じ字になったり、母音であるaがチベット文字で書かれていなかったりするのに納得できたりして有利になるかもしれません。

モンゴル語チベット語の語形が違うのは容易に想像のつくところですが、キリル文字モンゴル語は口語、モンゴル文字は文語で書かれているらしく、どれも微妙に違う語形になっているそうです。

問題中の3番のвに対応する文字の形が違うのは語末だからではなく、文語では後に違う母音が付いているからだそうです。こんなのやってられるか。

追記 モンゴル文字の月曜日の字が間違っているらしいと言う情報を得ました(вは本来これではないらしい)(参考:http://chinabuddhismencyclopedia.com/en/index.php/Days_of_the_Week_in_Mongolian_%2526_Buryat:_Planetary_and_Numbered_Names