И уж закончу насилие моего копилота над Python-ноутбуком с целью проанализировать всякие письменности для эсперанто.
В этот раз вспомнил адаптацию тенгвара для эсперанто, и там есть два режима.
Гласная обозначается как диакритический знак над согласным. Есть режим KV, Quenya-style — более традиционный: над согласным ставим знак следующей за ним гласной. LA, DO-MO, LA-BO-RO.
А есть режим VK, Sindarin-style, — наоборот: над согласным ставим знак предыдущей гласной: EL, AP-UD, AM-IK-OJ.
Для формирования слогов, когда не получается чистая пара, то есть не хватает согласной или гласной, в тенгваре пишут голую согласную (без диакритиков) или специальный знак для гласной.
Я же использую специальную согласную x там, где не хватает согласной, и специальную гласную y там, где не хватает гласной.
aero:
KV: xA xE RO
VK: Ax ER Ox
trans:
KV: Ty RA Ny Sy
VK: yT yR AN ys
Так каждый слог всегда будет из 2 частей. Всего имеем 23*5 + 23 + 5 = 143 различных слогов.
Было теоретическое ожидание, что VK более оптимален, так как в эсперанто много слов, построенных при помощи суффиксов и окончаний, а это в основном пары VK.
В результате многих вычислений получилось два вывода.
-
KV-режим более эффективен с точки зрения длины текста. Один и тот же текст, записанный как KV-слоги, будет на 10% короче в слогах, чем VK. Это происходит потому, что в эсперанто начальная буква слова чаще согласная, а конечная — наоборот, гласная. И поэтому нужно меньше "суррогатных" слогов с x или y.
-
VK-режим более экономен с точки зрения количества различных знаков для письма. То есть, чтобы записать один и тот же текст, в режиме VK можно использовать на 20% меньше разных знаков. Например, чтобы покрыть 80% любого текста на эсперанто, нужно всего 33 разных VK-знака против 44 KV-знаков. Для покрытия 90% нужно соответственно 52 и 63 знака. (В алфавитном письме нужно 15 эсперанто-букв, чтобы покрыть 90% текста)
Для текста на картинке "gemaljuneguletoj babiletemulegoj" нужно 12 разных букв, 14 KV-знаков против 12 VK.
Верхний - алфавит Ŝava,
средний - слоговая письменность Tengvar в VK режиме,
нижний Zbalemorna - слоговая письменность для Lojban (KV режим).
