Back to Timeline
ZM
zmila
Liter- kaj nombr- umadoj

Mi preparis iom da statistiko.
Tio estas bazita sur tekstoj el Tekstaro. Ĉiuj fremdaj vortoj forigitaj. Entute restis 6_050_218 vortoj kaj el inter ili 49_463 diversaj vortoj.
Suma nombro de literoj: 28_844_862. Mi provis fari dividon je silaboj, rezultis distinktaj silaboj: 1_859

Do:
- Meza vortolongo (en silaboj): 2.072
- Meza vortolongo (en literoj): 4.768
- Meza silablongo (en literoj): 2.301

En la dosiero ankaŭ troviĝas:
- Distribuo de vortoj laŭ longo (en literoj)
- Distribuo de literoj
- Distribuo de vortoj laŭ nombro de silaboj
- Komencoj de unusilaboj vortoj
- Komencoj de unuaj silaboj (ĉiuj vortoj)
- Lastaj finaĵoj de multsilabaj vortoj
- 5-literaj silaboj

Ekzemple

Distribuo de vortoj laŭ nombro de silaboj

Nombro de silabojFrekvencoProcento
12,395,02439.585%
21,730,54728.603%
31,213,32620.054%
4539,2308.912%
5150,1092.481%
619,8450.328%
72,0950.035%
81010.002%

Mi esperas, ke tio povas helpi al tiuj, kiuj okupiĝas pri kreado de skribsistemoj aŭ pri analizado de Esperanta skribo.

Rezulto - ĉe github: https://github.com/zmila/eo_vortilo/blob/main/rezultoj.md
(La kodo en Jupyter libro literumado_laŭ_kevako.ipynb)

Comments (2)

Записная книжка звучит просто как "книга" ?

это я торопился и не поискал точного перевода.
написал так, наобум, приблизительно.

надо будет потом подумать.
спасибо за code review 🙂

👍1