Thursday, June 16, 2011

Some statistics on Cantonese

Based on the analysis of Mr Wong Sek Ling on Cantonese Dialect, there are 53 vowels times 20 consonants including the non-aspirated consonant (using -, ie no consonant), that is, 1060. This is the maximum set or collection of all possible syllables and not all syllables are used in common dialect.
My system indicated that there are 666 syllables in various 666 files and here is the report:

Total entries: 11728.
There are 8918 distinguished characters stored in various 666 files., m.aan:23,,, k.e:6, h.aau:29,,, b.ui:18,, t.o:26, s.eng:7,,, h.aam:16,, c.aang:11, w.ok:17, h.oi:23,, d.i:1, w.aak:10,, m.aa:28, c.aak:8, d.ung:19, p.un:19,, g.aa:32,, g.ap:8,,, l.aat:4,, j.yut:17, s.oei:61, j.eon:2, l.ei:29,,, c.aa:21,,,, k.oeng:8,, c.aat:7, l.iu:30, s.ou:28, gw.aa:10, -.m:5, t.ou:53, c.ip:2, kw.aai:2,, z.yut:26, k.ik:1,, ng.ap:9, s.yu:34,,,, z.aang:12,, b.ei:49, kw.aau:1, d.oi:15, z.eng:5, l.aang:1, l.eon:48, k.aa:6, c.oeng:49, s.aan:24, h.ok:8, b.ik:14,,, h.aan:11, l.eng:6, b.e:1, p.ui:17, n.ip:11, b.aak:14, t.ung:28, w.ik:6, b.ung:7,, z.ap:4, l.ap:3, k.ui:37, t.aan:21, l.ik:16,, d.iu:22, -.ut:1, w.un:36,, d.ap:2, z.aam:11, h.m:1,,, g.oei:43, g.oe:1, d.o:12, c.ik:15,, kw.ik:10, w.ang:10, gw.aat:2, p.aang:10,,, b.o:14, c.ou:32, g.aat:5, g.on:17, t.oei:10, d.ek:3, w.o:18, s.aam:12, -.e:1,,,, d.oeng:1, -.aak:5,,,,,,, n.i:2, -.aan:2, p.ei:25, z.oi:14, d.aat:8, -.ap:1, c.aap:2, s.ei:3, h.o:15, l.u:1, -.un:36, -.ip:14, k.aat:1, n.aa:12, d.aai:8, t.ik:23,, z.aau:9, l.oeng:29, p.ek:1, s.ip:7, d.eot:5, z.ung:46, s.ung:14, n.oeng:2, -.aa:19, d.oek:24, j.yu:126,, f.ung:31, -.ak:15,, kw.aa:9, gw.ang:7, z.ok:11,, l.i:2,,, z.iu:27, k.oek:5, d.u:1, t.ip:4, d.ok:4,, -.ik:49, j.eng:2, k.oei:32, p.ung:5, m.e:9, -.on:8,, w.aai:9, z.e:18, d.aam:25,,, k.ek:2, z.ek:9, z.oeng:43, g.yut:3,, c.yu:29,, z.ak:8, g.aai:25, b.aan:17,, f.ui:21, m.ung:19,,, p.aau:20, k.aak:1, l.ak:6,, w.ui:19, b.ek:1, n.iu:9, k.u:1, l.aap:10, s.aai:21,, c.ang:6, f.aan:45,, -.aang:2, k.ok:15, j.iu:56, c.yut:4, m.aai:7, kw.aang:4, d.yut:1, k.aau:2, -.ui:19, n.aap:11, b.aau:10, p.eng:3, gw.aan:10,, b.ou:35, g.aap:17, -.o:16,, d.e:2,, n.ik:10, f.ei:31,, t.aap:11, n.o:13, -.aam:2, d.aap:12, -.yu:126, l.aau:1, l.o:26, g.ei:57, b.aat:4,,, b.eng:3, z.aap:18,, z.aa:26, ng.ei:1, g.ip:6, n.aai:10, h.ak:7,, d.eng:6,,, c.aan:11, ng.ang:1, -.ang:5, ng.ung:4,, z.aat:9,, j.ip:14,, gw.o:12,,, -.ou:11, j.aak:2, j.oeng:50, l.ou:53, h.aap:17, d.eon:25, s.i:70,, h.aa:17, p.ang:6, k.oe:3,, g.ik:11, c.aai:12,, h.yut:1, j.oek:25, h.iu:16, n.ap:2, p.ut:2, t.eng:3, h.ap:19,, -.aau:8,, h.oe:2, k.yut:26, h.aai:29, ng.aap:2, l.oi:15, l.eot:13, t.oi:19, g.oeng:16,, z.aak:22, -.oi:18,, j.i:115,,, g.ung:23, -.aap:2, s.aak:1, t.aam:27, ng.ok:22, n.ou:12, t.yut:1,, f.u:88, ng.o:24, g.ok:12, c.ok:6, b.ak:1, m.ang:3,,, d.ak:5, ng.aa:17,, m.aang:9, n.aan:4, n.ok:2,, d.ik:18, k.ei:46,, l.aak:3,, g.i:1, l.yut:5, gw.aang:2, d.ou:40, s.eot:14, d.aak:1,, m.aat:5, z.ang:11, b.ut:15, j.e:21,, s.oi:4, l.ip:3, g.aak:11,, gw.aak:1, z.oei:53, g.aang:5,,, z.aai:9, l.aa:10, m.ak:15,,, z.eot:15, d.aa:2, g.ou:26, ng.aam:7, ng.aak:8,, -.yut:17,, b.aa:20, t.ang:8,,, h.eng:1, h.ek:1, -.ei:1, g.eng:3, s.aang:7,, m.ei:20,, w.aa:29, p.o:11,, k.oi:15, c.i:90, n.ei:12, s.aa:13, n.oi:7, j.aa:7, t.iu:23,,, -.iu:56, d.ip:26, w.ut:1,, l.ang:4, g.iu:26,, g.un:23, p.ik:9, f.o:12,, m.aak:3,, f.ang:1, s.aap:12,, d.oei:10, g.aam:10, g.o:13,, s.o:24, ng.on:8,,, n.e:2, m.un:13,,, p.ok:11,, d.aan:15,,,, l.ok:14,, b.ok:19,,, n.oei:2, h.on:36, m.o:15,,, s.ok:7,, t.aa:6, z.ik:43,, j.o:2, c.oi:20,,, c.eon:13, k.ap:12,, -.aai:12,, b.un:10, l.aai:8, p.aan:4, f.ut:1, k.iu:12, f.aat:6,, w.aang:3, kw.ok:7, -.i:115,, s.iu:34, p.aai:9, -.aat:12, h.ot:10,, g.u:41, gw.ui:1, c.ap:5, c.ek:3, c.e:12, z.aan:21,, -.ok:3, f.aak:2, s.ap:7,, t.ek:1, l.e:5, h.aak:4,,, t.ok:11,, -.ung:4, j.ap:19,,,, gw.ik:13, k.ung:8, c.o:26, s.eon:48, b.aai:12, d.ang:18, p.aa:11,, -.u:55, h.oei:20,,, f.aa:4,, ng.aau:16,,,, c.ung:38, c.ak:3, ng.ak:10, g.ui:2, c.iu:23, n.ung:10, n.aat:2, h.ou:31,, h.oeng:15, n.aau:24,,, l.aan:11,, m.ui:19, m.ok:10,, h.ik:5, n.eot:6, p.iu:18,, z.yu:39, s.aat:7, z.i:145, j.oei:28, g.aan:27, h.ei:51,, m.ek:1, m.ik:9, gw.aai:8,,, b.aang:5, l.ung:32, h.ang:25, f.un:11, s.ak:1,, m.ut:8, ng.ou:28,,, t.eon:14,,, j.aai:1,,,, c.aam:20,, l.oek:3, m.iu:18, g.aau:29, s.ek:5, m.i:2, c.oei:45, m.eng:2, s.e:18, k.ut:4, ng.aat:14, z.oek:39, l.aam:16,, n.aam:8, l.oei:51, s.oeng:40,, ng.aai:20,, h.aang:5, b.iu:19, g.ang:20,, f.aai:5,,, z.ip:11, s.ik:39, ng.aang:3, t.aai:9, n.ang:1,, f.e:1, m.aau:14, g.oek:3, z.eon:47,, ng.oi:16, z.o:8,, b.ang:4, l.ek:3,,,, j.ik:49, j.ung:58,,,, c.eng:4, gw.ok:10, g.oi:7, c.oek:14, s.ang:6, c.aau:9,, p.aak:4,, s.aau:9, k.aai:2,, w.u:55,, d.oe:1,, d.ei:2, m.ou:55, h.ung:40, s.yut:3, k.o:1, p.oi:1, z.ou:26,, w.aat:5, c.eot:4, g.e:2, p.ou:25, g.ot:3, k.ang:5, h.e:2, f.ok:8, t.aat:8,, s.oek:5,, ng.aan:8,, t.oe:2, h.ip:15, w.aan:24,
There are 2176 characters have multiple syllables.
There are 0 consonant-vowels that do not have their files or no characters.
Total syllables scanned: 1060
The syllable z.i has 145 characters

If each syllable has 6 tones, there will be  3996 ways of saying in Cantonese. If you consider that this is the maximum, as some syllable ending with p, k, and t are called "entering" vowels, there are only 3 for each, instead of 6. This number will be less.

The advantage of Cantonese, one character one syllable tone, even though there are multiple characters per unit of syllable tone, the expression with language is amazingly endless.

This is some anaylsis that can be done in Communication System using a fixed set of symbols. The communication passed from thousand years from the past to the present century.

