| 在韵律结构PS里,音乐只是PS的主韵律区PA的听觉现象。该韵律区PA扩展后形成蜗节VK,元音具有“VK 属性”:主要共振峰Formant与蜗节VK关系密切。人类意识的工作形态是韵律结构。韵律结构是一种数据关系结构,也是音频信号的分组编码方式。 |
韵律结构网站 |
![]() |
【论文正文:请往上滚动看全文】
【论文】韵律结构-模拟信号分组编码与元音的蜗节属性 丁以民 中国南京 yimintin@163.com 韵律结构的核心是“四向比例”(2/3, 3/4, 4/3, 3/2)关系
你喜爱音乐吗,了解七个音符CDEFGAB的数理关系吗。古希腊Pythagoras说,四度五度之音是宇宙间天籁之音,由此我们对神奇的韵律结构展开研究。 [正文]:
韵律结构是一种数据关系结构,记作“PS”。它也是模拟信号的分组编组的方式。 1.1 韵律比与韵律网 在正实数域中,设X1是任意一点(见Fig.1),则总有四点X2, X3, X4, X5, 它们与X1的数值之比分别是 [2/3, 3/4, 4/3, 3/2]。这四个比称作 “韵律比” 或 “四向比”,该四点称作X1的“四向点”。它们之间的关系称作 “韵律关系”,或称“韵律相关”,是双向的(见图Fig.1)。同样,这四个点在各自周边也有四个点与之是韵律关系。同样...。不难证明,在韵律比下这些韵律相关点都收敛在同一网上,称作:“韵律网”,记作“pW”。在正实数域中,逻辑上并存着许多pW,它们都是相似的。 韵律结构PS的一个韵律区PA中的网点集合被人类意识理解为音乐。而音乐的本质是这些乐点之间的韵律比关系。这表明“人类意识中存在韵律结构!”1.2. 韵律区 在一条数轴线上,逻辑地存在着许多具有韵律关系的点,它们构成的韵律网,就象收拢着的“渔网”,“拉开”后其拓扑关系如图Fig.2。Fig.1是Fig.2的一部分。 (说明):图中的短弧线表示韵律比关系(逻辑关系)。
设:X1是韵律网pW上任意一网点,以X1为基频,记作"C1",则有下列“韵区系数表”,记作“pCT”: pCT= [1,k, k*k, 4/3, 3/2,3/2*k, 3/2*k*k] *2^n (其中n是整数;k=9/8;matlab格式) 再设:Xi也是pW任一网点,其中与X1的比值在pCT表中的Xi 的子集,称作X1的“韵律区”或称作“主韵区”,记作"pA", 用黑色实点表示(见:Fig.2)。 例如:X1的四向点X2, X3, X4, X5,与X1的比值在pCT中,它们都是黑色实点,即,都是X1的主韵区的节点。 例如:X2也有自己的四向关系点,但是其中只有右侧两个pW点与X1的比值在pCT中,是黑色实点在X1主韵区中,然而X2的左侧两个pW点与X1的比值不在pCT中,是空心点,不在X1主韵区中。 按四向比逐点跟踪,不难看出:在图Fig.2中 ① 黑色实点与X1的比都在pCT中;② 如果该Xi与X1(基频C1)的比值包括在上表pCT中,则该网点Xi必定是图中的黑色实点。这些黑色实点的集合就是C1的 “主韵区”。在一个韵律网pW中,任意一个网点都可以作为基频C1,并且,自然地逻辑地伴随着一个韵律区pA,pA是该pW的子集。 1.3. 韵律区与音乐 首先,请参考:“五度相生律”(Pythagorean tuning)。 在上文Fig.1中,[X2, X3, X4, X5] = X1*[2/3, 3/4, 4/3, 3/2] (四向比)。 如果把X1当作音符C1(音乐的"1 do"),根据音乐的“五度相生律”:C1的上四度是音符F1(乐音的"4 fa"),且 F1=C1*4/3, 由此可见四向比的节点X4就是音符F1;C1的上五度是音符G1(乐音的"5 so"),且G1=C1*3/2, 可见节点X5就是音符G1;C1的下五度是音符F0,且 F0=C1*2/3, 可见X2就是F0;C1的下四度是音符G0, 且G0=C1*3/4, 可见X3就是G0。 由此可见,“Pythagorean tuning” 描述的本质是韵律结构的“四向比”。 同理可推:G1的下四度是音符D1, D1=G1*3/4 =C1*9/8;D1的上五度是音符A1, A1=D1*3/2=C1*3/2*9/8;A1的下四度是音符E1, E1=A1*3/4 =C1*9/8*9/8;E1的上五度是音符B1, B1=E1*3/2=C1*3/2*9/8*9/8。因此,一个倍频级内的七个音符(CDEFGAB)与C1的比分别是:[1,k, k*k, 4/3, 3/2,3/2*k, 3/2*k*k] (k=9/8),显然它们都在韵律系数表pCT中,即:七个音符就是该主韵律区的七个节点。其它倍频级也如此,它们是一一对应的。 同一个韵律区中的节点(黑色实点)被人类“感觉为音乐点”。这些节点(音符)依照节拍组合成一个序列,按照它们的频率演奏,就是人们喜爱的音乐。由此可见:音乐只是PS的主韵律区PA的听觉现象。
1.4 在主韵区的两侧是韵律网的“阴律区”。阴律区就象主韵区的一个个阴子,例如左侧是“下阴-1区”(蓝色弧线内),右侧是“上阴+1区”(绿色弧线内)...。任何韵区都具有主韵区的一切性质,它们是相似的。相邻韵区之间比是3^7 / 2^11。 在Fig.2图中两条红色弧线分别是各级F点的连线(示意线)和各级B点的连线,构成韵律区的左右边界,两条界线之间是C1的主韵律区。 例如:节点F1,它右侧的两条红色的关系弧线(3/4,3/2)是主韵区的左边界,它左侧的两条蓝色的关系弧线(2/3,4/3)是“下阴韵-1区”的右边界。 例如:节点B1,它左侧的两条红色的关系弧线(2/3,4/3)是主韵区的右边界,它右侧的两条绿色的关系弧线(3/4,3/2)是“上阴韵+1区”的左边界。 这就是音乐中两个半音F,B在韵律结构中的物理意义,它们自然地逻辑地存在着,界定着各韵律区。这一切为我们进一步研究人类意识提供了窗口和参考。 至此,韵律结构作为“模拟信号的分组编码”的特色初步呈现。 事实上,韵律结构是一种数据结构,也是音频信号(模拟信号)的分组编码方式。
[分析与小结]:众所周知,人类意识对音乐有灵感,而且,各人有自己的理解。而音乐的本质是这些乐点之间的韵律比关系。这表明“人类意识具备识别韵律结构PS的能力”。 另外,很多人知道:某段乐曲中可以没有基频C1出现,也不影响该音乐听效。这表明:听觉对音乐的识别,不是直接地依赖各音与C1的比值,而是依赖韵律结构的架构,简称“PS架构”或“PSFrame”,PSFrame是一个韵律网pW或一个韵律区pA,存在于人类大脑,为意识所用。正是这PSFrame,其中映射着各音与C1的韵律比关系。 由于PS的相似性:任意一个频点都可以作基频;所有的韵律网相似;所有的韵律区相似。因此,PS的“模式匹配”(移动缩放旋转等)特别简单而且高效。由于PSFrame模式存在,任何音乐或声音漂过,听觉很快就能定位,识别和鉴别。 这一观点在下文中还将进一步被证明:人类意识的“语言”功能,其中元音的共振峰与韵律结构的另一个要素“蜗节VK(Volute Knot)”关系密切。 【参考】: 人类意识中存在着韵律结构,即:PS架构(PSFrame),并且它是“与生俱来”。该PSFrame存在的形态尚不清楚,但是有一点可参考:PS中只有一种运算,即:“对比”。而对比的双方(分子/分母)中都只有两个因子2和3(看上文:“韵律系数表pCT”)。 到此,建议读者再回看本文上部,然后再往下看下文。
2. 蜗节采样与元音的蜗节属性(PS的应用之二) 2.1 语音信号的分组编码:蜗节VK,蜗点域vkPD,蜗节系统VK System: 在Fig.2中,在一个八度内(music),主韵区[C,D,E,F,G,A,B],连同下阴-1区的[d,e]和上阴+1区的f,g,a,共计12个点组成集合[de CDE FGAB fga],称之一个“蜗节”(Volute Knot) 简称”VK”。这12个点称之为“蜗点”记作“vkP”。这些蜗点来自相邻的韵律区,因此: [d,e]=[D,E]*2^11/3^7 [f,g,a]=[ F,G,A]*3^7 / 2^11 这12个蜗点共同组成了“一个八度”的频区,即每个蜗点vkP都有自己的一段频率区域(大约“半度音程”),称作“蜗点域”,记作“vkPD”:它从本蜗点频率到下一个蜗点频率(开区)。 [注]:音乐的“十二平均律”与PS的VK的12点,只是在数值近似,本质上毫无关系。 VK *2^n 是蜗节系统 “VK System”,它就是语音信号(模拟信号)的分组编码。VK System是一串系列的韵律比。按照VK System,用它们的蜗点域vkPD对音例的各时段的频域信号采样,称作蜗节采样“VK Sampling”。
蜗节采样表明:元音的主要共振峰Formant与蜗点域vkPD关系密切,元音ae具有蜗节采样属性2.2 蜗节采样与元音的蜗节属性 本文以中国汉语的六个单元音为例展开讨论。英语等其它语种的元音[a],[e],[o],[u],[i]等可以比照分析。 [说明]:以下两表是两个元音音例一个时段的主要共振峰被采样情况。分别是:“频率行”(分三段显示);“幅强行”(红色或粉色标识的是一个共振峰的主部);“vkPD行”(其中连续相同的蜗符表示是同一蜗点域采中了一个共振峰的多个频点(由蓝色或绿色标识))。 [符号说明]:例如“1248~1296(B)”表示一个共振峰采样。其中,"1248~1296"表示聚焦1248Hz到1296Hz看“幅强行”的共振峰,因此"1248~1296"也是该共振峰的标识;括号中“B”表示是蜗点域B采样,记作“vkPD(B)”。“12th”表示第12时段。 2.2.1 "Me1"是元音[e]音例,下表是它的第12时段的主要部分。(主峰>12.0;它的最强峰1312 Hz(70.2)在第9时段)
分析:上面是元音“Me1”的第12时段,主要共振峰Formant的主要部分与蜗点域vkPD关系密切。 其中三个主要共振峰Formant “896~928(F)”; “1072~1104(g)”; “1248~1296(B)” 由三个蜗点域vkPD分别一峰一蜗采样,它们是(F,g,B),可以写成vkPD(F,g,B)。这几个vkPD中的能量比起它们的两侧强很多;三个Formant的主要部分(红色)分别落在三个vkPD(F,g,B 蓝色)的频区内。三个vkPD(F,g,B)分别采中了三个Formant能量的主要部分。另外,Formant "352~368~384"由两个相邻的vkPD(d,D)联合采样,各为“左山坡”“右山坡” ;Formant "528~544~576" 由两个相邻的vkPD (g,A) 联合采样,也是各为“左山坡”“右山坡”。 本例的5个主要Formant的采样事实,给我们提供了两方面的信息:1)这些主要“Formant”的音是按照该“vkPD”(频段)产生的音,该vkPD称作该Formant的“目标vkPD”(发音目标);2)这5个Formant所在频段就是蜗节系统的7个vkPD(这给后续研究提供了重要线索)。 2.2.2 音例"za7"是元音[a],以下是“za7”第13,14时段频域主要数据:
分析:本例中主要的Formant与vkPD关系密切。 先看第14时段,其中4个主要的Formants:832~880(F); 1056~1120(A); 1248~1312(C); 1408~1472(D);与4个vkPD(F,A,C,D),都是一峰(Formant)一蜗(vkPD)采样,都是Formant的主要能量(红色)分别落在vkPD (蓝色)的频区内。这几段采样实况鲜明表达,本元音音例具有“元音的蜗节属性”:这4个主要Formant的音是按照4个vkPD(频段)同时发出的音;这4个Formant所在频段就是蜗节系统的4个vkPD(域)。 有的时侯语音共振峰是个“大波”(频区宽能量强的共振峰。本文只讨论350Hz以上的大波),它由多个(多于一个)vkPD采样。例如本例第13时段,共振峰1008~1040~1120(g,A)和 1200~1248~1312(B,C) ,是两个大波。它们在前时段(12th)由前一个vkPD挤来,又在第14时段分别收缩到1056~1120(A), 1248~1312(C)。 许多音例中都能看到该大波共振峰演变的过程,它们有的诞生于一个vkPD,有的在该音的中途或在结尾收缩于一个vkPD,例如("Ma2" ,"re8","za7")。 在众多的音例中,尽管有些主峰不断地在变化,但是大多数大波的主峰部分总是:或由一个vkPD采样,或由两个相邻的vkPD共同采样各为左坡右坡,例如("Mu2" 320~416; "zo8" 432~448; ”oo12” 320~336)。特别是后者(两个vkPD采样),其中似乎只强调了主峰两侧vkPD身份,然而两侧强度经常不对称。所有这些都强调了大波共振峰具有“蜗节属性”。在VK系统下,语音变化的脉络显得有条有理。蜗节采样是语音信号处理的天配的工具。更详细资料请点击右边栏中:“证据数据查询”的彩色文字链接,看附件: "T-VK Sampling-[a][e]". 2.3 分析与结论: 以上两例中主要的Formant与vkPD关系密切。在元音a,e的其它音例中也多数如此。事实上,该发音越准确,其中主要Formant与目标vkPD的密切关系展现得越鲜明。 [结论]:在元音中,其主要Formant的主要能量,或包含在一个目标vkPD内;或包含在两个相邻的目标vkPD内,各为左坡右坡。这一特征称作“元音本身具有的蜗节VK采样属性”,简称“VK属性”。元音具有该“(蜗节)VK属性”。蜗节采样是语音分析的天配的工具。 [TIM猜想]:人类意识是依赖韵律结构作为语音的分组编码。表现在说话时,人类意识是依赖蜗节系统的一系列相对比作刻度尺,用来把握和指挥口腔中各发音器锁定在目标vkPD,即功能频段发音,从而产生几个Formant,听起来便是该元音。 大量证据数据表明:元音具有蜗节属性。蜗节系统是意识控制发音的刻度尺2.4 蜗节采样概述: 众多音例表明:语音本身具有“元音的蜗节属性”。 但是由于现代技术有限,不是所有的语音中都能看到该属性。目前条件下只能在中高频区部分地显现出该属性,例如[a],[e]两元音中能看到该属性。低频区看不到共振峰全貌。元音[i]的特征频带很高,发音中很难形成强劲的且高耸的共振峰,只能看到被各蜗点域采中的“一片隆起”(语言素质高的发音中能够看到该属性)。 人们平常说话的语音可能不很准:(针对goal vkPD)或峰顶偏移,或范围外溢,甚至发音中途变调。这些技术上的困难都不影响元音的本性“VK属性”。详细资料请点击中间栏中“数据证据查询”的彩色文字链接,见附件:《T_元音蜗节采样_[o][u]》。《T_元音蜗节采样_[i][v]》。 3. 展望: 本文以中国汉语的六个单元音为例,论说了“元音的蜗节属性”,英语等其它语种的元音a,e,o,u,i也可以比照分析。 PS还有更高等的形态:理想的智慧体。 假设一个intelligent body,其中有无数微小的元素。每个元素都有最敏感的特征频率CF(或其它形态,例如:量子纠缠),它能接收该频率信号(或其它形态),同时能以CF*[2/3, 3/4, 4/3, 3/2]的频率向周边呼唤。不难想象:理想的智慧体中那些韵律相关点会形成一个个的网(象本文一开始说的那样)。下图是两轴线PS中一个蜗节的参考示意图。三维蜗卷多轴线分布的PS,其中的韵律关系极其复杂,非本文能及。至今,韵律结构是研究人类意识的唯一通道。 [启示]: 韵律结构也是模拟信号的一种分组编码方式。韵律结构是人类意识对音频(模拟)信号的分组编码方法。 它以主韵律区为基本组,扩展为蜗节系统,用以控制语言的发音和听音。
The End
|
DownLoad: 点我 访问数:5258 |
|