耳鳴為非外部刺激產生的主觀聽覺感知,發病率逐年升高,越來越引起重視。經過調查發現,用某些音樂來緩解耳鳴、調節消極情緒、減壓有很好的效果,能打破耳鳴與不良情緒之間的惡性循環鏈,但重復循環的音樂對耳鳴治療效果不大。因此,本文提出了一種基于音樂數字設備接口(MIDI)技術和粉紅噪聲生成耳鳴康復分形聲的方法。試聽實驗結果表明該方法生成的分形片段相似但又不完全重復,沒有音調突變,對用康復聲進行耳鳴治療有借鑒意義。
引用本文: 汪璐, 何培宇, 潘帆. 基于音樂數字設備接口技術的耳鳴康復分形聲生成方法研究. 生物醫學工程學雜志, 2014, 31(4): 888-893. doi: 10.7507/1001-5515.20140167 復制
版權信息: ?四川大學華西醫院華西期刊社《生物醫學工程學雜志》版權所有,未經授權不得轉載、改編
引言
耳鳴的發病率逐年升高,嚴重影響著人們的生活質量,已經成為臨床迫切需要解決的難題[1]。臨床和基礎研究顯示大腦系統,如邊緣系統和自主神經系統,參與了耳鳴的產生[2-3]。由于耳鳴與聽覺中樞、邊緣系統、自主神經系統有密切的聯系,耳鳴可以與不良情緒互相影響并形成惡性循環的條件反射,而針對焦慮、憂郁的治療能改善耳鳴患者的生活質量,減弱耳鳴對生活的影響[4-5]。根據調查,約有50%的耳鳴患者有睡眠障礙,睡眠不足又會影響注意力集中,導致情緒激動、易怒。
Hann等[6]的研究表明,音樂對短期內緩解耳鳴有效,可以達到放松減壓的效果,但重復的音樂由于會喚醒記憶反而達不到預期的減壓放松效果。分形技術彌補了這種缺陷,將分形技術應用到音樂合成中,能產生可預測但又不單調,相似但與聽者記憶中的音樂沒有直接聯系的音樂,這種可變性恰好符合音樂康復的要求[7]。丹麥唯聽助聽器公司近年來將其助聽器加入了一種名為“禪”的輔助功能,針對聽力損失且伴有耳鳴的患者,利用分形技術產生音樂,其有效性在臨床得到了驗證[8-9]。經過調查發現,唯聽公司的帶有“禪”輔助功能的助聽器主要是針對伴有聽力損失的耳鳴患者,且價格昂貴,難以在我國進行普遍推廣。國內關于分形的文獻中很多提及了分形音樂的概念[10-14],主要是為音樂譜曲探索新方法,其產生技術及算法鮮有提及,并且國內在耳鳴及其情緒障礙的“特殊音樂聲”的生成技術研究方面一直處于空白。
因此,本文借助分形技術和音樂數字設備接口(musical instrument digital interface,MIDI),提出一種生成耳鳴康復分形聲的方法。MIDI格式文件通過將MIDI消息傳送給接收設備,產生某個聲音或執行動作,無需很大存儲空間。分形音樂是將一個不規則的碎片分裂成其他形狀,并且分裂出來的每一小部分都是原來的一部分,無論如何放大,聲波的形態都具有詳細的幾何結構,確保音樂的不可預見性和不重復性。一般的音樂具有會引起強烈情緒反應、吸引注意力的缺陷,所以本文利用分形音樂的音調節奏不會發生突然變化,可預測但又不單調,聽上去相似但與記憶中的片段沒有直接聯系的特點,提出這種耳鳴康復分形聲生成方法,對臨床上的耳鳴治療具有一定的參考價值。
1 MIDI簡介
MIDI是一種標準化的數據格式。MIDI格式文件不同于一般的wav文件,本身不包含波形數據,而是通過將MIDI消息(音符、控制參數等)傳送給接收設備,產生某個聲音或執行動作,所以生成的文件占據存儲空間少[15]。本文中生成的MIDI文件分別將每個通道的數據保存在不同的音軌上,且將歌曲的附加信息、歌曲速度和系統碼等內容放置在全局音軌上,將音符信息放置在音符音軌上。
MIDI中音符的表示范圍是 0~127,極高或極低的音在實際中幾乎不會出現,所以仿真中主要選取中間幾十個音符。全局音軌中主要用到的事件有:51h--樂曲速度,58h--節拍,59h--調號,2fh--音軌結束標志;音符音軌中主要用到的事件有:9xh--按下音符(松開音符用力度0按下音符代替),cxh--控制樂器[16]。仿真所用為Windows默認的Roland公司128個音色庫的通用合成器(general synthesizer,GS)標準音源。
2 白噪聲、布朗噪聲及粉紅噪聲簡介
噪聲隨時間變化的軌跡都是分形曲線。譜密度s(f)是噪聲在頻率f處的均方根漲落(波動),是表征噪聲時間相關性的一個重要量度。s(f)與f的關系可寫成:S(f)∝f-β,其中β是一個標準指數。β=0時為白噪聲,表現為最不規則,點與點之間完全不相關。β=1時,稱為1/f噪聲(又稱粉紅噪聲),它的不規則性介于上述兩者之間,在自然界中相當普遍。β=2時為布郎噪聲,在三種噪聲中它的相關性最大、最規則。
事實表明,美妙的音樂早就受到分形原理的支配。大多數令人愉快的音樂都是1/f噪聲[17]。Voss等[18-19]發現,幾乎所有的音樂旋律都在模仿1/f噪聲。在不同的1/f噪聲中,音樂把隨機性與確定性融為一體。如果取一篇樂譜,繪出音符隨時間的變化曲線,就會驚人地顯示它與1/f噪聲何其相似。由不同類型音樂實際繪出的旋律譜密度的曲線圖可知,盡管旋律不同,風格各異,但給出的曲線與1/f噪聲幾乎無異[20]。
3 利用分形技術合成耳鳴康復音的仿真過程
3.1 用白噪聲、布朗噪聲、粉紅噪聲生成音符
為增加對比性,下面通過仿真生成白噪聲、布朗噪聲、粉紅噪聲及其相對應的音符(設定1 024個音符)。
白噪聲:每次將6個骰子同時擲,并將6個結果相加(6~36之間)得到一個音符數據。若要產生1 024個音符,則需1 024個原始數據。布朗噪聲:如從中音C4開始,將C4對應21,每次擲一個骰子,將得到的1~6結果對應成下降幾位、上升幾位或保持原結果不變。粉紅噪聲:用n個骰子,產生2n個音符。用兩個骰子A、B產生4個音符的過程舉例,如表 1所示。根據兩個相鄰音符的位變化決定A、B的變化,并將A、B結果相加。
將三種噪聲映射出來的音符看成幅度隨時間變化的信號,如圖 1所示,則白噪聲映射出的音符信號功率譜密度與頻率呈現的冪律關系β近似等于0,布朗噪聲映射出的音符信號的β近似等于2,粉紅噪聲映射出的音符信號的β近似等于1,如圖 2所示。
圖1
三種噪聲生成音符對比
Figure1.
The notes generated by three noises
圖2
三種生成音符的功率譜密度分析
Figure2.
The power spectral density (PSD) of the three kinds of notes
分析其相關程度,如圖 3所示:白噪聲相關系數一直在零值附近波動,相鄰點的相關性不大;布朗噪聲越近的點越相關,從長遠看相關系數會下降到0;粉紅噪聲的相關性在短期內下降很快,但從長遠看來不會下降為0。
圖3
三種生成音符的相關程度對比
Figure3.
The correlation degree of the three kinds of notes
將以上三種方法產生的結果分別映射到對應的音符,設定以四分音符為一拍,每小節4拍,每個四分音符為0.5 s,則用Cakewalk軟件可以看到MIDI文件的五線譜圖,任取10小節如圖 4所示。
圖4
三種噪聲生成的音符
(a)白噪聲生成音符;(b)粉紅噪聲生成音符;(c)布朗噪聲生成音符
Figure4. Notes generated by three kinds of noises(a) notes generated by white noise; (b) notes generated by pink noise; (c) notes generated by Brown noise
從三幅五線譜圖中可以看出,白噪聲音符起伏較大,隨機性太強,因而聽上去刺耳[見圖 4(a)];布朗噪聲音符起伏變化很小,相關性太強,而聽上去沉悶[見圖 4(c)];不論白噪聲或是布朗噪聲都不能稱之為音樂,只有粉紅噪聲能夠達到隨機性與可預測性的平衡[見圖 4(b)],符合優美音樂的要求。有研究證明,以一段旋律的功率譜密度斜率β來衡量旋律的感知復雜度,在0.67<β<2.35范圍內的旋律才能稱得上是音樂[21]。近期的一項研究表明粉紅噪聲能引起更穩定的睡眠,提高睡眠質量[22],所以利用粉紅噪聲來生成耳鳴康復聲。
3.2 音高的分形結構
音樂的分形可以表現在一篇樂曲中相鄰兩個音符的音程i及其出現的頻率F呈現冪律關系:F=c/iD,其中,D是這篇樂曲的分形維度且不是整數,c為常數。或者將上式兩邊同時取對數,表示為log(F)=c-D×log(i),log(i)與log(F)的關系為以-D為斜率的線性關系。
表 2為仿真粉紅噪聲映射出的音符所產生的一組音高間隔(1 024個音符),log(i)與log(F)的關系如圖 5所示,近似為線性關系。
圖5
粉紅噪聲生成音符的分形結構分析
Figure5.
Fractal structure of notes generated by pink noise
分別抽取音程為2、4、8、16(1/2ε,ε=1,2,3,4)的音符組成新的樂曲[23],由圖 6可以看出,被削減的樂曲波動曲線仍與原始曲線相似,也就是說,雖然分形近似略去許多輪廓上的細節,但樂曲的基本聲學圖形保持不變,音樂最本質的聽覺式樣被保留下來了。且被削減的樂曲1、2、3、4的音符個數如表 3所示,對應的冪律關系如圖 7所示。
圖6
按音程規則抽取后的樂曲波動曲線
Figure6.
The fluctuation curves of music notes extracted by specific interval rules
圖7
按音程抽取后的音符個數分布關系
Figure7.
Distribution of the intervals after extraction from original notes
3.3 拍子和音樂多樣性的處理
有研究證明,巴赫、喬普林等的音樂作品的節奏具有分形結構[24]。我們也可以這樣理解,音樂中有拍子,且拍子出現的規律會有一定的“重復性”,通常我們無法預測下一個旋律的轉折點會怎樣演繹,但卻能在聆聽音樂的過程中預測到音樂的轉折點何時到來。
在本文中,采用L 系統方法來產生節奏,給定一個初始值,遵循某些產生規則,遞歸形成多個音符對應的時長。舉例,若定義產生規則:A→A B C,B→A B,C→B C。一輪迭代之后:ABCABBC,二輪迭代之后:ABCABBCABCABABBC……將A映射為半拍,B映射為一拍,C映射為兩拍,則將音符及其對應時長的變化視為時間及每個時間點對應的幅值的變化,并轉化到頻域觀察,分形結構如圖 8所示。
圖8
音符時長的分形結構
Figure8.
Fractal structure of notes duration
通過以上方法可以得到MIDI音樂文件的一個軌道中的音高和節奏元素,為增加可聽性,仿真中采用多軌音合成的方法。首先第1軌定義為全局音軌,用來存放樂曲速度、節拍等控制信息,第2、3、4軌分別用來存放音符信息,并將每一軌道賦予不同音色的樂器,音色選擇根據個體喜好而定,類似于樂曲中的不同聲部,調整每個軌道的播放速度,原理如圖 9所示,將第一聲部音符進行降調處理得到第二、三聲部,并賦予不同音色的樂器。
圖9
多樣性調節
Figure9.
Adjustment of the diversity of the music
4 仿真試聽結果
本次試聽人員為54名,采用的試聽片段為用本文方法仿真的結果,將其進行適當升降調處理,配上不同樂器生成3個具有相同節奏的2 min左右片段frag_f_l、frag_f_m和frag_f_h,試聽人員根據自己的喜好從三個片段中選擇一個作為frag_f;并采用了一個對照聲片段,該對照聲是frag_f從開頭截取10 s重復拼接成2 min的frag_r。測試結果如下:
試聽人員中51.85%選擇片段frag_f_l,35.19%選擇frag_f_m,12.96%選擇frag_f_h,表明不同聽者喜好不同的調號、音色,且大部分偏好音調較低的frag_f_l。
當要求試聽人員用0~10分表示聽到的兩個片段的舒緩放松的程度(0--聽過之后心情十分沉重,10--給人非常放松舒緩的感覺)時,反饋結果平均為:frag_f為5.81分,frag_r為4.91分;用0~10分表示在安靜學習、工作中播放會對自身造成的干擾程度(0--嚴重干擾,10--完全沒有任何干擾):frag_f為6.53分,frag_r為5.13分。說明frag_f令人放松舒緩的效果比frag_r效果好,不會在安靜時造成干擾。
對于片段frag_f:11.11%的試聽人員感覺有音調突變,88.89%未感覺有音調突變;3.70%的試聽人員認為能在聽過后哼出其曲調,96.30%認為不能哼出其曲調。而對于frag_r:38.89%感覺有音調突變,61.11%未感覺有音調突變;48.15%的試聽人員認為能在聽過后哼出其曲調,51.85%認為不能哼出其曲調。此項實驗表明大部分試聽者感覺frag_f的音調無突然變化,不能重復哼出其曲調。
試聽人員中認為frag_f中有完全一樣片段重復的占1.85%,只感覺有相似片段的占92.59%,完全聽不出有重復的占5.56%。認為frag_r有完全一樣片段重復的占48.15%,只感覺有相似片段的占48.15%,完全聽不出有重復的占3.70%。該結果表明frag_f給大部分試聽者的感覺是音調前后有相似片段,但沒有完全一樣的重復,對frag_r感覺有完全一樣的片段重復的比例明顯增加。
83.33%的試聽人員認為frag_f與frag_r有相同的片段,16.67%未聽出兩者有相同片段。可以看出,大部分試聽者都能聽出frag_f與frag_r中有相同的片段,這與frag_r是從frag_f的開頭截取10 s重復拼接成2 min的情況相符。
以上試聽實驗結果是對生成的音樂片段性質的主觀檢驗,在實際的臨床實踐中,需要根據不同耳鳴患者的具體情況,調節音樂的調號、速度、響度、音色等因素,生成能被患者接受的一種康復音。因此,臨床試驗需要選擇合適的耳鳴患者來進行,試驗結果反饋周期較長,筆者會在后續進行臨床試驗結果的報道。
5 結束語
粉紅噪聲隨時間的變化軌跡是一條分形曲線,且粉紅噪聲具有短時隨機性、長程相關性的特點,這恰恰達到一般受人喜愛的音樂具有的隨機性與可預測性的平衡,用粉紅噪聲映射產生的音符音調不會出現突然變化,具有不完全重復但又自相似的特性。MIDI技術生成的聲音片段占用存儲空間小,且可以根據個體差異調節不同的調號、速度、響度、音色等因素,可調性強。所以本文提出利用MIDI技術和粉紅噪聲生成一種治療耳鳴康復音的方法,對使用康復聲進行耳鳴治療具有一定的參考意義。
引言
耳鳴的發病率逐年升高,嚴重影響著人們的生活質量,已經成為臨床迫切需要解決的難題[1]。臨床和基礎研究顯示大腦系統,如邊緣系統和自主神經系統,參與了耳鳴的產生[2-3]。由于耳鳴與聽覺中樞、邊緣系統、自主神經系統有密切的聯系,耳鳴可以與不良情緒互相影響并形成惡性循環的條件反射,而針對焦慮、憂郁的治療能改善耳鳴患者的生活質量,減弱耳鳴對生活的影響[4-5]。根據調查,約有50%的耳鳴患者有睡眠障礙,睡眠不足又會影響注意力集中,導致情緒激動、易怒。
Hann等[6]的研究表明,音樂對短期內緩解耳鳴有效,可以達到放松減壓的效果,但重復的音樂由于會喚醒記憶反而達不到預期的減壓放松效果。分形技術彌補了這種缺陷,將分形技術應用到音樂合成中,能產生可預測但又不單調,相似但與聽者記憶中的音樂沒有直接聯系的音樂,這種可變性恰好符合音樂康復的要求[7]。丹麥唯聽助聽器公司近年來將其助聽器加入了一種名為“禪”的輔助功能,針對聽力損失且伴有耳鳴的患者,利用分形技術產生音樂,其有效性在臨床得到了驗證[8-9]。經過調查發現,唯聽公司的帶有“禪”輔助功能的助聽器主要是針對伴有聽力損失的耳鳴患者,且價格昂貴,難以在我國進行普遍推廣。國內關于分形的文獻中很多提及了分形音樂的概念[10-14],主要是為音樂譜曲探索新方法,其產生技術及算法鮮有提及,并且國內在耳鳴及其情緒障礙的“特殊音樂聲”的生成技術研究方面一直處于空白。
因此,本文借助分形技術和音樂數字設備接口(musical instrument digital interface,MIDI),提出一種生成耳鳴康復分形聲的方法。MIDI格式文件通過將MIDI消息傳送給接收設備,產生某個聲音或執行動作,無需很大存儲空間。分形音樂是將一個不規則的碎片分裂成其他形狀,并且分裂出來的每一小部分都是原來的一部分,無論如何放大,聲波的形態都具有詳細的幾何結構,確保音樂的不可預見性和不重復性。一般的音樂具有會引起強烈情緒反應、吸引注意力的缺陷,所以本文利用分形音樂的音調節奏不會發生突然變化,可預測但又不單調,聽上去相似但與記憶中的片段沒有直接聯系的特點,提出這種耳鳴康復分形聲生成方法,對臨床上的耳鳴治療具有一定的參考價值。
1 MIDI簡介
MIDI是一種標準化的數據格式。MIDI格式文件不同于一般的wav文件,本身不包含波形數據,而是通過將MIDI消息(音符、控制參數等)傳送給接收設備,產生某個聲音或執行動作,所以生成的文件占據存儲空間少[15]。本文中生成的MIDI文件分別將每個通道的數據保存在不同的音軌上,且將歌曲的附加信息、歌曲速度和系統碼等內容放置在全局音軌上,將音符信息放置在音符音軌上。
MIDI中音符的表示范圍是 0~127,極高或極低的音在實際中幾乎不會出現,所以仿真中主要選取中間幾十個音符。全局音軌中主要用到的事件有:51h--樂曲速度,58h--節拍,59h--調號,2fh--音軌結束標志;音符音軌中主要用到的事件有:9xh--按下音符(松開音符用力度0按下音符代替),cxh--控制樂器[16]。仿真所用為Windows默認的Roland公司128個音色庫的通用合成器(general synthesizer,GS)標準音源。
2 白噪聲、布朗噪聲及粉紅噪聲簡介
噪聲隨時間變化的軌跡都是分形曲線。譜密度s(f)是噪聲在頻率f處的均方根漲落(波動),是表征噪聲時間相關性的一個重要量度。s(f)與f的關系可寫成:S(f)∝f-β,其中β是一個標準指數。β=0時為白噪聲,表現為最不規則,點與點之間完全不相關。β=1時,稱為1/f噪聲(又稱粉紅噪聲),它的不規則性介于上述兩者之間,在自然界中相當普遍。β=2時為布郎噪聲,在三種噪聲中它的相關性最大、最規則。
事實表明,美妙的音樂早就受到分形原理的支配。大多數令人愉快的音樂都是1/f噪聲[17]。Voss等[18-19]發現,幾乎所有的音樂旋律都在模仿1/f噪聲。在不同的1/f噪聲中,音樂把隨機性與確定性融為一體。如果取一篇樂譜,繪出音符隨時間的變化曲線,就會驚人地顯示它與1/f噪聲何其相似。由不同類型音樂實際繪出的旋律譜密度的曲線圖可知,盡管旋律不同,風格各異,但給出的曲線與1/f噪聲幾乎無異[20]。
3 利用分形技術合成耳鳴康復音的仿真過程
3.1 用白噪聲、布朗噪聲、粉紅噪聲生成音符
為增加對比性,下面通過仿真生成白噪聲、布朗噪聲、粉紅噪聲及其相對應的音符(設定1 024個音符)。
白噪聲:每次將6個骰子同時擲,并將6個結果相加(6~36之間)得到一個音符數據。若要產生1 024個音符,則需1 024個原始數據。布朗噪聲:如從中音C4開始,將C4對應21,每次擲一個骰子,將得到的1~6結果對應成下降幾位、上升幾位或保持原結果不變。粉紅噪聲:用n個骰子,產生2n個音符。用兩個骰子A、B產生4個音符的過程舉例,如表 1所示。根據兩個相鄰音符的位變化決定A、B的變化,并將A、B結果相加。
將三種噪聲映射出來的音符看成幅度隨時間變化的信號,如圖 1所示,則白噪聲映射出的音符信號功率譜密度與頻率呈現的冪律關系β近似等于0,布朗噪聲映射出的音符信號的β近似等于2,粉紅噪聲映射出的音符信號的β近似等于1,如圖 2所示。
圖1
三種噪聲生成音符對比
Figure1.
The notes generated by three noises
圖2
三種生成音符的功率譜密度分析
Figure2.
The power spectral density (PSD) of the three kinds of notes
分析其相關程度,如圖 3所示:白噪聲相關系數一直在零值附近波動,相鄰點的相關性不大;布朗噪聲越近的點越相關,從長遠看相關系數會下降到0;粉紅噪聲的相關性在短期內下降很快,但從長遠看來不會下降為0。
圖3
三種生成音符的相關程度對比
Figure3.
The correlation degree of the three kinds of notes
將以上三種方法產生的結果分別映射到對應的音符,設定以四分音符為一拍,每小節4拍,每個四分音符為0.5 s,則用Cakewalk軟件可以看到MIDI文件的五線譜圖,任取10小節如圖 4所示。
圖4
三種噪聲生成的音符
(a)白噪聲生成音符;(b)粉紅噪聲生成音符;(c)布朗噪聲生成音符
Figure4. Notes generated by three kinds of noises(a) notes generated by white noise; (b) notes generated by pink noise; (c) notes generated by Brown noise
從三幅五線譜圖中可以看出,白噪聲音符起伏較大,隨機性太強,因而聽上去刺耳[見圖 4(a)];布朗噪聲音符起伏變化很小,相關性太強,而聽上去沉悶[見圖 4(c)];不論白噪聲或是布朗噪聲都不能稱之為音樂,只有粉紅噪聲能夠達到隨機性與可預測性的平衡[見圖 4(b)],符合優美音樂的要求。有研究證明,以一段旋律的功率譜密度斜率β來衡量旋律的感知復雜度,在0.67<β<2.35范圍內的旋律才能稱得上是音樂[21]。近期的一項研究表明粉紅噪聲能引起更穩定的睡眠,提高睡眠質量[22],所以利用粉紅噪聲來生成耳鳴康復聲。
3.2 音高的分形結構
音樂的分形可以表現在一篇樂曲中相鄰兩個音符的音程i及其出現的頻率F呈現冪律關系:F=c/iD,其中,D是這篇樂曲的分形維度且不是整數,c為常數。或者將上式兩邊同時取對數,表示為log(F)=c-D×log(i),log(i)與log(F)的關系為以-D為斜率的線性關系。
表 2為仿真粉紅噪聲映射出的音符所產生的一組音高間隔(1 024個音符),log(i)與log(F)的關系如圖 5所示,近似為線性關系。
圖5
粉紅噪聲生成音符的分形結構分析
Figure5.
Fractal structure of notes generated by pink noise
分別抽取音程為2、4、8、16(1/2ε,ε=1,2,3,4)的音符組成新的樂曲[23],由圖 6可以看出,被削減的樂曲波動曲線仍與原始曲線相似,也就是說,雖然分形近似略去許多輪廓上的細節,但樂曲的基本聲學圖形保持不變,音樂最本質的聽覺式樣被保留下來了。且被削減的樂曲1、2、3、4的音符個數如表 3所示,對應的冪律關系如圖 7所示。
圖6
按音程規則抽取后的樂曲波動曲線
Figure6.
The fluctuation curves of music notes extracted by specific interval rules
圖7
按音程抽取后的音符個數分布關系
Figure7.
Distribution of the intervals after extraction from original notes
3.3 拍子和音樂多樣性的處理
有研究證明,巴赫、喬普林等的音樂作品的節奏具有分形結構[24]。我們也可以這樣理解,音樂中有拍子,且拍子出現的規律會有一定的“重復性”,通常我們無法預測下一個旋律的轉折點會怎樣演繹,但卻能在聆聽音樂的過程中預測到音樂的轉折點何時到來。
在本文中,采用L 系統方法來產生節奏,給定一個初始值,遵循某些產生規則,遞歸形成多個音符對應的時長。舉例,若定義產生規則:A→A B C,B→A B,C→B C。一輪迭代之后:ABCABBC,二輪迭代之后:ABCABBCABCABABBC……將A映射為半拍,B映射為一拍,C映射為兩拍,則將音符及其對應時長的變化視為時間及每個時間點對應的幅值的變化,并轉化到頻域觀察,分形結構如圖 8所示。
圖8
音符時長的分形結構
Figure8.
Fractal structure of notes duration
通過以上方法可以得到MIDI音樂文件的一個軌道中的音高和節奏元素,為增加可聽性,仿真中采用多軌音合成的方法。首先第1軌定義為全局音軌,用來存放樂曲速度、節拍等控制信息,第2、3、4軌分別用來存放音符信息,并將每一軌道賦予不同音色的樂器,音色選擇根據個體喜好而定,類似于樂曲中的不同聲部,調整每個軌道的播放速度,原理如圖 9所示,將第一聲部音符進行降調處理得到第二、三聲部,并賦予不同音色的樂器。
圖9
多樣性調節
Figure9.
Adjustment of the diversity of the music
4 仿真試聽結果
本次試聽人員為54名,采用的試聽片段為用本文方法仿真的結果,將其進行適當升降調處理,配上不同樂器生成3個具有相同節奏的2 min左右片段frag_f_l、frag_f_m和frag_f_h,試聽人員根據自己的喜好從三個片段中選擇一個作為frag_f;并采用了一個對照聲片段,該對照聲是frag_f從開頭截取10 s重復拼接成2 min的frag_r。測試結果如下:
試聽人員中51.85%選擇片段frag_f_l,35.19%選擇frag_f_m,12.96%選擇frag_f_h,表明不同聽者喜好不同的調號、音色,且大部分偏好音調較低的frag_f_l。
當要求試聽人員用0~10分表示聽到的兩個片段的舒緩放松的程度(0--聽過之后心情十分沉重,10--給人非常放松舒緩的感覺)時,反饋結果平均為:frag_f為5.81分,frag_r為4.91分;用0~10分表示在安靜學習、工作中播放會對自身造成的干擾程度(0--嚴重干擾,10--完全沒有任何干擾):frag_f為6.53分,frag_r為5.13分。說明frag_f令人放松舒緩的效果比frag_r效果好,不會在安靜時造成干擾。
對于片段frag_f:11.11%的試聽人員感覺有音調突變,88.89%未感覺有音調突變;3.70%的試聽人員認為能在聽過后哼出其曲調,96.30%認為不能哼出其曲調。而對于frag_r:38.89%感覺有音調突變,61.11%未感覺有音調突變;48.15%的試聽人員認為能在聽過后哼出其曲調,51.85%認為不能哼出其曲調。此項實驗表明大部分試聽者感覺frag_f的音調無突然變化,不能重復哼出其曲調。
試聽人員中認為frag_f中有完全一樣片段重復的占1.85%,只感覺有相似片段的占92.59%,完全聽不出有重復的占5.56%。認為frag_r有完全一樣片段重復的占48.15%,只感覺有相似片段的占48.15%,完全聽不出有重復的占3.70%。該結果表明frag_f給大部分試聽者的感覺是音調前后有相似片段,但沒有完全一樣的重復,對frag_r感覺有完全一樣的片段重復的比例明顯增加。
83.33%的試聽人員認為frag_f與frag_r有相同的片段,16.67%未聽出兩者有相同片段。可以看出,大部分試聽者都能聽出frag_f與frag_r中有相同的片段,這與frag_r是從frag_f的開頭截取10 s重復拼接成2 min的情況相符。
以上試聽實驗結果是對生成的音樂片段性質的主觀檢驗,在實際的臨床實踐中,需要根據不同耳鳴患者的具體情況,調節音樂的調號、速度、響度、音色等因素,生成能被患者接受的一種康復音。因此,臨床試驗需要選擇合適的耳鳴患者來進行,試驗結果反饋周期較長,筆者會在后續進行臨床試驗結果的報道。
5 結束語
粉紅噪聲隨時間的變化軌跡是一條分形曲線,且粉紅噪聲具有短時隨機性、長程相關性的特點,這恰恰達到一般受人喜愛的音樂具有的隨機性與可預測性的平衡,用粉紅噪聲映射產生的音符音調不會出現突然變化,具有不完全重復但又自相似的特性。MIDI技術生成的聲音片段占用存儲空間小,且可以根據個體差異調節不同的調號、速度、響度、音色等因素,可調性強。所以本文提出利用MIDI技術和粉紅噪聲生成一種治療耳鳴康復音的方法,對使用康復聲進行耳鳴治療具有一定的參考意義。

