第二節 歷史比較法的内容
印歐語研究的輝煌成就得益於歷史比較法(Comparative Method),歷史比較法也是迄今爲止研究語言歷史最爲成功和有效的方法。它通過比較親屬語言來追溯它們共同的原始形式。歷史比較法不是僅僅局限于比較親屬語的語音,也可以用來比較親屬語的語義、形態、句法,不過語音比較最爲成功,也是比較法得以存在的基石。拿語音來説,就是通過比較各親屬語言的同源詞(cognate)的語音形式來追溯和構擬它們的原始讀音,同時説明從原始形式到各語言中語音的演變途徑。具體來説,歷史比較法的目標有三個:
構擬原始母語
解釋各親屬語言的演變歷史和譜系關係
創建語言演變理論
不過,這三個目標並不是獨立、無關的,而是相互依存的。比較法只是用於親屬語言的比較研究,倒不是説比較法對確立親屬語言没有作用。最早假設語言間有親屬譜系關係都來自於語言學家的直覺觀察,比如瓊斯根據梵語、希臘語、拉丁語等動詞構詞形態的相似判斷它們來源於一個共同母語;早期人們認爲漢語、越南語、台語等是親屬語言,也是出自於語言學家的直覺感受:因爲這些語言的音節結構、語音特點有驚人的相似。但是,親屬語言的最終確認必須經過比較法的檢驗。也就是説要看在假設有親屬關係的語言裏,基本詞彙的語音形式是不是有成系統的,可以重複的語音對應。没有建立成系統、可重複的語音對應,那麽這種所謂的親屬語言還只是停留在假設的階段。表2.01是諸語言中基本詞彙的語音形式有系統的對應(根據Campbell 2004重新編排):
表2.01
意大利、西班牙、葡萄牙語中的k,對應於法語的ʃ或k,而法語的ʃ和k出現是有條件的:
kʃ /_____{前,不圓唇元音}
k其他條件
所以意大利、西班牙、葡萄牙語中的k,對應於法語的ʃ,如果後面的音段是前不圓唇元音;在其他情況下則對應於法語的k。有諸如上述同源詞語音形式的系統對應,我們才可以確認意大利語、葡萄牙語、西班牙語、法語是有譜系關係的親屬語言。
語言親屬關係確定以後,就語音比較而言,比較法的基本步驟有:
第一,在親屬語言裏初步選定候選同源詞(putative cognate set)。同源詞的選擇一般在100-200基本詞彙裏,如果有構詞形態(morphological paradigm),從構詞形態選擇同源詞也是較爲可行的方法。選擇同源詞從音義相同、相似開始。
第二,在這些候選同源詞裏建立語音對應關係,確定正式同源詞同時摒棄不符合語音對應的候選同源詞。如根據表2.01可以建立意大利語、西班牙語、葡萄牙語和法語的這些詞彙有如下語音對應:
第三,構擬原始形式,並解釋以後的演變。上述四種語言兩套語音對應k—k,k—ʃ有三種可能的構擬:原始形式是*k,ʃ則是以後的變化;原始形式是*ʃ,k是以後的變化;原始形式既非*k,也非*ʃ,而是第三種*。根據音變的經濟性、自然性以及少數服從多數的原則,選擇*k作爲原始形式,k到ʃ是一種音變關係:
*kʃ /_____{前,不圓唇元音}
第四,根據語音對應關係及音變的方向、條件等尋找更多的同源詞。有了一些語音對應關係,也知道了一些音變的方向,我們就可以以這些對應關係爲線索找到更多的同源詞。
第五,構擬原始語言的音系、音節結構。構擬原始語言的音系、音節結構既要考慮到語音的系統性、也要顧及世界語言語音的總體類型和共性。這方面的例子有原始印歐語輔音的喉音化理論(glottalic theory)、原始印歐語的擦音選擇等。
第六,建立一個原始語言下的譜系樹(Stammbaum or family tree)。譜系樹中的下位語言分類必須以“共用創新”(shared innovation)爲標準分類。解釋各親屬語言的演變歷史和譜系關係就是要對假設的原始母語作下位分類(subgrouping)。下位分類是根據“共用創新”原則把語系(language family)分作語族、語支、語言、方言等,藉此看出它們之間的親疏遠近程度。十九世紀中葉施萊赫爾就提出印歐語的譜系樹圖譜(Schleicher 1871),二十世紀初發現了Anatolian和Tocharian兩大語族後,印歐語的下位分類才得以完成。原始印歐語分爲十大語族,它們是:Anatolian,Indo-Iranian,Greek,Italic,Celtic,Germanic,Armenian,Tocharian,Balto-Slavic,Albanian。各語族還有語支、語言等下位分類,比如圖2.01是日爾曼語的下位分類樹狀圖:
圖2.01
上圖中日爾曼語族與其他印歐語族的分類看是否經歷了格林姆定律,經歷的語言就是日爾曼語族,否則就是非日爾曼語族;原始西日爾曼語支跟原始東日爾曼語支的分類標準是看語言裏是否發生i-umlaut音變,如果是,就是西日爾曼語支,否則是東日爾曼語支(哥德語);在西日爾曼語支中古英語跟高地德語的分類標準就是看是否經歷了高地德語的輔音音變(High Germanic Consonant Shift),古英語没有這個特徵所以跟高地德語區分開來。語言之間的親疏遠近關係可以根據語言譜系樹狀圖來判斷,比如英語與德語的關係比英語與法語的來得近。
第七,編寫同一語系或語族的同源詞詞典。
雖然比較法的操作大致可以按上述七個步驟進行,但是在實際的操作中各步驟之間界限和先後並不是絶對分割的,很多的時候這些步驟是重疊的,有時步驟還要倒過來反復修正前面的結果。比如考慮到語音的系統性和世界語言的語音類型,要倒過來重新修訂構擬的原始語音;隨著同源詞和語音對應規則的增加,可能把先前不認爲有親屬關係的語言也列入同一譜系樹下。
在運用比較法時有五點需要特别指出:
第一,同源詞的尋求是建立在基本詞彙(basic vocabulary)或基本形態格式(basic inflectional forms)中語音形式的系統對應基礎上的,而親屬語言的建立就是看所比較語言的基本詞彙或基本形態格式的語音形式有没有系統的對應。選擇基本詞彙和基本形態格式就是因爲它們不易被其他語言取代。比如在英語裏只有百分之十的基本詞彙是外來的,百分之九十是固有的。而非基本詞彙中被外來語言取代的情形很多,有人統計發現英語中百分之七十左右的非基本詞彙是外來的(Thomason & Kaufman 1988、Windord 2003)。可見語言中最爲基本的核心基本詞不容易受其他語言侵蝕和替代。通常我們會選擇100到200個基本詞彙作爲親屬語言比較的開端,並據此來尋找同源詞。東南亞語言的譜系分類長期以來存在著爭議,1937年李方桂先生發表《中國語言與方言》,把漢藏語系分爲漢台語和藏緬語兩大語族,以後他把漢藏語系的譜系修改爲漢語族、侗台語族、苗瑶語族和藏緬語族(Li 1973)。美國學者白保羅(Paul K. Benedict)在上世紀40年代提出了不同的分類,在他上世紀七十年代修訂的著作中把漢藏語系下轄爲漢語族和藏—克倫語族兩個分支,認爲侗台、苗瑶跟漢藏語系没有發生學上的關係(Benedict 1972)。由此拉開了漢藏語系分類的爭議序幕。此爭議的關鍵是如何看待漢語跟侗台、苗瑶語中存在的大量具有語音對應關係的詞。陳保亞曾用斯瓦迪什200基本詞表來觀察漢語和侗台語的關係,發現最基本的前100核心詞(他稱爲高階詞)語音對應大大少於次核心的後100詞(他稱爲低階),據此他斷定漢語與侗台語屬於接觸關係而非同源關係(陳保亞1996)。陳氏的基本詞在擇詞方面存在著某些瑕疵,比如同是基本詞,哪類容易或不容易被借貸往往有區域性特點,不能一概而論。在印歐語裏,低位數詞一般不容易被借貸,但是在東南亞語言裏,由於語言接觸頻繁,低位數詞被借貸的情形是很普遍的。但是陳氏的基本思路和方法應予肯定,即語言借用可以是“無界”的,各語言成分的借用却是“有階”的。即高階詞比低階詞更爲穩定,更不易被借用。在語言接觸頻繁的語言中確定語言的發生學關係必須充分考慮到借用的“無界”性和“有階”性的特徵。基本形態各式的對應也是建立親屬語言以及鑒定語言親屬關係遠近的一個標誌。中古英語受法語的滲透非常深,但是它的形容詞原級、比較級、最高級的構詞形態是跟德語而不是法語對應的:
顯然英語跟德語的關係更爲密切。
第二,語音的系統的對應是指同源詞的數量不能是孤立的兩三個,而是具有一定的數量。無論是格林姆定律,格拉斯曼定律還是維爾納定律,它們所管轄的同源詞是成批的、大量的。只有這樣,才能在這些數量衆多的同源詞裏存在著系統的、可重複的語音對應關係。親屬語言分化的時間越久遠,所具有的同源詞數量必定越少。不過,如果僅用一兩個或幾個孤立的“對應詞”來設法説明語言間有親屬關係,或有遠距離親屬關係,其本身已經不具備歷史比較法同源詞的語音對應要有系統性、可重複性的先決條件,或者可以説這種比較不屬於嚴格意義的經典歷史比較法(the Classical Comparative Method)。
第三,比較法重視同源詞的語音對應規則(regularity of the sound correspondence),而不是簡單的讀音相同或相似。從同一母語分化出來的語言,分化的時間越久遠,同源詞的語音面貌就越不相似。梅耶曾舉過法語、意大利語和西班牙語“八”的例子,在這些語言裏“八”的讀音形式分别是huit,otto,ocho,差異比較大,“但是並非偶然,因爲這樣的對應關係還有許多,如法語的nuit‘夜’意大利notte,西班牙語noche;法語的cuit‘煮’,意大利語cotto;以至法語的lait‘乳’,意大利語的latte,西班牙語的leche;法語的fait‘事實’,意大利語的fatto,西班牙語的hecho等等”(梅耶1925)。最爲經典的例子是原始印歐語的“二”構擬形式是*dw-,但是到了阿梅尼亞語卻是對應爲erku。見表2.02
表2.02
一旦語音對應關係建立了,音變的過程也可能會找到。上述原始印歐語“二”到Armenian語的音變有人認爲是這樣的(Hock 1991):
*dw->tg>tk>rk>erk
所以在運用比較法的過程中語言間語音形式的對應要遠勝於語音形式的簡單相似。第四,親屬語言雖然可以用生物的譜系樹説來類比,但是親屬語言間的比較並非一定得從最底層開始逐層往上作層級比較,也可以作跨級比較(cross comparison)。即同一語系中的不同語言,儘管它們分屬不同的語族、語支,也不管它們的“輩分”的高低,都可以用來作比較(陳忠敏2007)。歷史語言學幾個經典的音變法則,如上文所舉的格林姆定律,維爾納定律,格拉斯曼定律以及齶化定律等的發現都得益於跨級比較。語言的譜系樹分類理論得益於動植物的分類和進化理論,但是這兩者之間有本質上的不同。生物的分化是A代傳承到B代,B代再傳承到C代;A和C是隔代,它們之間没有直接的傳承關係;C代直接傳承B代,是從B代脱胎换骨而來,所以C代的特徵全部來自於B代,如果要從C代復原A代的特徵,必須要先復原中間的B代,然後從B代再復原到A代;反過來,從上往下看,如果要從A代看C代的特徵,非得經過中間的B代不可,因爲C代直接脱胎於B代。語系往下的語族、語支、語言、方言等語言學的下位分類並不是這樣的,下位分類的標準我們在上面已經説過是看有没有一個或若干個共用的創新特徵。依據某一個或某幾個創新特徵,並不是語言中的所有特徵。語言中的特徵的地理走向常常是犬牙交錯,按照不同的特徵作語言下位分類會得出不同的下位樹狀圖,所以語言的下位分類往往有很大的人爲性。再説語言中每個特徵的創新、存古的速率是不均衡的,某一特徵是創新的,並不代表此語言的所有特徵都是創新的,反之亦然。英語的輔音、元音經歷了格林姆定律的演變,或i-umlaut音變,這是創新特徵,但是,它的不規則形態所代表的强式動詞(strong verbs)和合乎規則的弱式動詞(weak verbs)以及它們的區别,是直接反映最古老的原始印歐語面貌。所以我們可以通過最底層的英語動詞强式和弱式的區别跨越到最高層去考察原始印歐語的動詞面貌。索緒爾正是從英語、德語等日爾曼語言裏這種强式動詞的不規則現象提出關於解決原始印歐語元音交替(ablaut)的喉理論(the Laryngeal Theory)(Saussure 1879)。
漢藏語裏用跨級比較和跨級構擬的一個例子是重紐的擬音。所謂的重紐是指中古支、脂、祭、真、仙、宵、侵、鹽八個三等韻,其喉牙唇音字除開合口的區别外,還各有兩套反切下字,形成對立。中古重紐B類(即重紐三等)和重紐A類(即重紐四等)的區别、擬音,以及它們的上古來源等從上世紀的三、四十年代到現在一直是漢語語音史的熱門話題。如果從漢語本身探索,從現代漢語方言讀音到中古音,再到上古音,即“從最低的語言層次開始,逐漸往上推”作這種層次構擬,恐怕無法解決重紐的問題,因爲在現代漢語方言能保留重紐區别的,往往是韻母主元音的不同。但是,既然《切韻》重紐兩類用同一個韻目,就不可能是主元音的不同,所以無法根據方言往上推,作層次構擬,而必須倒過來作漢語跟藏緬語的跨級比較,才能真正瞭解中古重紐三四等區别所在,以及它們的上古來源。跟藏語、緬語同源詞比較,發現漢語重紐三等和重紐四等的區别是*-rj-和*-j-的區别(龔煌城1997,下面的例子也引自龔文)。見表2.03、2.04:
表2.03:上古脂真部>中古脂旨至、真軫震質韻(重紐三、四等)
表2.04:上古元祭部>中古仙獮線薛韻(重紐三、四等)、元阮願月韻(純三等韻)
由上面的例子我們可以看出,對應於漢語重紐三等的在藏緬語裏是有-r-,所以我們有可以通過藏、緬語跟漢語的跨級比較,把重紐三等字的上古來源構擬爲*-rj-。上古來母擬定爲*r-,把重紐三等的上古來源構擬爲*-rj-,可以很好地解釋它跟來母字的通轉問題(鄭張尚芳1987、1995):
重紐三等擴張成兩個音節,後一個音節爲來母:
筆→不律;豾→不來;馮(憑)→馮陵。
以後發展爲中古的重紐三等介音-ɯ-(潘悟雲2000),這樣也可以圓滿地解釋中古重紐三等、四等的區别。
語言可以人爲地進行類似譜系似的劃分,但是語言關係的遠近以及特徵的存古、創新程度並不適合用生物學上的整體“輩分”(generations)的大小來衡量。
第五,語系以下的下位分類必須按共用創新(shared innovation)特徵分類,而不是其他。譜系樹的下位分類是語言的一種新的演變和分化,如果兩個或幾個語言共同出現新的相同的音變規律就能説明它們有相同的演變方向,以此正好可以跟别的語言相區别。語言特徵除了有創新外,也有留存特徵(retention)。留存特徵是指保留語言早期的特徵,留存特徵一般不宜作爲下位分類的依據,因爲下位分類的本質是語言的新的分化,留存特徵並不能顯示語言的這種新的分化。换句話説,我們把兩個或多個親屬語言(方言)劃爲一類,並不是僅僅看它們是否有共同特徵,還要看這個特徵是否屬於共同創新。在這一點上,早期的印歐語研究爲我們提供過經驗教訓。長期以來人們總認爲梵語的形態最古老,最接近原始印歐語的面貌,所以把梵語的三個元音i、u、a系統看作是原始印歐語的原始形式,這樣,希臘、拉丁等語言的五元音系統i、u、a、e、o就是從原始印歐語的三元音系統演變而來的,而且希臘、拉丁等語言的e、o也確實對應於梵語的低元音a;日爾曼語、巴爾托—斯拉夫(Balto-Slavic)語的元音e也跟梵語的低元音a對應,如果把*a作爲原始形式,*a→e則是創新音變,這樣就可以把印歐語一分爲二,印度—伊朗(Indo-Iranian)語族保留原始三元音系統,其他的歐洲印歐語從原始印歐語中分裂出去,歸爲一組,因爲它們共用*a→e創新音變。齶化定律發現後,人們才打破原來的思維。原來梵語,包括整個印度—伊朗語族的三元音系統是從五元音發展而來的。這樣印度—伊朗語族的三元音系統才是真正的創新音變,據此,它們歸爲一組,爲印度—伊朗語族。而其他的拉丁、希臘等歐洲印歐語是保留了原始形式,所以不能據此留存特徵來歸類,而必須尋找其他的創新特徵重新分類。