언어연대학
"오늘의AI위키"의 AI를 통해 더욱 풍부하고 폭넓은 지식 경험을 누리세요.
1. 개요
언어연대학은 기초 어휘의 변화 속도가 일정하다는 가설을 바탕으로, 두 언어의 분기 시점을 추정하는 방법론이다. 모리스 스와데시가 제창했으며, 방사성 탄소 연대 측정과 유사하게 어휘의 반감기를 통해 연대를 계산한다. 스와데시 리스트에 수록된 어휘를 사용하며, 동족어의 백분율을 측정하여 분리 시점을 추정하기도 한다. 하지만 언어 변화의 속도가 일정하지 않다는 점, 스와데시 리스트의 기초성에 대한 의문 등으로 인해 비판을 받으며, 최근에는 분자진화학을 응용한 새로운 방법론이 제시되기도 했다.
더 읽어볼만한 페이지
- 연대 측정법 - 방사성 탄소 연대 측정
방사성 탄소 연대 측정은 윌러드 리비가 1949년에 발견한 유기 물질 연대 측정 방법으로, 탄소-14의 방사성 붕괴를 이용하여 최대 6만 년까지의 연대를 측정하며, 고고학 유물 연대 측정에 주로 사용된다. - 연대 측정법 - 칼륨-아르곤 연대 측정
칼륨-아르곤 연대 측정은 칼륨-40이 아르곤-40으로 붕괴하는 현상을 이용하여 암석이나 광물의 연대를 측정하는 방법으로, 10만 년 이상 된 시료에 적합하지만 아르곤 손실이나 과잉 아르곤으로 인한 오차가 발생할 수 있어 아르곤-아르곤 연대 측정법으로 보완하며 다양한 분야에 활용된다. - 비교언어학 - 어족
어족은 공통 조상어에서 파생되어 계통적으로 관련된 언어들의 집합으로, 비교언어학적 방법을 통해 분류되며, 언어 간섭, 차용, 고립어, 혼합어 등의 복잡성으로 인해 분류가 명확하지 않을 수 있지만, 인류 이동과 언어 진화 연구에 중요한 역할을 한다. - 비교언어학 - 고유어
고유어는 특정 언어에서 자생적으로 발생한 어휘를 지칭하는 용어이지만, 객관주의적 및 주관주의적 접근 방식의 차이로 인해 정의와 분류 기준이 다양하며, 언어 순화 운동과 같은 사회적 요인과도 관련되어 다각적인 연구가 필요한 개념이다. - 역사언어학 - 보상적 장음화
보상적 장음화는 자음 탈락으로 인해 앞선 모음이 장음으로 변하는 음운 현상이다. - 역사언어학 - 언어계통론
언어계통론은 언어의 역사적 변화를 다루는 언어사와 밀접하게 관련되어 비교언어학, 언어유형론, 분자인류학, 고고학 등 다양한 학문 분야와 협력하여 언어의 계통 분류를 연구하는 학문이다.
언어연대학 |
---|
2. 방법론
모리스 스와데시가 제창한 방법론이다. 언어연대학은 기초적인 어휘가 비교적 일정한 속도로 변화한다는 가정 아래, 두 언어가 공통 조어에서 분기된 시기를 추정한다. 이는 마치 방사성 탄소 연대 측정처럼, 추정된 어휘의 반감기를 계산하여 연대를 산출하는 방식이며, 이때 주로 스와데시 리스트에 포함된 기초 어휘가 사용된다.
그러나 언어 변화 속도의 일정성에 대한 명확한 증거가 부족하고(예: 문자가 없는 언어의 빠른 변화), 스와데시 리스트의 보편성에 대한 의문이 제기되면서 언어연대학의 유효성에 대해 회의적인 시각도 존재한다.
언어연대학은 어휘 통계학적 방법을 활용하지만, 어휘 통계학 자체가 반드시 어휘 변화 속도의 일정성을 전제하지는 않는다. 또한, 음운론이나 문법적 비교를 통해 변화의 법칙성을 밝히고 언어 간의 계통 관계를 증명하는 비교언어학과는 접근 방식에서 차이가 있다.
최근에는 분자 진화학(DNA 염기서열 비교를 통한 생물 진화 연구) 방법을 응용하여, 언어 변화 속도의 일정성을 가정하지 않고 동원어(cognate)를 기반으로 분기 연대를 추정하는 연구도 제안되었다.[22] 이 방법은 인도유럽어족이나 오스트로네시아어족 등의 연구에 적용되었다.[23] 일본에서는 핫토리 시로에 의해 소개되어 연구가 이루어졌다.
2. 1. 스와데시 리스트
모리스 스와데시(Morris Swadesh)가 제창한 개념이다.기초적인 어휘는 비교적 일정한 속도로 변화한다는 가설을 기반으로 한다. 이 가설에 따라, 두 언어가 공통 조어로부터 분기된 연대를 어휘의 반감기를 추정하여 산출해낸다. 이는 마치 방사성 탄소 연대 측정과 유사한 방식이다. 이때 사용되는 기초적인 어휘 목록을 스와데시 리스트라고 부른다.
스와데시 리스트는 문화나 언어에 관계없이 모든 인간 언어에 공통적으로 존재하며, 차용되기 어려운 것으로 여겨지는 핵심 어휘들을 포함하도록 설계되었다. 여기에는 인칭대명사, 신체 부위, 천체 및 생물, 기본적인 행동을 나타내는 동사, 숫자, 기본적인 형용사, 친족 용어, 자연 현상 및 사건 등이 포함된다. 이를 통해 특정 문화나 시대에 국한된 개념은 배제하고자 했다. 스와데시 리스트는 1952년 처음 200개 항목으로 설계되었으나, 1955년에 제시된 100단어 목록이 현대 언어학자들 사이에서 더 널리 사용된다.
그러나 실제로 문화적 편견이 전혀 없는 이상적인 단어 목록을 만드는 것은 불가능하며, 비교 대상 언어에 맞춰 의미 목록을 조정해야 하는 경우가 많다. 이 때문에 연구마다 사용되는 단어 목록이 균일하지 않고, 연구 대상 언어에 맞게 변경되기도 한다.
언어연대학에서는 이 스와데시 리스트에 포함된 단어들 중 두 언어 간 동족어(공통된 기원을 가진 단어)의 비율을 측정한다. 동족어의 비율이 높을수록 두 언어가 더 최근에 갈라졌다고 추정하는 방식이다.
다음은 기본적인 터키어 단어와 그에 해당하는 한국어 번역으로 구성된 스와데시 리스트 100단어 목록의 예시이다.
hep (모든) | ateş (불) | boyun (목) | bu (그) |
kül (재) | balık (생선) | yeni (새로운) | şu (이) |
kabuk (껍질) | uçmak (날다) | gece (밤) | sen (너) |
karın (배) | ayak (발) | burun (코) | dil (혀) |
büyük (큰) | vermek (주다) | bir (하나) | diş (이) |
kuş (새) | iyi (좋은) | kişi (사람) | ağaç (나무) |
ısırmak (물다) | yeşil (녹색) | yağmur (비) | iki (둘) |
kara (검은색) | saç (머리카락) | kızıl (빨간색) | yürümek (걷다) |
kan (피) | el (손) | yol (길) | sıcak (따뜻한) |
kemik (뼈) | baş (머리) | kök (뿌리) | su (물) |
yakmak (태우다) | duymak (듣다) | kum (모래) | biz (우리) |
bulut (구름) | gönül (마음) | demek (말하다) | ne (무엇) |
soğuk (찬) | ben (나) | görmek (보다) | beyaz (흰색) |
gelmek (오다) | öldürmek (죽이다) | tohum (씨앗) | kim (누구) |
ölmek (죽다) | bilmek (알다) | oturmak (앉다) | kadın (여자) |
köpek (개) | yaprak (잎) | deri (피부) | sarı (노란색) |
içmek (마시다) | yalan (거짓말) | uyumak (자다) | uzun (긴) |
kuru (마른) | ciğer (간) | küçük (작은) | yok (없다) |
kulak (귀) | bit (이) | duman (연기) | göğüş (유방) |
yer (땅) | erkek (남성) | ayaktakalmak (서다) | hayvan tırnagı (발톱) |
yemek (먹다) | çok (많은) | yıldız (별) | dolu (가득) |
yumurta (달걀) | et (고기) | taş (돌) | boynuz (뿔) |
göz (눈) | dağ (산) | güneş (태양) | diz (무릎) |
yağ (지방) | ağız (입) | yüzmek (수영하다) | ay (달) |
tüy (깃털) | isim (이름) | kuyruk (꼬리) | yuvarlak (둥근) |
일본에서는 핫토리 시로에 의해 소개되어 연구되었다.
하지만 언어연대학의 핵심 가정인 '기초 어휘의 변화 속도가 일정하다'는 점에 대한 비판이 많다. 언어 변화가 항상 일정한 속도로 일어난다는 증거가 부족하며, 예를 들어 문자로 기록되지 않은 언어는 더 빠르게 변화하는 경향이 있다는 반론이 제기된다. 또한 스와데시 리스트에 포함된 어휘들이 정말로 모든 문화권에서 보편적이고 기초적이라고 할 수 있는지에 대해서도 의문이 제기된다. 이러한 이유로 언어연대학의 유효성에 대해 회의적인 언어학자들도 많다.
언어연대학은 어휘 통계학적인 방법을 사용하지만, 어휘 통계학 자체가 반드시 '기초 어휘가 일정한 속도로 변화한다'는 가정을 필요로 하지는 않는다. 또한, 언어의 음운론적, 문법적 측면을 비교하고 변화의 법칙성을 밝혀 언어 간의 계통 관계를 증명하는 비교언어학과는 방법론적으로 차이가 있다.
2. 2. 어휘 변화율
언어연대학은 기초적인 어휘가 비교적 일정한 속도로 대체된다는 가설을 기반으로 한다. 이는 모리스 스와데시가 제창한 방법으로, 마치 방사성 탄소 연대 측정처럼 어휘의 반감기를 추정하여 두 언어가 공통 조어로부터 갈라진 시기를 계산한다.[17] 이때 사용되는 기초 어휘 목록이 스와데시 리스트이다.스와데시 리스트는 원래 1952년 200개 항목으로 만들어졌으나, 1955년 발표된 100단어 목록이 현대 언어학자들 사이에서 더 널리 쓰인다. 이 목록은 차용에 비교적 영향을 받지 않는다고 여겨지는 핵심 어휘, 예를 들어 인칭 대명사, 신체 부위, 천체 및 생물, 기본적인 동사, 숫자, 기본적인 형용사, 친족 용어, 자연 현상 등 모든 인간 언어에 보편적으로 존재할 법한 개념들을 포함하도록 설계되었다. 특정 문화나 시대에 국한된 개념은 제외하려 했지만, 문화적 편견이 없는 완벽한 목록을 만드는 것은 현실적으로 어렵다는 비판도 있다. 따라서 연구자들은 비교 대상 언어에 맞춰 목록을 조정하거나 더 적은 수의 단어로 구성된 다른 목록을 사용하기도 한다.
언어 분화 연대를 측정하기 위해, 두 언어의 스와데시 리스트에 있는 단어들 중 동족어(같은 어원을 가진 단어)의 비율을 계산한다. 동족어 비율이 높을수록 두 언어가 공통 조어에서 갈라진 시기가 더 최근이라고 추정한다.
다음은 터키어 100단어 목록과 영어 번역의 예시이다.
터키어 | 영어 번역 | 터키어 | 영어 번역 | 터키어 | 영어 번역 | 터키어 | 영어 번역 |
---|---|---|---|---|---|---|---|
hep | all | ateş | fire | boyun | neck | bu | that |
kül | ash(es) | balık | fish | yeni | new | şu | this |
kabuk | bark | uçmak | fly | gece | night | sen | thou (you sg.) |
karın | belly | ayak | foot | burun | nose | dil | tongue |
büyük | big | vermek | give | bir | one | diş | tooth |
kuş | bird | iyi | good | kişi | person | ağaç | tree |
ısırmak | bite | yeşil | green | yağmur | rain | iki | two |
kara | black | saç | hair | kızıl | red | yürümek | walk |
kan | blood | el | hand | yol | road/path | sıcak | warm |
kemik | bone | baş | head | kök | root | su | water |
yakmak | burn | duymak | hear | kum | sand | biz | we |
bulut | cloud | gönül | heart | demek | say | ne | what |
soğuk | cold | ben | I | görmek | see | beyaz | white |
gelmek | come | öldürmek | kill | tohum | seed | kim | who |
ölmek | die | bilmek | know | oturmak | sit | kadın | woman |
köpek | dog | yaprak | leaf | deri | skin | sarı | yellow |
içmek | drink | yalan | lie | uyumak | sleep | uzun | long |
kuru | dry | ciğer | liver | küçük | small | yok | not |
kulak | ear | bit | louse | duman | smoke | göğüş | breast |
yer | earth | erkek | man (male) | ayaktakalmak | stand | hayvan tırnagı | claw/nail |
yemek | eat | çok | many | yıldız | star | dolu | full |
yumurta | egg | et | meat/flesh | taş | stone | boynuz | horn |
göz | eye | dağ | mountain | güneş | sun | diz | knee |
yağ | fat/grease | ağız | mouth | yüzmek | swim | ay | moon |
tüy | feather | isim | name | kuyruk | tail | yuvarlak | round |
어휘 변화율은 형태소의 소멸 또는 어휘의 변화 속도에 의존하는데, 언어연대학은 이 속도가 역사적으로 일정하게 유지된다고 가정한다. 미국 언어학자 로버트 리스는 200단어 목록을 사용하여 13쌍의 언어에서 알려진 변화를 분석하여, 어휘가 천 년 동안 유지될 확률인 "언어연대학 상수"(''r'') 값을 계산했다. 그는 90% 신뢰 수준에서 ''r'' = 0.805 ± 0.0176이라는 값을 얻었다. 스와데시는 의미적으로 불안정한 단어를 제외한 100단어 목록을 사용하여 더 높은 값인 ''r'' = 0.86을 제시했다. 이 상수 ''r''은 어휘 교체율 ''L''과 다음과 같은 관계를 가진다.
:''L'' = 2ln(''r'')
여기서 ln은 자연 로그를 의미한다.
그러나 언어 변화 속도가 항상 일정하다는 증거가 부족하다는 점에서 언어연대학의 유효성에 대한 비판이 많다. 예를 들어, 문자 기록이 없는 언어는 변화 속도가 더 빠를 수 있다. 또한 스와데시 리스트의 어휘가 정말로 모든 문화에 걸쳐 보편적이고 기초적인지에 대한 의문도 제기된다.[17]
언어연대학은 어휘 통계학적인 방법을 사용하지만, 어휘 통계학 자체가 반드시 기초 어휘의 변화 속도가 일정하다는 가정을 필요로 하지는 않는다. 또한, 언어의 음운론적, 문법적 측면을 비교하고 변화의 규칙성을 밝혀 언어 간의 계통 관계를 증명하는 비교 언어학과는 방법론적으로 구별된다. 일본에서는 핫토리 시로가 이 방법을 소개하고 연구를 진행했다.
2. 3. 분기 연대 계산
모리스 스와데시가 제창한 방법이다.기초적인 어휘는 비교적 일정한 속도로 변화한다는 가정을 기반으로 한다. 두 언어가 공통 조어로부터 분기한 연대를 추정할 때, 마치 방사성 탄소 연대 측정처럼 어휘의 반감기를 계산하여 연대를 산출한다. 이때 사용되는 기초 어휘는 주로 스와데시 리스트에 수록된 어휘군이다.
그러나 언어 변화가 항상 일정한 속도로 일어난다는 명확한 증거는 부족하다. 예를 들어, 문자 기록이 없는 언어는 더 빠르게 변화하는 경향이 있다. 이러한 이유로 언어연대학의 유효성에 대해 회의적인 언어학자들도 많다. 또한, 스와데시 리스트의 어휘가 실제로 모든 문화권에서 '기초적'이라고 할 수 있는지에 대한 의문도 제기된다. 어휘 목록을 결정하는 기준인 형태소 붕괴나 어휘 변화가 항상 일정한 속도로 유지되어야 언어연대학을 적용할 수 있는데, 언어학자들은 이 속도가 역사적으로 동일하게 유지될 것이라고 보장할 수 없다고 비판한다.[17]
언어연대학은 어휘통계학적 방법을 사용하지만, 어휘통계학 자체가 반드시 기초 어휘의 변화 속도가 일정하다는 가정을 필요로 하지는 않는다. 또한, 음운론적, 문법적 비교를 통해 변화의 법칙성을 밝혀 동계 관계를 증명하는 비교언어학과는 방법론적으로 차이가 있다.
미국의 언어학자 로버트 리스는 200개 단어 목록을 사용하여 13쌍의 언어에서 알려진 변화를 분석하고, 단어의 "언어연대학 상수" ('''r''') 값을 계산했다. 그는 90% 신뢰 수준에서 0.805 ± 0.0176이라는 값을 얻었다. 스와데시는 100단어 목록을 사용하여 0.86이라는 값을 얻었는데, 이는 의미적으로 불안정한 단어를 제외했기 때문에 더 높은 값으로 나타난 것으로 보인다. 이 상수는 다음 공식을 통해 단어의 유지율과 관련된다.
:
여기서 ''L''은 교체율, ln은 자연 로그, ''r''은 언어연대학 상수이다.
언어연대학의 기본 공식은 다음과 같다.
:
여기서 ''t''는 특정 기간(천 년 단위),[8] ''c''는 해당 기간 말에 유지된 단어 목록 항목의 비율, ''L''은 해당 단어 목록의 대체율이다.
따라서 공식을 다음과 같이 나타낼 수도 있다.
:
스와데시는 역사적으로 검증 가능한 사례(예: 고전 라틴어에서 현대 로망스어까지의 변화)를 통해 ''L''의 경험적 값으로 약 0.14를 얻었다. 이는 100단어 목록에서 1,000년마다 약 14개의 단어가 교체된다는 의미이다. 이는 아래 표와 같다.
대략적인 중앙값 날짜 (BP) | 100단어 목록에서 중앙값 동족어 유지율 |
---|---|
500 | 86% |
1000 | 74% |
1500 | 64% |
2000 | 55% |
2500 | 47% |
3000 | 40% |
4000 | 30% |
5000 | 22% |
6000 | 16% |
7000 | 12% |
8000 | 9% |
9000 | 7% |
10000 | 5% |
모리스 스와데시가 제창한 언어연대학은 기초적인 어휘가 비교적 일정한 속도로 변화한다는 가설을 기반으로, 두 언어가 공통 조어로부터 분기한 연대를 추정하는 방법이다.[6][10][11] 이 과정에서 스와데시 리스트라 불리는 기초 어휘 목록이 사용된다.
최근에는 R.D. 그레이 등이 분자 진화학(DNA 염기서열의 통계적 비교를 통해 생물의 진화를 연구하는 방법)을 응용하여, 언어 변화 속도의 일정성을 가정하지 않는 새로운 방법을 제안했다.[20] 이 방법은 비교 언어학으로 밝혀진 동원어(cognate)를 기반으로 한다. 이 접근법을 통해 인도유럽어족과 같이 일부 분기 연대가 알려진 어족에 대해서는 기존보다 더 정확하게 분기 연대를 추정할 수 있다고 주장한다. 그들은 이 방법을 오스트로네시아어족에도 적용한 바 있다.[21]
3. 비판 및 논쟁
그러나 언어연대학은 등장 초기부터 여러 비판에 직면했으며, 그 유효성에 대해 회의적인 언어학자들이 많다. 주요 비판점은 다음과 같다.
이러한 비판들로 인해 언어연대학의 기반 가설과 방법론의 타당성에 대한 논쟁이 지속되어 왔다(예: Bergsland 1958; Bergsland and Vogt 1962; Fodor 1961; Chrétien 1962; Guy 1980).[14][15]
한편, 언어연대학은 인도유럽어족 연구에서 약 87%의 분산을 설명하는 것으로 나타났으며, 아프리카아시아어족(Fleming 1973), 중국어(Munro 1978), 아메린드어족(Stark 1973; Baumhoff and Olmsted 1963) 등 다른 어족 연구에도 적용 가능성이 제시되었다. 특히 아메린드어족 연구에서는 방사성 탄소 연대 측정, 혈액형, 고고학적 증거와 상관관계가 있다는 주장이 제기되기도 했다.
이러한 비판과 논쟁 속에서 언어연대학의 방법론을 개선하려는 여러 시도가 이루어졌다. 변화율의 불균일성을 고려하거나(Van der Merwe 1966[17]; Dyen, James, and Cole 1967[18]), 차용어 및 동의어 문제를 다루고(Sankoff 1973), 통계적 방법론을 정교화하는(Kruskal, Dyen, and Black[15]; Sankoff 1972; Embleton 1981) 연구들이 진행되었다. 최근에는 계통 발생학의 방법론을 응용한 접근법(예: Gray & Atkinson 2003)도 등장했으나, 이 역시 여전히 논쟁의 대상이다. Gray와 Atkinson의 접근 방식 자체는 그들이 밝힌 바와 같이 전통적인 의미의 "글로토크로놀로지"와는 거리가 있다.[9]
언어연대학은 어휘 통계학적 방법을 사용하지만, 어휘 통계학 자체가 반드시 언어 변화 속도의 일정성을 전제하는 것은 아니다. 또한, 음운론적·문법적 비교를 통해 언어의 계통 관계를 밝히는 비교언어학과는 방법론적으로 구분된다.
3. 1. 언어 변화 속도의 일정성
모리스 스와데시가 제창한 언어연대학의 핵심 가정은 기초적인 어휘가 비교적 일정한 속도로 변화한다는 것이다.[6][10][11] 이 가설에 따르면, 마치 방사성 탄소 연대 측정이 반감기를 이용하는 것처럼, 어휘 목록(스와데시 리스트)의 변화율을 통해 두 언어가 공통 조어로부터 갈라진 시기를 추정할 수 있다.
그러나 언어 변화가 실제로 일정한 속도로 일어난다는 명확한 증거는 부족하며, 이 가정은 언어연대학의 유효성에 대한 주요 비판 지점이 되었다.[12][13] 많은 언어학자들은 이러한 가정에 회의적인 입장을 보이며, 여러 반박 논거를 제시했다.
이러한 비판을 보완하기 위해, 변화율의 불균일성을 고려하려는 여러 시도가 이루어졌다. 예를 들어, 어휘 목록을 각기 다른 변화율을 가진 집단으로 나누거나(Van der Merwe 1966[17]), 각 의미 단위별로 고유한 변화율을 설정하는 방식(Dyen, James, Cole 1967[18]), 분기 시간과 대체율을 동시에 추정하는 방법(Kruskal, Dyen, Black[15]) 등이 제안되었다. 또한 Sankoff (1973)는 차용 매개변수를 도입하고 동의어를 허용하는 방안을 제시하기도 했다.
최근에는 계통 발생학의 통계적 방법론을 응용하여, 알려진 역사적 사건을 기준으로 변화율을 보정함으로써 엄격한 일정 변화율 가정을 완화하는 연구(예: Gray & Atkinson 2003)도 진행되고 있다. 이러한 방법들은 변화율이 일정하지 않다는 비판을 수용하면서 언어 연대를 추정하려는 시도이다.
결론적으로, 언어 변화 속도의 일정성 가정은 전통적인 언어연대학 방법론의 핵심적인 한계로 남아 있으며, 방법론의 타당성에 대해 지속적인 논쟁이 이어지고 있다.
3. 2. 스와데시 리스트의 기초성
언어연대학에서 사용하는 스와데시 리스트는 모리스 스와데시가 제안한 기초 어휘 목록으로, 언어 간의 분기 연대를 추정하는 데 사용된다.[6][10][11] 이는 기초적인 어휘가 비교적 일정한 속도로 변화한다는 가정을 기반으로 한다.
그러나 스와데시 리스트의 어휘가 정말로 '기초적'이라고 할 수 있는지, 그리고 모든 문화에 편향되지 않은 목록을 만드는 것이 가능한지에 대한 의문이 제기되어 왔다.[17] 언어학자들은 문화적으로 중립적인 기본 단어 목록을 찾는 데 어려움을 겪는다.[17] 또한, 리스트 내 어휘들의 안정성이 일정하다는 가정에도 비판이 있다(Haarmann 1990). 일부 비판은 언어 변화율 계산 시 일정량의 어휘 손실만이 고려된다는 점을 간과하기도 한다(Sankoff 1970).
이러한 비판에 대해 러시아의 언어학자 세르게이 스타로스틴은 몇 가지 수정을 제안했다. 그는 언어 간 차용어는 변화율 계산에서 제외해야 한다고 주장했다. 스와데시가 원래 추정한 대체율(천 년당 약 14%)이 실제(천 년당 약 5~6%)보다 높았던 이유 중 하나가 바로 이 차용어 문제였다. 예를 들어, Riksmal(문학 노르웨이어)의 경우, 다른 게르만어(주로 덴마크어)에서 차용된 단어를 제외하면 대체율이 스와데시의 추정치보다 훨씬 낮아진다.
또한 스타로스틴은 다음과 같은 점들을 지적했다.
스타로스틴은 이러한 시간 종속성과 개별 안정성 차이를 반영하여 다음과 같은 수정된 공식을 제안했다.
:
이 공식에서 는 불안정한 어휘가 먼저 대체되면서 전체적인 대체 속도가 점차 느려지는 현상을 반영하고, 제곱근()은 단어가 오래될수록 의미 변화나 대체 가능성이 커지는 '노화' 효과를 반영한다. 이 수정된 방법은 스와데시의 초기 모델보다 더 복잡하지만, 알려진 역사적 사실과 부합하는 더 신뢰성 있는 결과를 제공하는 것으로 평가된다. 그러나 이는 해당 언어의 음운론적 역사가 상세히 연구되어 동족어와 차용어를 명확히 구분할 수 있는 경우에만 효과적으로 적용될 수 있다는 한계도 보여준다.
3. 3. 방법론적 한계
언어연대학의 핵심 가정, 즉 기초 어휘가 비교적 일정한 속도로 변화한다는 점에 대해서는 많은 비판이 제기되었다. 언어 변화가 실제로 일정한 속도로 일어난다는 명확한 증거가 부족하며,[16] 예를 들어 문자로 기록되지 않은 언어는 상대적으로 빠르게 변화하는 경향이 있다는 주장이 있다. 이러한 이유로 언어연대학의 유효성에 대해 회의적인 언어학자들이 많다.[4][6][10][11]
언어연대학의 기반이 타당한지에 대한 의문은 초기부터 제기되어 왔다(예: Bergsland 1958; Bergsland and Vogt 1962; Fodor 1961; Chrétien 1962; Guy 1980).[14][15] 특히 모리스 스와데시가 제안한 어휘 변화의 '상수율'(천 년당 약 14% 변화) 가정은 실제 언어 데이터와 맞지 않는 경우가 많다는 비판을 받았다. Bergsland & Vogt (1962)는 아이슬란드어의 변화율이 천 년당 약 4%인 반면, 밀접하게 관련된 문학 노르웨이어는 최대 20%에 달한다는 연구 결과를 제시하며, 언어마다 변화 속도가 다를 수 있음을 보여주었다. 이는 모든 언어에 단일한 변화율을 적용하는 것의 문제점을 드러낸다. 또한, 차용어를 고려하지 않으면 분기 시간 추정이 왜곡될 수 있다는 지적도 있다(Thomason and Kaufman 1988).
스와데시 리스트에 포함된 어휘가 정말로 모든 문화권에서 보편적으로 기초적이고 안정적이라고 할 수 있는지에 대해서도 의문이 제기된다(Haarmann 1990). 문화적으로 편향되지 않은 기초 어휘 목록을 만드는 것은 어려운 과제이며,[17] 각 단어는 고유한 변화의 역사를 가질 수 있다.[16] 일부 언어학자들은 통계적 확률에 기반한 언어연대학의 방법론 자체에 대해 회의적인 입장을 보이기도 한다.[17]
더 나아가 언어 변화는 예측하기 어려운 사회·역사적 사건들에 영향을 받기 때문에 수학적으로 계산하기 어렵다는 주장도 있다. 이러한 비판에 대응하여 언어연대학의 방법론을 개선하려는 여러 시도가 있었다. 예를 들어, 어휘 목록을 변화 속도에 따라 분류하거나(Van der Merwe 1966)[17], 각 의미마다 다른 변화율을 적용하고(Dyen, James 및 Cole 1967)[18], 차용어와 동의어를 고려하는(Sankoff 1973) 등의 방법이 제안되었다.
최근에는 생물학의 계통 발생학 연구에서 사용되는 통계적 방법론이 언어학에 도입되면서 새로운 접근법이 등장했다. 특히 Gray & Atkinson 2003 등은 알려진 역사적 사건을 이용해 언어 계통수의 분기 시점을 보정하고 변화율을 유연하게 조정하는 방법을 제안했다. 이 방법은 엄격한 '일정 변화율' 가정을 요구하지 않지만, 이 역시 결과의 타당성 및 방법론적 문제로 인해 여전히 논란의 대상이 되고 있다.[19]
언어연대학은 어휘 통계학적인 방법을 사용하지만, 어휘 통계학 자체가 반드시 '기초 어휘의 일정한 변화 속도'를 가정하는 것은 아니다. 또한, 언어의 음운론적, 문법적 측면을 비교하고 변화의 규칙성을 밝혀 언어 간의 친족 관계를 증명하는 비교언어학과는 방법론적으로 구분된다.
4. 새로운 방법론
언어연대학에 대한 전면적인 부정과 별개로, 몇 가지 중요한 수정을 거치면 유효한 분석 방법이 될 수 있다는 주장도 제기되었다. Van der Merwe (1966)는 단어 목록을 고유한 변화율을 가진 부류로 나누어 변화율의 불균일성 문제를 다루었고,[17] Dyen, James, Cole (1967)은 각 의미마다 고유한 변화율을 갖도록 허용했다.[18] 분기 시점과 변화율을 동시에 추정하는 방법은 Kruskal, Dyen, Black 등이 연구했다.[15]
또한 다음과 같은 개선 시도들이 있었다.
- Brainard (1970)는 우연히 나타나는 유사성(우연적 인지성)을 고려했다.
- Gleason (1959)는 언어 표류(drift) 효과를 도입했다.
- Sankoff (1973)는 차용 변수를 도입하고 동의어를 허용할 것을 제안했다.
이러한 다양한 개선점들은 Sankoff의 "완전 매개변수화된 어휘 통계학"에 종합적으로 제시되었다. Sankoff는 1972년 생물학 분야에서 집단의 유전적 분화 모델을 개발했고, Embleton (1981)은 이 모델을 언어학에 맞게 단순화하여 적용한 시뮬레이션에서 좋은 결과를 얻었다.[18]
통계 방법론의 개선은 계통 발생학 분야와 연관되어 이루어지기도 했는데, 시간에 따른 DNA 변화 연구가 언어연대학에 새로운 관심을 불러일으켰다. 이 새로운 방법들은 알려진 역사적 사건을 이용해 계통수의 분기점을 보정하고 변화율을 조정하므로, 변화율이 일정하다는 가정을 더 이상 필요로 하지 않아 기존 방법보다 더 강력하다는 평가를 받는다. (Gray & Atkinson 2003)
4. 1. 분자진화학 응용
최근 R.D. Gray 등은 분자진화학(DNA 배열의 통계적 비교를 통해 생물의 진화를 밝히는 방법)을 응용하여, 언어 변화 속도의 일정성을 가정하지 않는 방법을 제안했다.[22][20] 이 방법은 비교언어학을 통해 밝혀진 동원어를 기초로 한다. 이 접근법에 따르면, 일부 분기 연대가 알려진 어족(인도유럽어족 등)의 경우 기존 학설보다 더 확실하게 분기 연대를 추정하는 것이 가능하다고 주장한다. 이 방법론은 오스트로네시아어족 연구에도 적용되었다.[23][21]4. 2. 세르게이 스타로스틴의 수정
러시아의 언어학자 세르게이 스타로스틴은 기존 어족 연대기(글로토크로놀로지)의 문제점을 보완하기 위해 다음과 같은 수정을 제안했다.- 체계적 차용어 제거: 한 언어에서 다른 언어로 들어온 체계적인 차용어는 언어 변화율 계산에 방해가 되므로 제외해야 한다고 주장했다. 중요한 것은 같은 언어 내에서 단어가 고유하게 바뀌는 비율이라는 것이다. 스타로스틴은 이 점을 간과했기 때문에 스와데시가 원래 100단어 목록에서 변화율을 1,000년당 14%로 높게 추정했다고 보았다. 실제 변화율은 이보다 훨씬 느린 약 5~6% 정도라는 것이다. 이러한 수정을 통해, 예를 들어 릭스몰(Riksmål)의 변화율이 비정상적으로 높다는 "베르글란드 & 보크트"의 주장을 반박할 수 있었다. 릭스몰의 기본 어휘 목록을 분석한 결과, 다른 게르만어(주로 덴마크어)에서 빌려온 단어가 약 15~16개 포함되어 있었으며, 이를 제외하고 계산하면 변화율은 1,000년당 5~6% 수준으로 낮아졌다.
- 변화율의 가변성 인정: 단어의 변화율은 일정하지 않으며, 그 단어가 언어에 존재했던 기간에 따라 달라진다고 보았다. 즉, 어떤 단어가 다른 단어로 대체될 확률은 시간이 지남에 따라 증가한다는 것이다. 이는 단어가 오래 사용되면서 부가적인 의미가 쌓여 본래 의미가 점차 약해지는 "단어의 노화" 현상으로 설명될 수 있다.
- 단어별 안정성 차이 고려: 스와데시 목록에 포함된 100개의 단어라도 각 단어의 안정성은 다르다고 지적했다. 예를 들어 '나'와 같은 대명사는 '노란색'과 같은 형용사보다 훨씬 안정적이어서 잘 바뀌지 않는 경향이 있다.
스타로스틴은 시간 의존성과 개별 단어의 안정성 차이를 모두 반영하여 다음과 같은 수정된 공식을 제시했다.
:
이 공식에서 `-Lc` 항은 안정성이 낮은 단어들이 먼저 빠르게 대체되면서 전체적인 변화 속도가 점차 느려지는 현상을 반영한다. 반면, 제곱근() 항은 시간이 지남에 따라 단어가 "노화"하여 의미 변화나 대체가 쉬워지면서 변화 속도가 다시 빨라지는 경향을 나타낸다.
스타로스틴의 공식은 스와데시의 원래 공식보다 복잡하지만, 그가 제시한 바에 따르면 역사적으로 알려진 언어 분기 연대와 더 잘 일치하는 신뢰성 높은 결과를 제공한다. 그러나 이 방법은 해당 어족의 음운 변화 역사가 상세히 연구되어 동족어와 차용어를 명확히 구분할 수 있는 경우에만 의미 있는 과학적 도구로 활용될 수 있다는 한계도 보여준다.
참조
[1]
서적
Historical Linguistics: Mathematical concepts
[2]
논문
Salish Internal Relations
https://www.jstor.or[...]
1950-10-01
[3]
서적
The Anthropology of Language
Wadsworth, Cengage Learning
[4]
논문
Prehistoric Chronology of the Common Bean in the New World: The Linguistic Evidence
https://www.jstor.or[...]
2006-09-01
[5]
논문
The new Arboretum of Indo-European 'Trees'; Can new algorithms reveal the Phylogeny and even Prehistory of IE?
https://www.tandfonl[...]
[6]
논문
Towards greater accuracy in lexicostatistic dating
[7]
논문
Glottochronology and the Turkish Basic Vocabulary
1966-02-01
[8]
서적
Language Classification by Numbers
OUP Oxford
[9]
논문
Language-tree divergence times support the Anatolian theory of Indo-European origin
[10]
서적
What is glottochronology?
Routledge & Kegan Paul
[11]
논문
The basis of glottochronology
[12]
서적
Statistics in Historical Linguistics
Brockmeyer
[13]
서적
Language Classification by Numbers
Oxford University Press
[14]
서적
Lexicostatistics in genetic linguistics: Proceedings of the Yale conference, April 3–4, 1971
Mouton
[15]
논문
Some Results From the Vocabulary Method of Reconstructing Language Trees
Mouton
[16]
서적
Studies in Linguistic Geography: The Dialects of English in Britain and Ireland
Croom Helm
[17]
논문
New mathematics for glottochronology
[18]
논문
Language divergence and estimated word retention rate
[19]
서적
Time Depth in Historical Linguistics
The McDonald Institute for Archaeological Research
[20]
논문
Language-tree divergence times support the Anatolian theory of Indo-European origin
https://www.nature.c[...]
[21]
논문
Language Phylogenies Reveal Expansion Pulses and Pauses in Pacific Settlement
http://www.sciencema[...]
2009-01-23
[22]
논문
Language-tree divergence times support the Anatolian theory of Indo-European origin
http://www.nature.co[...]
[23]
논문
Language Phylogenies Reveal Expansion Pulses and Pauses in Pacific Settlement
http://www.sciencema[...]
2009-01-23
본 사이트는 AI가 위키백과와 뉴스 기사,정부 간행물,학술 논문등을 바탕으로 정보를 가공하여 제공하는 백과사전형 서비스입니다.
모든 문서는 AI에 의해 자동 생성되며, CC BY-SA 4.0 라이선스에 따라 이용할 수 있습니다.
하지만, 위키백과나 뉴스 기사 자체에 오류, 부정확한 정보, 또는 가짜 뉴스가 포함될 수 있으며, AI는 이러한 내용을 완벽하게 걸러내지 못할 수 있습니다.
따라서 제공되는 정보에 일부 오류나 편향이 있을 수 있으므로, 중요한 정보는 반드시 다른 출처를 통해 교차 검증하시기 바랍니다.
문의하기 : help@durumis.com