2-1. Введение... 106
2-2. ППМНА... 116
2-3. ППМВ/У... 123
2-4.ППМЗА ... 134
2-5. ППМС... 143
2-6. ГГПМПО... 151
2-7. ППМОТ ... 158
2-8. Выводы... 165
ГТТДГ). - Опыт классификации препозиционно-префиксаль- 1 ,о
1 JlAtJA j. , - lOo
ных морфем болгарского языка...
ЗАКЛЮЧЕНИЕ... 177
Источники 182
Библиография 184
Приложения (графики, гистограммы, таблицы)
см. отдельную книгу № 2 на 147 л.
-4-
ВВЕДЕНИЕ. Цель, объем и теоретические основы работы
Диссертация посвящена изучению препозиционно- префиксальных морфем (предлогов и соответствующих им приставок) болгарского языка (далее ППМ) в диахроническом и синхронном аспектах, а также сопоставительному анализу употребления коррелирующих ППМ современного болгарского и современного русского языков в текстах разной стилевой принадлежности.
Актуальность исследования связана в первую очередь с проблемами ста- новления аналитизма, с рядом нерешенных вопросов этого процесса. Близкородственные по происхождению языки — русский и болгарский — на современном этапе развития характеризуются существенными структурными различиями: русский остается языком синтетическим, в то время как современный болгарский стал языком аналитическим. Аналитическая тенденция эволюции индоевропейских языков, безусловно, коснулась и русского языка, но сегодня исследователи говорят лишь об отдельных проявлениях аналитизма в нем. Количественная оценка употреблений исследуемого явления (и особенно в сопоставлении со значительно более продвинутым в этом отношении болгарским языком) уточняет характер и степень этих проявлений.
Количественная интерпретация структурных изменений болгарского языка, связанных с переходом к аналитизму, в частности результаты анали-за изменений в частоте употребления ППМ в текстах разных периодов исторического развития болгарского языка, сохраняют свою актуальность, так как все еще продолжается дискуссия о периодизации истории болгарского литературного языка.
В век компьютерных технологий роль статистических исследований языка чрезвычайно важна. Особенно актуальны разработки в области статистической стилистики, представленные во 2 и 3 главах диссертационного сочинения.
-5-
Предмет исследования - ППМ болгарского языка в сопоставлении с соответствующими им ППМ русского языка.
Цель - получение количественных данных об употреблении ППМ, отражающих эволюционные процессы в историческом развитии болгарского языка; определение степени различия в употреблении этого класса морфем в текстах разных функциональных стилей болгарского и русского языков на синхронном уровне, а также сопоставительный межъязыковой анализ полученных количественных данных.
В соврехменном болгарском языке почти все префиксы имеют препозиционные соответствия. Сопоставление значений каждого отдельного префикса и соответствующей ему препозиции не оставляет сомнения в том, что "префиксальная" и соответствующая ей "препозиционная" морфема - это два типа употребления одной и той же морфемы (препозиционно-префиксальной), с одним и тем же инвариантом семантики. Этот факт отмечается не только исследователями истории языка, но и составителями грамматик современного болгарского языка. Так, Ст.Стоянов пишет: "По происхождению приставки являются предлогами, которые как проклитики произносились слитно со следующим словом и образовывали с ним одно акцентное целое" (1964,с.ЗО7).
Более подробное обоснование этой точки зрения можно обнаружить в трудах индоевропеистов. А.Мейе (1938, с.209) указывает как на несомненную этимологическую связь, так и на историю разграничения препозиционного и префиксального употреблений: "В течение развития индоевропейских языков эти элементы стремились примкнуть либо к имени, как тгро 5oji(ov "перед домами", или Шои яро "перед Илионом", и тогда мы их называем предлогами, либо к глаголу, как в гр. 7грофЕрш "выношу вперед", и тогда мы их называем глагольными приставками"
Таким образом, в основе разграничения оказывается отнесение препозиционно-префиксальной морфемы к понятию, выраженному номинальным или вербальным корнем, а не слитное или раздельное написание.
-6-
Анализ префиксального употребления морфем позволяет рассматривать префиксы как название видового отличия понятия, выраженного пре-фигированной глагольной основой, по отношению к родовому понятию, выраженному непрефигированной основой, т. е. понятие, выраженное префиги-рованной основой, по отношению к понятию, выраженному непрефигированной основой, является видовым. Напротив, препозиция может рассматриваться как выражение родового понятия по отношению к понятию, выраженному сочетанием препозиции и существительного. Таким образом, префикс может быть охарактеризован как определяющее, а препозиция - как определяемое, или, пользуясь терминологией теории актуального членения высказывания, префикс является аналогом ремы, а препозиция - аналогом темы.
В соответствии с изложенным разграничением префиксального и препозиционного типов употребления ППМ каждая из них рассматривается в трех аспектах:
1) суммарные количественные данные об употреблении ППМ;
2) количественная характеристика префиксального употребления (морфема предшествует корневой морфеме, называющей действие в словоформах глаголов, причастий, деепричастий, субстантивированных причастий, отглагольных существительных на -НЕ и -НИЕ, отглагольных nomina agentis);
3) количественная характеристика препозиционного употребления (морфема предшествует номинальной единице).
Структура работы - диссертация состоит из введения, трех глав, заключения, списка анализируемых источников и библиографии (237 поз.).
В работе представлены: 39 гистограмм, 34 графика и 83 сводные таблицы (см. Приложение кн.2).
Структура диссертационного сочинения определяется его задачами. В целях комплексного статистического исследования ППМ болгарского языка выдвигаются три блока задач:
-7-
I. Проследить с количественной точки зрения эволюцию ППМ болгарского языка с XI века до наших дней:
1.1. Получить количественные данные об изменениях в употреблении ППМ в текстах, отражающих разные периоды развития болгарского языка.
1.2. Выявить взаимосвязь изменений в частоте появления морфемы с изменениями в семантике.
1.3. Отграничить случайные изменения в частоте употребления морфем от изменений показательных, существенных.
1.4. Локализовать изменения (определить, развитием какого типа употребления - препозиционного или префиксального - обусловлены наблюдаемые изменения в частоте ППМ).
2. Сопоставить количественные характеристики употребления ППМ в болгарском и русском языках:
2.1. Определить многообразие ППМ, функционирующих в сопоставляемых языках.
2.2. Получить количественные данные об употреблении ППМ в различных по стилю текстах: а) современного болгарского и б) современного русского языков.
2.3. Определить степень различия между исследуемыми текстами по частоте появления ППМ.
2.4. Определить, развитием препозиционного или префиксального типа употребления обусловлены различия в частоте появления ППМ.
2.5. Выяснить причины наблюдаемых различий для 6 наиболее частых в болгарском языке ППМ.
3. Сгруппировать ППМ на основании принципа выделения семантически значимых фонемных элементов.
3.1. Проследить глоттометрическое поведение - Д, -3 и П - содержащих ППМ в текстах разных стилей:
а) современного болгарского и
б) современного русского языков.
-8-
3.2. Сопоставить количественные характеристики употреблений выделенных групп в исследуемых языках. Материал исследования:
1. Староболгарские тексты (XI век): "Ассеманиево Евангелие", "Саввина книга", "Супрасльская рукопись", "Синайская Псалтырь".
2. Среднеболгарские тексты: "Болонская Псалтырь", XII в.; "Хлудов паримейник", XIII в.; "Троянская притча", XIVb.; "Хроника Манассия", XIVb.
3. Тексты дамаскинов (письменные памятники XVI-XVIII вв.): "Крнинский дамаскин", XVI в.; "Коприштенский дамаскин", XVII в.; "Троянский дамаскин", XVII в.; "Свиштовский дамаскин", XVIII в.
4. Современные болгарские и русские тексты разных стилей:
- беллетристические - из произведений П. Вежинова, Й.Радичкова, И.Давидкова, Н.Хайтова, В Катаева и М.Шолохова;
- драматургические (как приближенные к разговорному стилю речи): из произведений Др. Асенова, Б.Балабанова, М.Величкова, Й.Йовкова. Вс. Вишневского и Е. Шварца;
- научные - статьи из научных журналов гуманитарной тематики;
- публицистические - статьи из прессы разнообразной рубрикации. Используемые в работе статистические методы позволили ограничить
исследование вышеперечисленных текстов исследованием выборок (размером в 15 килофон) из этих текстов. Выборка составляется из произвольно взятых проб. Каждая проба равна 1 килофоне, то есть содержит в себе 1000 мопофон. (Монофона - отрезок текста, обозначенный одной буквой фонемной транскрипции).
На современном этапе наши исследование ограничивается текстами 70-х годов XX столетия, так как для болгарского языка этот период представляет особый интерес: именно тогда стилистические различия достигли максимальной выразительности, чему, безусловно способствовало чрезмерная клишированность публицистики. Рубеж XX -XXI веков, как известно,
-9-
ознаменован демократизацией языка средств массовой информации, и особенно прессы. Позволительно ли распространять полученные нами выводы на весь период? Ответ на этот вопрос, думается, содержится в исследованиях М.Велевой, которая отмечает мнимый характер «разговорности» болгарской прессы и описывает приемы создания эффекта «псевдоразговорности» в современном болгарском газетном дискурсе (Велева М., 1995). Она отмечает, что изменения коснулись лишь лексического уровня и не затронули грамматической структуры: грамматика консервативней лексики.
Наша дополнительная проверка с количественной точки зрения подтверждает справедливость наблюдений болгарской исследовательницы.
Сравните:
70-е годы 2000 г.
Гсум. =67,30 Тсум. =65,25
X преп. = 43,12 X преп. =41,87
X преф. = 24,18 X преф = 23,38
Отсутствие ощутимых различий в частоте употребления ППМ (как в функции префикса, так и в функции препозиции) в газетных текстах 70-х годов и последних лет служит, с нашей точки зрения, достаточным основанием для признания релевантности наших выводов для всего периода в целом.
Научная новизна работы.
В работе впервые приводятся глоттометрические (количественные) данные о классе препозиционно-префиксальных морфем болгарского языка в историческом аспекте. Прослеживается их эволюция. Становление аналитизма в болгарском языке получает количественное измерение.
Проводится последовательный стилистический анализ употребительности 6 наиболее частых ППМ болгарского языка и их русских формальных соответствий. Сообщаются количественные данные о частоте их появления в текстах различных стилей современного болгарского и русского языков. Вы-
-10-
явлены общность и различия их глоттометрического поведения в сопоставляемых языках.
Впервые эксплицитно глоттометрическое освещение получила префиксальная система болгарского и русского языков, что позволило локализовать наблюдаемые в употреблении ППМ различия, а также выявить сложное взаимодействие префиксального и препозиционного типов употребления. Сделана попытка выделения групп ППМ по формально-семантическому принципу и впервые сообщаются статистические данные о распространении этих групп в каждом из сопоставляемых языков по стилям, а также о межъязыковой асимметрии их распределения.
Теоретическое значение исследования, В диссертационном сочинении продемонстрированы возможности использования глоттометрической методики исследования не только на синхронном уровне, но и в диахронии. Даются объективные критерии оценки употребительности исследуемых фактов в разные периоды развития болгарского языка. Полученные количественные данные о распространении ППМ в различных по стилю текстах болгарского и русского языков открывают новые перспективы для дальнейших изысканий в области сопоставительной стилистики.
Статистический анализ позволяет вскрыть незаметные для невооруженного взгляда тенденции развития, скрытые взаимосвязи, обнаружить подчас неожиданную взаимозависимость и обусловленность наблюдаемых изменений или расхождений.
Практическая ценность исследования определяется тем, что его результаты могут быть использованы в учебных курсах по теории и истории болгарского языка, в спецкурсах по частной теории перевода, а также при создании учебников болгарского языка и учебных пособий по функциональной стилистике и практике перевода.
Представленные в работе количественные данные могут быть особенно полезны для разработки компьютерных тестов, роль которых в иноязычном обучении с каждым годом становится все значительней.
-11 -
Апробация работы. Основные положения диссертационного исследования отражены в шести публикациях в отечественных и зарубежных изданиях, а также изложены автором в докладах на международных лингвистических конференциях в России и Болгарии.
Метод исследования
Для решения поставленных в работе задач сравнительно-исторический и сопоставительный методы исследования языковых фактов применялись в сочетании с глоттометрическими (математико-статистическими) методами, позволяющими объективно оценить количественные изменения в употреблении изучаемых морфем, статистически точно определить связанные с ними различия между русскими и болгарскими текстами, между болгарскими текстами разных периодов, между стилистически различными болгарскими и русскими текстами.
"Едва ли в настоящее время может быть дискуссионным вопрос о применимости статистической методики в изучении языка, - этот вопрос решен положительно практикой лингвистических исследований", - так писал о лингвостатистике Б.Н.Головин еще в 1971г. (с. 113). За истекшие 30 лет статистический метод нашел широкое применение во всех областях лингвистического исследования: в фонетике, лексикологии, морфологии, синтаксисе. Особенно успешно используется статистическая методика в области языко- вых и речевых стилей.
Накопленный к настоящему времени опыт языковедческих и литературоведческих исследований позволяет утверждать, что языку объективно присущи количественные признаки и количественные характеристики. Многие ученые, описывая язык, вынуждены пользоваться такими количест-венными понятиями, как "часто", "редко", "употребительно", "неупотребительно" и т.п. Не было случайным и обращение к количественным оценкам элементов языка в работах таких больших ученых как И. А. Бодуэн де Куртене, А.М.Пешковский, В.В.Виноградов и др. Интересно, что еще в 1938 г. В.В.Виноградов писал: "По-видимому, в разных стилях книжной и разговор-
-12-
ной речи, а также в разных стилях и жанрах художественной литературы частота употребления разных типов слов различна. Точные изыскания в этой области помогли бы установить структурно-грамматические, а отчасти и семантические различия между стилями. Но, к сожалению, пока еще этот вопрос находится лишь в подготовительной стадии обследования материала." И далее: "Анализ всех грамматических категорий должен уяснить их относительный функциональный вес в разных стилях литературного языка". ( с. 150-156).
Эти высказывания одного из виднейших представителей классического языкознания не оставляют сомнений в том, что необходимость количественных характеристик в науке о языке была осознана не только сторонниками лингвостатистики.
Применение статистического метода в лингвистике позволило установить, что между количественными и качественными явлениями в языке существует тесная связь. Морфемы высокой частотности (сихноморфемы) несут меньше информации, чем низкочастотные морфемы (спаниоморфемы). Именно этот принцип, в сущности, и лежит в основе разграничения объектной области грамматики (науки о сихноморфемах: аффиксах и окончаниях) от объектной области лексикографии (науки о спаниоморфемах). Впервые термины сихно- и спанио- морфемы вводятся Н.В.Котовой и М. Янакие-вым в 1968 году ( с.58 и далее).
Исследование лексического состава языка статистическими методами привело к созданию частотных словарей, без которых нельзя себе представить на современном этапе ни систем машинного перевода, ни хороших учебников для обучения иностранным языкам.
Как уже отмечалось ранее, обнадеживающие результаты получены исследователями в области статистической стилистики. Эта область науки, как и статистическая лексикография, уже представлена многими именами и конкретными исследовательскими работами. В настоящее время у нас и за рубежом ведутся широкие исследования языковых и речевых стилей. В результате созрело понимание того, что функционирование языка вариативно
-13-
и эта вариативность, обусловленная различием видов человеческой деятельности, лежит в основе стилевой дифференциации языка и речи.
В этом отношении особенно показательны работы болгарского лингвиста Р.Мутафчиева. С помощью статистического метода ему удалось измерить количественно степень «живости» и «динамичности» языка художественной прозы и публицистики (1968), определить понятие «стиль» не только как систему, которой присущи определенные языковые средства, но и как систему, языковые средства которой находятся в определенной пропорции. На основе статистического анализа Р.Мутафчиев установил, что между частями речи в тексте существует взаимосвязь (корреляция). Статистика различает два вида корреляции: положительную и отрицательную (1963). П.Ф.Рокицкий (1961, с. 105) определяет положительную корреляцию как прямую зависимость между признаками: при увеличении одного соответственно увеличивается и другой. Отрицательная корреляция выражает обратную зависимость между признаками: увеличение одного связано с уменьшением другого. Р.Мутафчиев установил, что глагол находится в отрицательной корреляции с существительным. Логическая категория «называние» обратнопропорциональна логической категории «действие» (1963, с.279). Отрицательная корреляция между существительным и глаголом является основным и существенным фактом грамматической системы языка. Эта корреляция определяет xapaicrep всех остальных корреляций между прочими частями речи. Это наблюдение получило развитие в трудах М.Янакиева (1977) под названием «глагольная температура текста».
Проблема изучения стилей стала осознаваться по-иному. По сравнению с недавним прошлым, она приобрела под влиянием статистического изучения фактов большую отчетливость и определенность. Проблема стилевой дифференциации средств языка все отчетливее осознается как одна из главных проблем современной науки о языке.
О значении статистического анализа, о возрастающей его роли пишет В.А.Москович:"... резко возрастает роль статистических данных как объек-
-14-
тивного показателя количественных взаимоотношений между единицами семантики и статистики речи как метода, позволяющего вскрыть некоторые закономерности функционирования этих единиц. Достаточно упомянуть о том, что надежные данные о совместной встречаемости слов в тексте - данные, без которых немыслим ни один серьезный семантический словарь, могут быть получены только путем статистического анализа текста. Здесь не поможет всесильная интуиция - память лингвиста не в состоянии удержать огромное количество изменчивых факторов, характеризующих соположение слов в -различных видах речи." (1969,с.5).
Даже столь краткий обзор возможностей использования статистической методики в лингвистике говорит о необходимости ее дальнейшего развития и совершенствования. Труд лингвиста, пользующегося статистическими методами, благодарен, но чрезвычайно кропотлив. В ряде случаев количественные данные подтверждают существующие о явлении представления. Но нередко они способны опровергнуть утвердившиеся ранее положения. Статистический анализ вскрывает незаметные для невооруженного глаза тенденции развития явления, скрытые взаимосвязи, обнаруживает подчас неожиданную взаимозависимость и обусловленность наблюдаемых изменений. В данной работе на примере нашего исследования мы попробуем проиллюстрировать эти утверждения.
Как уже указывалось ранее, используемые в работе статистические методы позволили ограничить исследование вышеперечисленных текстов исследованием выборок (размером в 15 килофон) из этих текстов.
Выборка составляется из произвольно взятых проб. Каждая проба равна 1 килофоне, то есть содержит в себе 1000 монофон. (Монофона -отрезок текста, обозначенный одной буквой фонемной транскрипции). ш - во всех исследуемых текстах принято считать за 2 монофоны.
\|/ и \ - 2 монофоны.
Оу; Ю; !А; ЕК ; ьь; К -1 монофона.
-15-
Ъ и Ь - в староболгарских и среднеболгарских текстах - 1 монофона независимо от позиции.
Ъ и Ь в слабой позиции в дамаскинах не считались.
Я; Ю - в современных болгарских текстах в позиции начала слова и после гласного - 2 монофоны.
В данной работе исследуются выборки равной длины (по 15 килофон).
В каждой из 15 проб выборки определяется частота появления исследуемого факта /X/. Полученные данные суммируются, тем самым определяется общее количество появлений факта в выборке. Затем определяется средняя частота 1x1 путем деления общего количества появлений исследуемой морфемы в выборке на количество проб в выборке /N/.
Средняя частота 1x1 является одной из количественных характеристик текста.
Следующей, не менее важной, количественной характеристикой является О - среднее квадратичное отклонение.
Среднее квадратичное отклонение характеризует степень рассеяния, объективное рассеяние исследуемого факта в выборке. Чем неравномерней распределение частот появления исследуемой морфемы в выборке, тем
больше числовое значение О.
По поводу этой количественной характеристики М. Янакиев писал: «... без учета оценки неравномерности рассеяния исследуемых фактов в тексте, нет истинной статистики, нет глоттометрии, нет истинной стилистики, достойной звания науки последней четверти нашего столетия, а есть лишь " статистикуляция ", сознательная лженаука или наивная, суеверная арифмолатрия» (1977, с. 194). Величина рассеяния / G / вычисляется по следующей формуле:
N-\
-16-где: ?( Xi - /X/)2 - сумма квадратов отклонений наблюдаемых частот от
средней частоты по модулю.
(/X/ - X)2 - квадрат отклонения средней округленной до целых единиц частоты IxJot средней неокругленной частоты X. N - количество проб в выборке. Используя среднее квадратичное отклонение и среднюю частоту X
можно определить коэффициент вариации V:
V = -?=-100 % X
При V большем 30%, можно использовать критерий t Стьюдента для
оценки значимости статистических различий между выборками.
Степень различия между выборками по средней частоте появления исследуемой морфемы определяется t - критерием Стьюдента, называемым еще параметрическим критерием. В математической статистике этот критерий используют для определения существенности/несущественности (случайно- сти/неслучайности) различий, наблюдаемых между средними арифметическими, т.е. основными параметрами двух вариационных рядов.
Этот критерий позволяет при сравнении текстов учитывать не только
X (среднюю частоту), но и О (величину рассеяния факта), существенно
влияющую на величину t.
Так, определяя степень различия между современными болгарскими текстами по частоте появления морфемы В(У) в префиксальном употреблении, исходя из значений X в текстах драматургических (X =0,53); беллетристических (X - 2,53) и научных (X = 2,0), можно было предположить, что степень различия между драматургическими и беллетристически-ми текстами больше, чем между драматургическими и научными. Однако
учет величины рассеяния факта в текстах (Одрам. = 0,41; О" белл. = 7,84; С науч. = 3,22) существенно изменяет положение и степень различия между
-17-
драматургическими и научными текстами (t = 3,0) оказывается более существенной, чем степень различия между драматургическими и беллетристическими текстами (t = 2,70 при tO5% =2,05 toio/0 = 2,76).
Оценка степени различия между двумя выборками равной величины по частоте исследуемого факта t - критерием Стьюдента производится по следующей формуле:
N
где: IX -У I - разница средних частот появления исследуемой морфемы в сравниваемых текстах по модулю;
о х + О у - сумма квадратов отклонений наблюдаемых частот от
вычисленных для сопоставляемых выборок средних;
N - количество проб в выборке.
Затем полученная величина t проверяется по таблице критических значений t ( критерия Стьюдента). В графе, соответствующей величине f (f степень свободы варьирования частот; f = 2N — 2), находим критические значения величины t для пяти- и одно- процентной вероятности получения t.
Если определенное нами значение больше критического значения t 1%-ой вероятности, различие между исследуемыми текстами существенно, значимо, неслучайно.
Если определенное нами значение меньше критического значения t 5%-ой вероятности, различие между исследуемыми текстами несущественно, случайно.
Если же определенное значение больше критического значения 15%-ой вероятности, но меньше 11%-ой вероятности, то на этом уровне исследования мы не можем дать ответа на вопрос (критическая зона) и для его решения нужны дополнительные исследования - увеличение выборки или увеличение проб выборки. Практически при определении существенности |