21.02.2017 г.
Главная arrow Главная arrow О связи математической лингвистики с новой теорией чисел и о нарушении многолетних традиций Академии





О связи математической лингвистики с новой теорией чисел и о нарушении многолетних традиций Академии Печать E-mail
Автор Редактор   
13.12.2016 г.
Редакция сайта предлагает нашей аудитории очень необычную статью известнейшего математика, академика РАН Виктора Маслова, которая, между прочим, написана, как нам представляется, на стыке математической лингвистики, филологии, культурологии и даже философии, что делает её в высшей степени интересной и продуктивной.

 Она оказалась также столь богата и в литературном отношении, что может пленить многих читателей и ценителей литературы как настоящее произведение искусства. Пусть самый далекий от теории чисел читатель не пугается редких формул в начале текста и смело погружается в него. Он получит истинное наслаждение, как от содержания авторских размышлений, так и от эстетичного научно-художественного стиля,  которым они выражены.

Поскольку файл-оригинал, присланный нам автором в формате pdf, технически не может быть перенесен на сайт, нам  пришлось его конвертировать в текстовый формат, но, увы, конвертор не способен к воспроизведению формул. Поэтому для корректного их воспроизведения два первых абзаца Введения  приводим в рисуночном формате jpeg. Учитывая возможные др. эффекты конверсии, в конце данной статьи приводим ссылку на оригинал в формате pdf.

Статьи Виктора Павловича Маслова регулярно публикуются на сайте Движения «За возрождение отечественной науки», часто радуя нас неожиданными идеями, подходами и наблюдениями.

 

     Анатолий Самарин,

   главный редактор сайта

 

О связи математической лингвистики с новой теорией чисел и о нарушении многолетних традиций Академии наук

В.П. Маслов

1    Введение

maslov_v_vvedenie_2_abz.jpg

Кроме того, использование отрицания в языке (т.е. утвердительных и отрицатель­ных конструкций) также роднит лингвистику с теорией чисел, если ввести в рассмот­рение отрицательные числа. Это сделал автор в своих последних работах [1], [2], [3]. Отрицательные утверждения аннигилируют утвердительные утверждения, подобно тому, как дезинформация "гасит" информацию или долги аннигилируют деньги. Вве­дение отрицательных чисел в теорию чисел достаточно непривычно. Даже введение нуля в теорию чисел оказалось настолько неожиданным для крупнейшего специали­ста в этой области И.Р.Шафаревича, что он в своём интервью для сборника "Мехма-тяне вспоминают" упомянул автора как одного из самых "непонятных" математиков типа Н.Н.Боголюбова и сказал, что предъявлял контрпример в связи с включени­ем нуля в теорию чисел. Я много раз просил сына Шафаревича - моего ученика -объяснить ему, что ошибается он, а не я. Почему я так настаивал? Мало ли кто из математиков ошибается? Но математики никогда не найдут у меня математической ошибки или дыры в доказательстве, потому что я смертельно боюсь, что тогда они будут утверждать, что я физик, а не математик, как это случилось с Фаддеевым, у которого в математике, якобы, видны "ухи Фаддеева"1. Однако многичисленные попытки переубедить Шафаревича ни к чему не привели (он даже не пришёл на выборы в Академию, чтобы хотя бы поддержать сына и отдать ему свой голос). 

1См. дискуссию на сайте http://ivanov-petrov.livejournal.com/419957.html#t 112193653


 

Я хочу сказать, что даже включение нуля непривычно для специалистов по теории чи­сел, тем более для них настолько непривычно включение в рассмотрение больших отрицательных чисел, что они будут априори его категорически отвергать.

Критика обычно такая: во-первых, это неверно, во-вторых, это уже известно. Ко­гда школьника попросили найти икс в уравнении, написанном на доске, он восклик­нул радостно: "Да вот же он!", указывая на x. Точно так же, увидев нуль в работе по теории чисел, критик воскликнет радостно: "Да он уже употреблялся в теории чисел!" (см. ниже).

Автор неоднократно получал отрицательные отзывы на свои теории и отрицал эти отзывы [4], [5]. Тут срабатывает знаменитый тезис гегелевской философии -"отрицание отрицания" и проявляется тесная связь математики с философией. В области математической логики, продолжающей школу Лузина (который был избран в Академию наук по отделению философии), работали такие знаменитые ученые, как П. С.Новиков, Л.В.Келдыш, А.И.Мальцев и др., каждый из которых внес огромный вклад в эту область науки и создал замечательную школу.

В этой работе мы коснемся вопросов как математической лингвистики, так и об­щей лингвистики в связи с законом Ципфа (см. [6], [7]) и проведем некоторые парал­лели между языком и другими субстанциями, которые исследует математика. Автор полагает, что новая теория чисел, включающая отрицательные числа, несомненно, должна привести к новым интересным результатам в математической лингвистике. И без сомнения, компьютерный счет и математическая лингвистика должны суще­ственно помогать в проведении лингвистических экспертиз разной направленности. С другой стороны, можно высказать гипотезу, что замечательный закон Ципфа может дать новые распределения для числа степеней свободы D дополнительно к распре­делению Гиббса по энергиям.

2

 

Известно, что естественный язык включает в себя большое количество подъязыков и диателектов, носители которых с легкостью узнает друг друга. Общий язык -это базовый фактор в дихотомии "свой - чужой". По интонации, акценту, ударени­ям представители определенного страта общества немедленно определяют "своего" или 'чужого". При желании вписаться в некоторую социальную или профессиональ­ную группу можно всего лишь начать говорить на соответствующем языке, который может сильно отличаться от литературного во всех аспектах: и фонетически, и грам­матически и стилистически, а также по объему словаря. Если оратор будет говорить на литературном языке, очень грамотно, перед малограмотной аудиторией, то каким бы талантливым он ни был, аудитория мгновенно почувствует чужого и будет раз­дражена. Я помню, как я спросил пожилую женщину в троллейбусе: "Вы выходите у клуба Каучук?" Она повернулась ко мне и раздраженно ответила: "У клуба Каучук схожу." В ее диалекте ударение падало на другой слог.

В блатных (воровских) жаргонах тоже есть свои языковые правила. Например, ес­ли представитель криминального мира спрашивает: "По фене хрюкаешь?", это озна­чает желание оскорбить. Чтобы избежать конфликта, нужно ответить вежливо: "По фене ботаю". Когда у Милюкова спросили, приличные ли у него отношения с Марко­вым 2-ым, он ответил: "Что значит приличные? Я всегда был приличен, а он всегда был неприличен."

Вот как такое речевое поведение, основывающееся на Библейской заповеди непротивления злу насилием, описал Алексей Толстой в стихотворении "Великодушие смягчает сердца".

Вонзил кинжал убийца нечестивый

В грудь Деларю.

Тот, шляпу сняв, сказал ему учтиво:

«Благодарю».

Можно привести много примеров использования специальных языков в различ­ных социальных и профессиональных сообществах.

Если вы тихо просвистите музыканту мотив "до-ре-ми до-ре-до", то можете полу­чить по физиономии, т.к. на профессиональном языке музыкантов это оскорбление.

В английском языке существует консервативный диалект (conservative English) -аристократический английский, который используется членами парламента и члена­ми королевской семьи. Мой друг, женатый на представительнице рода Гамильтонов, говорил, что когда его жена разговаривает с предствителями круга английских ари­стократов, ее речь фонетически сильно отличается от общепринятого английского произношения.

Продолжая эти соображения, замечу, что будучи под впечатлением от романа М.А. Булгакова "Мастер и Маргарита", определенный страт общества говорил на языке Коровьева и Бегемота, и тем самым поклонники Булгакова немедленно узна­вали друг друга, что их объединяло. До Булгакова такую связующую роль играли романы Ильфа и Петрова. Напомню фрагмент речи тов. Гаврилина: "И вот этот трамвай, товарищи, который сейчас вышел из Депа, благодаря кого он выпущен? Благодаря вот вас, товарищи, и благодаря честного советского инженера."

  3

 

Другой аспект естественного языка, существенный с точки зрения теории чисел, свя­зан с его насыщенностью и избыточностью. Образно говоря, слова в человеческой речи сильно "теснятся" друг к другу. Это выражается в том, что говорящий часто разрежает свою речь, произнося между словами бессмысленные междометия "эээ" (начинает "экать"), слова типа "вот", "значит", "как бы", нецензурные слова или их евфемиизированные эквиваленты (блин, ёлки-палки) и т.п. Для большей вырази­тельности речи хочется заикаться, как бы от волнения, чтобы, как сказал Черчилль, "овладеть вниманием палаты".

Автор писал об аналогии понятия жидкости с человеческой толпой: в обоих слу­чаях число степеней свободы в многочастичной системе мало [2]. Точно так же слова, связанные в речи, могут обладать малым числом степеней свободы.

Нагромождение слов характерно для устной речи, когда оратор говорит спон­танно и может начать путаться в языке, как человек, который хочет выбраться из столпотворения. В письменной речи у человека есть больше свободы для обдумыван-ния и поиска нужных слов и их сочетаний. Маяковский писал: "Изводишь, единого слова ради, тысячи тонн словесной руды". И совсем изнемогая, он написал: "Я кон­чил, ... и пусть, озверев от помарок, об этом пишет себе Пастернак ..." Приведу в качестве примера "муки творчества" одного из героев романа Булгакова "Мастер и Маргарита" поэта Бездомного.


Трудно сказать, что именно подвело Иван Николаевича - изобразительная ли сила его таланта или полное незнакомство с вопросом, по которому он собирался писать, - но Иисус в его изображении получился ну совершенно как живой, хотя и не привлекающий к себе персонаж.

И еще фрагмент. Бездомный, потрясенный встречей со странными незнакомцами и гибелью своего наставника Берлиоза, торопится написать заявление в милицию.

" В милицию. Члена МАССОЛИТа Ивана Николаевича Бездомного, за­явление. Вчера вечером я пришел с покойным М.А.Берлиозом на Патри­аршие пруды..."

Сразу поэт запутался, главным образом из-за слова "покойным". С места выходила какая-то безлепица: как это так - пришел с покойным? Не ходят покойники! Действительно, чего доброго, за сумасшедшего примут!

Подумав так, Иван Николаевич начал исправлять написанное. Вышло следующее: "... с М.А.Берлиозом, впоследствии покойным ..." И это не удовлетворило автора. Пришлось применить третью редакцию, а та ока­залась еще хуже первых двух! "... Берлиозом, который попал под трам­вай..." - а здесь еще прицепился этот никому не известный композитор-однофамилец, и пришлось вписывать: "... не композитором..."

Подобная же ситауация, когда в голове говорящего сталкиваются различные слова и мысли и когда число степеней свободы становится очень небольшим, характерна для игроков в шахматы, впервые играющих в блиц-партиях.

 4

 


С вопросом о степенях свободы в языке связан также вопрос о линейном поряд­ке слов в предложениях. В этом отношении языки синтетического типа (например, русский) допускают больше свободы, чем языки аналитического типа (например, ан­глийский) . Минимализм морфологических форм в последних языках компенсируется более жестким порядком слов. Так, например, в русском языке мало различаются по смыслу фразы "Мальчик любит девочку" или "Девочку любит мальчик". А в английском " The boy loves the girl" и " The girl loves the boy" имеют разный смысл.

Однако линейный порядок слов в предложении, хотя и может быть не совсем сво­бодным, все же более свободный, чем порядок букв алфавита в слове. Порядк букв в словах строго фиксирован. И тем не менее случайные "очепятки" не слишком мешают восприятию слова. Аналогично, если переставить местами слоги в разных словах, то текст получится исковерканным, но тем не менее понимаемым. Например, известная детская нелепица звучит следующим образом: Я гитал на играре. Вдруг стропнула луна. Я убежал на выбицу, но завки-то все лаперты. Эти фразы, несмотря на не разрешенные в языке перестановки, без труда понимаются носителем русского язы­ка. Эти явления свидетельствуют о том, что язык страхует носителя языка от таких нарушений своей избыточностью - мы легко догадываемся о том, каким должен быть правильный вариант, основываясь на знании грамматики и лексики.

Говоря о насыщенности и богатстве естественного языка, можно сравнить есте­ственные языки с языками-пиджинами (англ. pidgin - упрощённый язык, который развивается как средство общения между двумя или более этническими группами, говорящими на разных языках). В качестве примера можно привести так называе­мое Маймачинское наречие, или Маймачин, смешанный русско-китайский диалект, употребляемый китайцами в сношениях с русскими на русско-китайской границе в Маймачине и в Кяхте [8], [9], [10]. Особенностью Маймачина является упрощенная грамматика, ориентированная на грамматический строй китайского языка, а сло­варь, заимствованный из русского языка. В частности, синтетические формы скло­нения существительных и спряжения глаголов в этом языке заменены аналитиче­скими формами - сочетанием самостоятельных слов (как в китайском). Например, "он живет в Ивановом доме" звучало "Ивана дома поживи-еса" (еса - искаженное есть, употребляемое для обозначения настоящего времени; для прошедшего времени использовался показатель было, для будущего буду во всех лицах и числах). Обычно в пиджине словарный запас невелик (всего около полутора - двух тысяч слов).

Примером вырожденного языка с минимальным объемом словаря может служить язык Эллочки-людоедки, героини романа упомянутых выше Ильфа и Петрова, лек­сикон которой состоял всего из 30 слов. Тем не менее, она могла выразить ими прак­тически любую свою мысль.

Меня всегда интересовали специальные подъязыки различных социальных групп, и я владею некоторыми из них в такой степени, что могу быть принят за "своего" в соответствующей среде. Проиллюстрирую это нижеследующим примером.

Я, как член Редакционного совета одного математического журнала, по старым академическим правилам могу без рецензирования печатать статьи (по крайней мере краткие сообщения) в этом журнале. Зам. главного редактора, который является одним из основателей этого журнала, уверил меня, что мое сообщение не будет ре­цензироваться, и, по существу, уговорил меня дать статью в этот журнал, чтобы, как сказал он, поднять его рейтинг. Однако своего слова он не сдержал впервые за 65 лет нашей дружбы, и мое краткое сообщение было отправлено на рецензию во Францию. Когда из Франции пришел отрицательный отзыв на французском языке, он сказал мне интимным голосом: "Снимите статью, а то будет хуже." Это навеяло мне ассоциацию с фразой из Булгакова: "Не звони, Римский, а то худо будет."

Но отрицательный отзыв иногда повышает рейтинг известности рецензируемого. Так, отрицательный отзыв Л.Н.Толстого на одно стихотворение Игоря Северянина сделал последнего настолько знаменитым и популярным, что люди стали толпами ходить на его концерты.

Рецензенты научных статей обычно пишут анонимно, но какая-то надежда всегда остается: вдруг они окажутся уровня Л. Толстого.

Содержание отзыва французского рецензента было коротким:

L'article presente une suite d'analogies entre certains domaines de la physique et des mathematiques.

Il ne comporte aucune proposition ni aucun theoreme, et offre donc peu de prise au jugement, en tout cas de la part du present rapporteur.

L'ambition de l'auteur de "generaliser la theorie analytique des nombres aux nombres negatifs" est assez nebuleuse. Elle demanderait a etre etayee par des enonces nouveaux, clairs, demontres ou conjecturaux, pour trouver sa place dans une publication scientifique serieuse.

Je recommande de ne pas publier cet article.

Французскому рецензенту не сообщили, что моя заметка была подана как краткое сообщение, в котором невозможно было изложить мою концепцию в полном объеме.


Получив отрицательный отзыв от французского рецензента, я не очень испугался, но действительно, скоро получил другой отзыв, автор которого учил меня хорошему тону и сообщал истины, которые я знал еще в школе. Приведу фрагменты этого отзыва.

Отзыв рецензента

Содержание работы сложно описать, поскольку в ней отсутствуют какие-либо сформулированные утверждения. Поэтому я начну со списка своих замечаний.

1. Аннотация.  Эта, по идее, самая прозрачная часть статьи написана
невнятно. Скажем, употребление кавычек в ней - это дурной тон. "Бес­
конечно большие" величины нужны автору для собственных физических
соображений, которые до чтения основной части работы читателю все
равно не передать.

2.       Вторая строчка: "В той аналитической теории чисел, которая была из­
вестна до сих пор, рассматривались только неотрицательные числа." Это
неверное утверждение. Аналитическая теория чисел изучает не только
положительные числа и, вообще, не только действительные числа. Вспомним, например, вычеты, целые Гаусса, квадратичные поля, кватернионы, всевозможные расширения, редукции и так далее.

Далее перечисляется список опечаток. В заключение рецензент написал:

Рассуждения философского толка не являются предметом математическо­го журнала. В свете отсутствия новых доказанных результатов и нового научного содержания, настоятельно рекомендую не публиковать эту ра­боту.

"Есть Божий суд", сказал поэт. У нас же существует лингвистическая экспертиза, о которой говороилось выше и цель которой определить, насколько речевое произве­дение2 политкорректно и может ли оно нанести моральное оскорбление тому, кому адресовано.

Брюсов придумал рифму:

Слышен свист и вой локомобиля -Дверь лингвисты войлоком обили.

Вероятно, имеется в виду, что дверь обили, чтобы лингвисты в тишине могли зани­маться лингвистической экспертизой.

В лингвистической экспертизе существенным моментом для определения степени оскорбительности является разница в возрасте участников коммуникативной ситу­ации: автора и получателя сообщения, в данном случае рецензии. Вероятнее всего, учитывая мой возраст, рецензент, позволивший себе некорректные выражения в сво­ем отзыве и обвинивший меня в дурном тоне, значительно моложе меня, Поэтому подобные высказывания воспринимаются, мягко говоря, как недопустимые. Однако редакция не сочла нужным принести извинения за тон рецензии, а напротив, под­держала рецензента, возраст которого остается мне неизвестным.

Я написал мой ответ в редколлегию на русском "кокни" - хамском языке, как это говорили в старое время (имея в виду холопский язык), чтобы не отвечать в том же недопустимом тоне. Этим диалектом я хорошо владею. Приведу его здесь.

В лингвистике под речевым произведением понимается законченная мысль, выраженная в речи.


Многоуважаемая всеми Редакция!

Я человек к хамству, безусловно, привыкший. У меня беспартийный стаж, может быть, с 1930 года. Я, может быть, и в комсомолах всего год промы­кался и, помнится, из пионеров меня выперли за хамство. Так что я буду к хамству вполне привыкший. А вот мой соавтор, чистый полуинтелли­гент, у него чуть что подскакивает, я извиняюсь, давление. Т.е. энергия, но деленная, к счастью для рецензентов, на объем "Vкавычках (изви­няюсь за дурной тон). А рецензенты, видно, ни в одном глазу, и понятия не имеют - объем чего? Пузырька ли с каплями тов. Зеленина или, может, бочкотары? И грозят мне за философию, обзывая антифашистом.

Ну что с трезвого человека, рецензента, взять? Ругают-то за глаза. Один выражается по-русски, а другой из-за забора лает по-французски.

За глаза можно. А за что другое ругать боятся. Боятся "по когтям узнать меня тотчас".

С многим уважением, Милостивые Г-и, Завсегда ваш Вихтор Маслоу

Думаю, если бы Е.Горин, который является лучшим в мире специалистом по тако­му языку, прочитал бы это письмо вслух на редколлегии, добавляя свои интонации, то безусловно, имел бы успех и разрядил бы атмосферу обычно очень утомительных заседаний редколлегии.

Брюсов написал отрицательный отзыв на один из ранних сборников Марины Цве­таевой. В ответ она написала стихотворение:

... Я забыла об этом,

Что поэзия ваша из книг

И из зависти - критика. Ранний старик,

Вы опять мне на миг

Показались великим поэтом...

И этим очаровательным коротким стихом убила Брюсова как поэта.

5

 

Как сказано выше, естественный язык по словарному богатству и по смысловой на­сыщенности речевых произведений является ярким контрастом языкам типа пиджин и всякого рода искусственным языкам. Это, в частности, выражается в способности носителей языка каламбурить3. Естественный язык предоставляет такое количество средств, что практически на основе любой фразы можно построить каламбур.

Каламбур рождается как спонтанная мгновенная реакция говорящего на сказан­ную кем-либо фразу. Именно спонтанность и быстрота реакции придает каламбуру

3Каламбур — литературный приём с использованием в одном контексте разных значений одного слова или разных слов или словосочетаний, сходных по звучанию.


особую лингвистическую значимость. В момент рождения каламбура у говоряще­го в его лингвистическом сознании сразу активизируется большой пласт лексики, из которого он более или менее бессознательно вырывает отдельные слова. В такой ситуации, образно говоря, слова испытывают столкновения и характеризуются ма­лым числом степеней свободы: каламбур вырывается в виде необдуманных сочетаний слов и это может привести к непростительному faux pas, согласно пословице "Ради красного словца не пожалеет и отца".

Это случилось со мной на банкете в компании художников, знаменитого актера и балерин. Речь шла об удивительном пейзаже именинницы. На хвалебные слова о пейзаже у меня вырвался тост:

Пей за же!

Мой приятель Вадим Кнорре спас положение, тут же поправив меня : "Пей за жен­щин!"

Вообще лучшим каламбуристом на моей памяти был именно Кнорре, а я только старался не отставать от него. Например, он мне писал, когда я отдыхал на Кавказе:

Витя, Витенька,

Счастье вытянь-ка.

А ну кто с Витей

Гнездо сумеет свить, эй!

В сердечных вопросах он ветеран.

Сколько нанес уже Витя ран!

и т.д.

Я отвечал:

Жизнь течет моя Очень бурная, Жизнь чечеточная, Хачапурная. Жизнь коньячная, Чебуречная, Жизнь растраченная С первой встречною.

Писать стихи или каламбурить на маймачине, "по фене", на языке лабухов-музыкантов или на языке Эллочки-людоедки трудно. В этих "языках" слишком маленький словарь.

Конечно, приведенные мной строки, не стихи, а стихоплетство, упражнения с языком. Хотя из такого каламбуризма, точнее близкой к нему глубокой рифмы, Ма­яковский создал великое "Облако в штанах", а Хлебников "Настоящее". А вот неожи­данные находки гениальных поэтов:

Грустное


Что ж, пора приниматься за дело. За старинное дело свое. Неужели и жизнь отшумела, Отшумела, как платье твое?

Критик бы сказал: "твое - свое, что это за детская рифма? А платье не может шуметь" и т.п.

Или восторженное

Ты вернулся сюда, так глотай же скорей Рыбий жир ленинградских речных фонарей,

Критик: "Какая гадость!"

6

Следующий аспект естественного языка, который важно рассмотреть, это смысловая нагруженность отдельных знаков (слов и знаков препинания). Известно, что по смыс­ловой нагрузке не все слова в тексте одинаково информативны. В так называемом телеграфном стиле, применяемом в частности в телеграммах, содержание форму­лируется кратко, без знаков препинания, предлогов и союзов. Обычно исключение служебных слов и знаков препинания не мешает пониманию смысла телеграммы. Это в очередной раз свидетельствует об избыточности естественного языка: чтобы надежней передать содержание, язык предоставляет различные средства, которые отчасти дублируют друг друга (например, в языках синтетического типа, к кото­рым относится русский язык, одна и та же грамматическая информация выражается предлогом и падежным окончанием: в лес-у, о лес-е, за лес-ом и т.п.). Разумеется, в случае, когда пропуск знака в телеграмме может привести к недопониманию с фа­тальными последствиями, как в известном примере "Казнить нельзя помиловать", вместо знаков препинания в тексте пишут сокращенно “зпт" (запятая) или “тчк" (точка).

Крученых написал трактат о "Сдвигологии русского стиха". Маяковский заметил, что знак препинания в стихе может менять смысл. Например: "Довольно. Стыдно мне пред гордою полячкой унижаться" или "Довольно стыдно мне пред гордою по­лячкой унижаться".

Тем не менее, как уже было сказано, в большинстве случаев смысл текста, на­писанного в телеграфном стиле, понятен. И в "общем положении" в языке нюансы, связанные со знаками препинания, не очень важны. В японском языке, например, запятые используются по минимуму, текст может вообще не содержать ни одной за­пятой. Однако это не мешает его пониманию, т.к. роль знаков препинания играют другие языковые средства (частицы и порядок частей предложения).

Проводя аналогию с термодинамикой, можно сказать, что опущенные слова не влияют на общую энергию, они как бы находятся на нулевом уровне энергии, явля­ясь избыточными. Это союзы, предлоги, местоимения - слова, которые очень часто встречаются в речи. В информатике их называют "стоп-словами". Согласно закону Ципфа со статистической точки зрения язык представляет собой большое количество редких событий, в результате чего небольшое количество слов (стоп-слов) встреча­ется очень часто, а подавляющее большинство слов имеют очень невысокую частоту.


Частота слова и (самого частотного слова русского языка) примерно в 10 раз выше частоты слова о, которое в свою очередь встречается в 100 раз чаще таких обыден­ных слов как путешествие или мода. Примерно третью часть словаря составляют слова, встречающиеся в массиве текстов с единичной частотой.

Нужно понимать, что если мы говорим о законе Ципфа, как о законе теории чисел, то это значит, что мы переходим к схематичному, усредненному языку, к языку в общем положении.

Как было сказано, стоп-слова отвечают частицам на нулевом уровне энергии, т.к. они, по существу, мало влияют на смысл речевых произведений и не дают вклада в "энергию" текста. Согласно современной концепции теории чисел, включающей понятие аннигиляции, большое число частиц, не участвующих "в обороте" (т.е. в энергии) в экономике отвечает золотому запасу, в квантовой науке - Бозе конднсату и так называемой щели в спектре, в термодинамике - отрицательному давлению, т.е. отрицательной энергии и растяжению жидкости.

Чем уже словарь, тем соответствующий язык ближе к теории информации Ше-нона и к статистике Больцмана и тем дальше от статистики Бозе-Эйнштейна. В текстах на богатом языке перестановка слов, как правило, "в среднем" не меняет смысла, хотя это может нарушать грамматику (например, в немецком языке гла­гольные формы стоят в конце предложения, но если глагол переместить в начало или в середину, грамматика будет неправильной, но смысл текста все равно останет­ся понятным). Но, как говорилось выше, если переставить слова в таком "небогатом" языке, как маймачин, то перестановка слов меняет смысл, т.к. жесткий линейный по­рядок восполняет скудность грамматических средств. Например, фразы “моя твоя не понимай” и “твоя моя не понимай” имеют разный смысл. Таким образом, распре­деление Бозе-Эйнштейна, как и распределение Ферми-Дирака, отвечающее объему текста и словаря, применимо лишь к тем языкам, в которых перестановка слов во фразе существенно не меняет ее смысла.

Все высказанные соображения явно указывают на связь математической лингви­стики с новой теорией чисел, включающей ноль и отрицательные числа. Если осно­вываться на высказанных соображениях, то можно предположить, что если ввести понятие ранга в теорию чисел, то закон Ципфа будет востребован и в теории чисел.

7    Заключение

Согласно новой теории чисел, при числе степеней свободы D < 2 мы получаем огромное число частиц в бозе конденсате (точнее, в его аналоге для случая щели в спектре) и (главное) переход от распределения Бозе-Эйнштейна к распределению Ферми-Дирака [2], [3]. В языке эти явления тоже имеют место. А именно, высокая частотность встречаемости стоп-слов (т.е. служебных слов, которыми можно прене­бречь без ущерба для передачи смысла) является аналогом огромного числа частиц в бозе конденсате. А объем слов в словаре, встречающихся в соответствующем мас­сиве текстов один раз (около 30 % об общего объема словаря), равен числу единиц в Ферми-распределении в положительной области давления.

Список литературы

[1] V. P.   Maslov, "New Approach to Classical Thermodynamics", Math. Notes 100:1 (2016), 154-185.


[2] V. P. Maslov, "Large negative numbers in number theory, thermodynamics, information theory, and human thermodynamics," Russian J. Math. Phys., 23:4 (2016), 509-524. .

[3] V. P.   Maslov, "Tropical Topology", Math. Notes, 100:6 (2016), 889 - 892.

[4] В. П. Маслов, "К 100-летию И.М.Гельфанда", Матем. заметки, 94:6 (2013), 803-805 .

[5] В. П. Маслов, "Что я узнал от Б.М.Левитана", Матем. заметки, 96:1 (2014), 3-4.

[6] В. П. Маслов, Т. В. Маслова, " О законе Ципфа и ранговых распределениях в лингвистике и семиотике", Матем. заметки, 80:5 (2006), 718-732.

[7] Т. В. Маслова, "Об уточнении закона Ципфа для частотных словарей", Научно-техническая информация, серия 2, 11 (2006), 37-44.

[8] С. И. Черепанов, "Кяхтинское китайское наречие русского языка", Известия Императорской Академии наук по отделению русского языка и словесности, II :19 (1853), 370-377.

[9] G. Neumann, "Zur Chinesisch-Russischen Behelfesprache von Kjachta", Die Sprache, 12:2 (1966), 237-251.

[10] В. П. Маслов, "Замечание о компьютерно-ориентированном языке", Проблемы передачи информации, 39:3, (2003), 72-76.

______________________________

Файл - оригинал вышеприведенной статьи в формате pdf:

 http://www.forum.za-nauku.ru/index.php?action=dlattach;topic=4382.0;attach=1374

 

Последнее обновление ( 13.12.2016 г. )
 
« Пред.   След. »
Последние статьи
 
Экспорт новостей