Что у нас с БАСом? Сколько слов в русском языке и сколько слов в английском языке? Сколько слов в русском языке

Сколько слов в русском языке и сколько слов в английском языке?

Угрожающие попытки "развенчать мифы о великом и могучем"

Хорошо известно, что словарный запас различных языков неодинаков. Лексикон цивилизованного человека может в десятки раз превышать словарный запас представителя какого-нибудь дикого племени Африки. Также понятно, что и в пределах одного и того же языка у разных носителей словарный запас сильно различается: у ребенка и взрослого, у дворника и профессора... В любом случае, ни у кого не возникает сомнений, что более обширный словарь всегда связан с запасом знаний и интеллектуальным превосходством. А теперь внимание: что бы вы подумали, если бы вам официально заявили, что наш русский язык - дикарский, содержит в пять раз меньше слов, чем английский? Конечно, возмущенно оспорили бы эту чушь! Однако подобное "научное мнение" неоднократно транслируется в СМИ. Это не может не настораживать.

Последний раз это утверждение прозвучало с телеэкранов в 2011 году. Но обсуждать и анализировать легче не телепередачи, а печатные материалы, с которыми легче ознакомиться (например, в интернете). Так, можно заглянуть в архив журнала "Наука и жизнь". В 6-м номере за 2009 год опубликована доктора филологических наук (!), некоего Милославского, под издевательским названием "Великий, могучий русский язык". В нем автор "развенчивает мифы" о русском языке. В частности, утверждается, что "по весьма огрубленным подсчетам, словари английского литературного языка содержат порядка 400 тыс.слов, немецкого - порядка 250 тысяч, русского - порядка 150 тысяч". Из чего предлагается сделать выводы о том, что "богатство русского языка - миф" (почти дословная цитата). Вообще, статья написана в духе самооплевывания, характерного для начала 90-х; меня даже несколько поразила ее анахроничность. Не говоря уж о полной ненаучности.

Автор даже не упомянул о сложностях и проблемах подсчета слов и вообще о проблеме возможности и уместности сколь-нибудь научного определения и сравнения словарного запаса целых языков. Считаю необходимым привести следующие возражения.

1) В разных культурах различны критерии "допуска" слов в литературный язык. В континентальной традиции господствует централизованное планирование, тогда как у англосаксов во всем стихия рынка (неформальный подход). Например, у французов лексика проходит строгую цензуру со стороны такого органа как Academie Francais (Академия французского языка). Она решает, какие слова принадлежат литературному французскому языку, а какие нет. В силу такой цензуры сложилась ситуация, когда считается, что во французском языке, со всей его богатейшей литературой, не более 150.000-200.000 слов. В английском же каждый может придумать слово и сразу ввести его в язык. Так, Шекспир писал, что придумал около 1,7 тыс.слов из своего писательского словаря в 21 тысячу слов. Это, кстати, огромное достижение для писателя, его превышает только наш Пушкин: 24 тыс.слов, абсолютный и непревзойденный индивидуальный рекорд активного словаря всех времен - см. "Словарь языка Пушкина" в 4-х томах (М., 1956-1961). Большинство же образованных европейцев активно используют не более 8-10 тыс.слов, а пассивно - 50 тыс. и более.

Очевидно, названные автором той статьи 150.000 русских слов - это слегка округленный объем широко известного Большого Академического словаря русского языка (БАС), который в издании 1970 года в 17 томах насчитывал 131 257 слов. А английские 400.000 - это, по-видимому, последние издания Оксфордского и Вебстера. Причем в предпоследних изданиях этих же английских словарей слов было в несколько раз меньше (конкретику можно посмотреть в интернете). Откуда же такой прирост и почему их словари содержат больше слов, чем наши? Первая причина - беззастенчивый подсчет архаизмов, которые современные англичане и американцы, конечно же, не знают. В английской филологической традиции лексикой современного английского языка считаются все слова со времен Шекспира (современника Ивана Грозного и Бориса Годунова). В российской же традиции вся допетровская, а с подачи знаменитого лексикографа Ушакова - и допушкинская лексика считается древне- или старорусской.

Вторая причина в том, что стали еще менее строгими критерии "приема" новых слов в язык. Подходы к английскому языку становятся всё более смелыми, появляющиеся в интернете оценки просто фантастичны. Так, агентство GLM (Global Language Monitor, сайт www.languagemonitor.com) рапортует о появлении... миллионного слова в английском языке! По тому, какое слово считается миллионным, сразу понятно, за какую свалку мусора они пытаются выдать английский язык: это "слово" Web 2.0! И это наряду с тем, что (the) web ("паутина") считается отдельным словом. Очевидно, Web 1.0 тоже где-то посчитали как отдельное слово! Более того, они не стесняются считать словами словосочетания: в качестве 1 000 001-го слова посчитано "financial tsunami" - "Финансовое цунами". В таком случае и в русском языке наряду со словами "финансовый(-ая,-ое)" и "цунами" есть слово "финансовое цунами", которое можно посчитать. Впрочем, пуристы, составлявшие БАС, вряд ли включили в него слово "цунами", поскольку это иностранное заимствование (об этом см. следующий пункт ниже).

Для справки:

Анализ компании Global Language Monitor состоит из нескольких этапов. На первом этапе подсчитываются слова, которые вошли в известнейшие словари английского языка: Merriam-Webster"s, Oxford English Dictionary, Macquarie"s . При этом стоит заметить, что в последнее издание словаря Merriam-Webster"s вошло только 450 тысяч английских слов. На втором этапе сотрудники компании на основе специального исследовательского алгоритма учитывают все неологизмы английского языка. При этом производится анализ текстов в сети Интернет, включая блоги и другие неформальные сетевые ресурсы. Учитываются периодические издания, как в электронном, так и бумажном виде, новинки литературы различной направленности. Именно этот прием в работе компании Global Language Monitor вызывает шквал критических замечаний со стороны независимых экспертов. Главный упрек сводится к тому, что при подсчетах в лексику английского языка включаются как устаревшие слова и словосочетания, так и сленговые образования. Кроме того, при своем методе учета, компания учитывает и слова, употребляемые только в разновидностях английского языка, к примеру, в Китае и Японии. А это составляет порядка 20% от общего количества слов, которые признаются специалистами компании. Вдобавок ко всему, в качестве лексических новинок английского языка, учтены и языковые ляпы, допущенные Президентом США - Бушем.

Предлагаю: внести в словарь все ляпы Черномырдина и тем самым "перегнать Америку"!

Классические методы учета слов гораздо консервативнее. К примеру, Оксфордский словарь учитывает только 300 тысяч слов.

2) Английский не только создает свои, но и весьма активно заимствует чужие слова из языков всего мира. Мы жалуемся на засилье английских заимствований, но тот слой научно-технической и деловой лексики, который проник в наш язык с падением железного занавеса, - это лишь жалкая горсточка по сравнению с активными заимствованиями, без всякого ложного стеснения производимыми английским языком. Еще со времен Вильгельма Завоевателя он наполовину французский. Получается, что мы заимствуем заимствованное! Или, образно говоря, перекупаем купленное. А теперь, когда миллионы людей в транснациональных компаниях общаются на английском, который для них неродной, возникают целые пласты лексики "китайского английского", "латиноамериканского английского", "японского английского". Эти пласты лексики относятся к так называемым окказионализмам .

Для справки:

Окказионализмы - это слова, созданные спонтанно, для однократного употребления. Встает вопрос - с какого момента считать это слово частью словарного запаса? Сколько нужно повторений этого слова в речи или в печати, чтобы прийти к выводу, что оно перестало быть случайным артефактом и стало полноправной частью лексики?

Существуют также слова, ограниченные очень узкой частью социума. Скажем, одной семьей. Реальный пример: все члены одной известной мне семьи называют вареную картошку, поджаренную с колбасой, словом «второжарёнка». Это их собственное изобретение, и больше я такого слова нигде не встречал. Можно ли считать этот окказионализм полноправной частью русской лексики?

1. Сколько слов в русском языке?

Состояние русского языка по итогам ХХ века вызывает тревогу. Кажется, что наряду с депопуляцией страны происходит делексикация ее языка, обеднение словарного запаса. Это бросается в глаза особенно по контрасту с динамичным развитием русского языка в XIX веке и взрывной динамикой ряда европейских и азиатских языков в ХХ веке. В XIX веке русское языковое пространство быстро наполнялось, словарь Даля лопается от обилия слов, правда, и тогда уже обращенных скорей в прошлое, чем в будущее, — к старинным промыслам, ремеслам, вещам домотканого быта, к бытию человека в природе и сельском хозяйстве. Но также и нравственные, умственные явления представлены обильно: корней немного, но сколько производных, на один корень “добр” — около 200 слов! Густо разрослось, пышно, кажется, еще один век быстрого развития — и уплотнится население этой равнины, и станет весело от разнообразия лиц, голосов, смыслов.

Однако в ХХ веке пошел язык на убыль, вдвое-втрое, если не больше, поредела его крона, обломались ветви, и от многих корней остались черные пни, на которых еле держатся несколько веточек. Самое тревожное — что исконно русские корни в ХХ веке замедлили и даже прекратили рост, и многие ветви оказались вырубленными. У Даля в корневом гнезде -люб- приводятся около 150 слов, от “любиться” до “любощедрый”, от “любушка” до “любодейство” (сюда еще не входят приставочные образования). В четырехтомном Академическом словаре 1982 года — 41 слово.
Даже если учесть, что Академический словарь более нормативен по отбору слов, не может не настораживать, что корень “люб” за сто лет вообще не дал прироста: ни одного нового ветвления на этом словесном древе, быстро теряющем свою пышную крону. То же самое и с гнездом -добр-: из 200 слов осталось 56. Или вот корень “леп”, от которого дошли до нас слова: лепить, лепиться, лепка, лепнина, лепной, лепешка. Других бесприставочных слов, начинающихся с этого корня, в современных словарях нет. А у Даля: лепленье, леп, лепкий, лепковатый, лепкость, лепитель, лепщик, лепила, лепнуться, лепня, лепок, лепком, лепма, лепушка, лепа, лепеха, лепешица, лепеш, лепешник, лепешечник, лепешный, лепешечный, лепешковый, лепешковатый, лепёщатый, лепешить. Было у корня двадцать шесть веточек, осталось семь.

Во всех словарях русского языка советской эпохи, изданных на протяжении 70 лет, в общей сложности приводятся около 125 тысяч слов. Это очень мало для развитого языка, с великим литературным прошлым и, надо надеяться, большим будущим. Для сравнения: в Словаре В. Даля — 200 тыс. слов. В современном английском — примерно 750 тысяч слов: в третьем издании Вебстеровского (1961) — 450 тыс., в полном Оксфордском (1992) — 500 тыс., причем более половины слов в этих словарях не совпадают. В современном немецком языке, по разным подсчетам, от 185 до 300 тысяч слов.

Когда я спрашиваю своих филологически наблюдательных друзей, какими словами за последние годы обогатился русский язык, они начинают сыпать англицизмами. Нет, пожалуйста, с русскими корнями, — уточняю вопрос. Оживление быстро затухает, и с трудом из памяти извлекаются “озвучить”, “отморозок”, “беспредел”, “разборка”, “наезжать”, “париться” (“напрягаться”) и несколько других столь же неновых и в основном низкородных (блатных) слов, выскочивших из грязи в князи; список не меняется годами.
Между тем за пять лет нового века английский язык обогатился тысячами новых слов (а значит, и реалий, понятий, идей), созданных на его собственной корневой основе. Приведу несколько примеров, относящихся только к такой узкой области современной англо-американской культуры, как литературная деятельность: backstory (фактическая, документальная основа художественного вымысла); banalysis (банализ, банальный анализ); blog (блог, персональный сетевой дневник или форум); belligerati (писатели — сторонники войны и империализма); carnography (описание насилия); bibliotherapy (библиотерапия); fanfic (произведения, создаваемые на тему определенного фильма или телешоу его поклонниками); faxlore, xeroxlore (современный городской фольклор, распространяемый по факсу или на ксероксе); fictomercial (произведение, в которое писатель за плату вставляет наименования фирмы и ее продуктов); glurge (сентиментальная история, распространяемая по электронной почте); Internetese (сетеяз, язык сетевого общения)...

Если английский язык в течение ХХ века в несколько раз увеличил свой лексический запас, то русский язык скорее потерпел убытки и в настоящее время насчитывает, по самым щедрым оценкам, не более 150 тыс. лексических единиц.
Новейший “Большой академический словарь русского языка”, первый том которого выпущен в 2005 году петербургским Институтом лингвистических исследований РАН, рассчитан на 20 томов, долгие годы подготовки и издания. В него предполагается включить всего 150 тысяч слов — и это с учетом всего того, что принесли в язык послесоветские годы.

При этом следует признать, что в словарях русского языка огромное число “дутых” единиц — суффиксальных образований скорее словоизменительного, чем словообразовательного порядка. Как ни горько в этом признаться, представление о лексическом богатстве русского языка во многом основано на уменьшительных суффиксах, которые утраивают, а часто даже и упятеряют количество существительных, официально числимых в словарях.

— филолог, философ, культуролог, эссеист. С 1990 г. профессор теории культуры, русской и сравнительной литературы университета Эмори (Атланта, США). Член Союза писателей (с 1978 г.), Пен-клуба и Академии российской современной словесности. Автор 16 книг и около 500 статей и эссе, переведенных на 14 иностранных языков, в том числе “Философия возможного” (СПб, 2001), “Знак пробела. О будущем гуманитарных наук” (М., 2004), “Постмодерн в русской литературе” (М., 2005), “Все эссе”, в 2 тт. (Екатеринбург, 2005). Автор сетевых проектов “ИнтеЛнет”, “Книга книг”, “Дар слова. Проективный словарь русского языка” и “Веер будущностей. Техно-гуманитарный вестник”. Лауреат премий Андрея Белого (СПб., 1991) и “Liberty” (Нью-Йорк, 2000) за вклад в российско-американскую культуру.

Этот пост размещен также на

С запозданием обнаружил старую новость.

English passed the Million Word mark earlier today, June 10 at 10:22 am GMT
The Global Language Monitor today announced that Web 2.0 has bested Jai Ho , N00b and Slumdog as the 1,000,000 th English word or phrase added to the codex of fourteen hundred-year-old language. Web 2.0 is a technical term meaning the next generation of World Wide Web products and services. It has crossed from technical jargon into far wider circulation in the last six months…

At its current rate, English generates about 14.7 words a day or one every 98 minutes.


These are the fifteen finalists for the one millionth English word, all of which have met the criteria of a minimum of 25,000 citations with the necessary breadth of geographic distribution, and depth of citations.
1,000,000: Web 2.0 - The next generation of web products and services, coming soon to a browser near you.
999,999: Jai Ho! - The Hindi phrase signifying the joy of victory, used as an exclamation, sometimes rendered as “It is accomplished”. Achieved English-language popularity through the multiple Academy Award Winning film, “Slumdog Millionaire”.
999,998: N00b — From the Gamer Community, a neophyte in playing a particular game; used as a disparaging term.
999,997: Slumdog - a formerly disparaging, now often endearing, comment upon those residing in the slums of India.
999,996: Cloud Computing - The ‘cloud’ has been technical jargon for the Internet for many years. It is now passing into more general usage.
999,995: Carbon Neutral — One of the many phrases relating to the effort to stem Climate Change.
999,994: Slow Food — Food other than the fast-food variety hopefully produced locally (locavores).
999,993: Octomom - The media phenomenon relating to the travails of the mother of the octuplets.
999,992: Greenwashing - Re-branding an old, often inferior, product as environmentally friendly.
999,991: Sexting - Sending email (or text messages) with sexual content.
999,990: Shovel Ready - Projects are ready to begin immediately upon the release of federal stimulus funds...


In addition, the 1,000,001 st word is Financial Tsunami - The global financial restructuring that seemingly swept out of nowhere, wiping out trillions of dollars of assets, in a matter of months
Each word was analyzed to determine which depth (number of citations) and breadth (geographic extent of word usage), as well as number of appearances in the global print and electronic media, the Internet, the blogosphere, and social media (such as Twitter and YouTube). The Word with the highest PQI score was deemed the 1,000,000th English language word. The Predictive Quantities Indicator (PQI) is used to track and analyze word usage.
Global Language Monitor has been tracking English word creation since 2003. Once it identifies new words (or neologisms) it measures their extent and depth of usage with its PQI technology.

http://www.languagemonitor.com/news/1000000th-english-word-announced

На 4 октября 2009 г. в английском языке уже 1002116 слов.
http://www.languagemonitor.com/

А сколько слов в современном русском языке?
С какой скоростью увеличивается количество слов в нем?
Ведет ли кто-нибудь его мониторинг?

П.С.
Пока максимальная оценка - Словарь В.Даля, около 200 тыс. слов.

Затасканный штамп про «великий и могучий» пересмотру пока что, слава богу, не подлежит. Все верно: и великий, и могучий. Это подтверждают и те иностранцы, которые хорошо владели нашим языком. Например, французский современник Пушкина Проспер Мериме писал: «Русский язык, насколько я могу судить о нем, является богатейшим из всех европейских наречий и кажется нарочно созданным для выражения тончайших оттенков. Одаренный чудесной сжатостью, соединенный с ясностью, он довольствуется одним словом для передачи мысли, когда другому языку потребовались бы для этого целые фразы».

Но, увы, состояние русского языка по итогам ХХ века вызывает у ученых тревогу. Наряду с падением рождаемости в стране происходит и обеднение словарного запаса. Если словарь Владимира Даля содержал 200 тысяч слов, то во всех словарях русского языка, изданных на протяжении последних 70 лет, их число колеблется в пределах 125-130 тысяч слов. По самым щедрым оценкам – не более 170 тысяч.

Но это очень мало для развитого языка, с великим прошлым и, надо надеяться, большим будущим. Для сравнения: в современном английском - примерно 1,5 миллиона слов . В современном немецком языке, по разным подсчетам, от 185 до 300 тысяч слов.

Но даже это не такое уж несметное словесное богатство лежит у нас мертвым грузом. Число наиболее употребительных слов в разных стилях и жанрах составляет всего около 40-50 тысяч. А словарный запас более менее образованного «простого смертного» оценивается в среднем и вовсе в 3-5 тысяч слов. Некоторые особи, как известно, легко обходятся тридцатью словесами.

Ну, а сколько слов использовали наши классики? Известно, например, что Пушкин употребил в сочинениях и письмах 21 290 разных слов. Имеются данные и о количестве слов у других писателей: Гоголь (только в «Мертвых душах») - около 10 000 слов, Есенин - 18 890. Но рекордсменом здесь является (что, безусловно, большая неожиданность) Владимир Ильич Ленин. В своих произведениях и письмах он употребил свыше 37 500 слов. Правда, среди них есть множество таких, которые Пушкину и не снились: архиважно, эмпириокритицизм, марксизм, интернационал, Рабкрин и т.п.

Но факт остается фактом. Вот уж поистине: я русский бы выучил только за то…

Солженицын, составивший «Русский словарь языкового расширения», полагал, что в современном литературном языке возможно оживить еще около 40-50 тысяч слов, которые считаются устаревшими и диалектными. Так что какой-никакой запас у нас теоретически вроде бы есть. На практике же все "обогащение" русского языка последних десятилетий происходит за счет усвоения и переделки иностранных слов и понятий. Свои "родные" неологизмы - это в абсолютном большинстве жаргонизмы и вульгаризмы.

Странно, что наше внутреннее ощущение богатства русского языка так не соответствует его фактической бедности.

Пожалуй, ни один академик не ответит вам точно на вопрос, сколько в русском языке слов. Просто никому еще не удалось их точно подсчитать, ибо живой русский язык содержит не только литературные нормы, но и изобилует диалектизмами, профессионализмами и жаргонизмами. Язык постоянно развивается, пополняясь все новыми и новыми словами и формами. Но примерную оценку все же можно сделать…

Кроме того, ученые расходятся в методологии подсчета. Так, например, в Великобритании в справочные издания, такие как Оксфордский или Вебстеровский словари, принято включать в абсолютно все. Там можно найти даже статьи по символам (в том числе обозначение химических элементов, сокращения мер веса, длины и других физических величин, форматы бумаги и т.д.) и специальные термины (например, «WEB 2.0» - это отдельная статья!). В российской научной традиции в словари включаются только полноценные лингвистические единицы литературного языка.

Самым авторитетным отечественным изданием, по которому можно судить о емкости языка, является Большой академический словарь, первое издание которого вышло еще в советские годы. Он насчитывает 131 257 слов русского литературного языка. Сейчас идет работа над новым изданием этого справочника, которое будет содержать уже около 150 000 слов. Дореволюционный словарь В.И.Даля насчитывает более 200 000 слов.

По оценкам профессиональных лингвистов, если к этому добавить диалектизмы, то получится уже более 400 000 слов. Если же еще учесть профессиональные термины, неформальные единицы и новообразования, то число слов перевалит далеко за полмиллиона!

Язык – это живая система. Некоторые слова «умирают», выходя из употребления полностью или оставаясь лишь в литературных произведениях. Но на их место приходят новые. Например, в XX-начале XXI веке русский язык обогатился не менее чем на 40 слов только с корнем «люб»: «книголюб», «природолюб», «однолюбка», «любовь-игра», «любовь-ненависть», «любовь-морковь», «безлюбье» и другие. Новые веяния приносят в нашу жизнь и новые слова, которые образуются либо на основе уже существующих русских лингвистических единиц, либо путем русификации иностранных заимствований: «постить», «смайлик», «океюшки», «лайкать» и т.п.

А вот считать заимствования в любом языке – дело совершенно неблагодарное. За всю историю человечества большинство языков подверглись (и подвергаются до сих пор) очень существенному взаимному влиянию. В русском языке огромное количество заимствований из скандинавских, балтийских, тюркских, арабских, европейских языков и наречий, и, конечно, из латыни и греческого. Некоторые слова были заимствованы так давно, что воспринимаются исконно русскими. А между тем, даже «деревня», «боярин», «кувшин», «ларь», «кнут», «сахар», «свёкла», «фонарь», «телега», «руль», «ботинок» и многие-многие другие – это заимствования из других языков.

Английский язык, из которого сегодня идет наибольший поток заимствований в другие языки, тоже не эталон чистоты. В Вебстеровском словаре только 35% исконных английских слов, остальные 65% - заимствования.

Говорить о «бедности» или «богатстве» какого-либо распространенного языка не совсем корректно. Например, английский и русский языки в целом сопоставимы по количеству слов (лингвисты оценивают реальную емкость английского языка примерно в 470 тыс. слов). Вопрос лишь в их применимости и частоте употребления, а также размере словарного запаса у среднего носителя языка.

В русском языке, согласно «Частотному словарю русского языка» под редакцией Л. Н. Засориной , наиболее употребительными являются около 30 тысяч слов, а наибольшую частоту имеют чуть более 6 тысяч слов. А самых-самых распространенных в повседневной речи – около 2 500 тысяч.

В лексиконе классика русской литературы А.С.Пушкина было примерно 21 тысяча слов (столько насчитали в его произведениях, включая не только основные лексемы, но и производные от них: лист-листик-листочек и т.д.). Словарный запас обычного человека оценивается по-разному. Единства в методике подсчета и результатах нет. Есть противоречивые данные, что словарный запас выпускника школы составляет от 3 000 до 40 000 слов. А у человека с высшим образованием – от 7 000 до 80 000 слов. При таких подсчетах надо учитывать, что словарный запас подразделяется на активный и пассивный. Активный запас состоит из тех, слов, смысл которых человек понимает и использует их в речи, а пассивный – из тех, что понимает, но на практике не пользуется.

Вы сами можете пройти один из тестов на определение пассивного словарного запаса по этой ссылке http://www.myvocab.info/ Для чистоты эксперимента советуем сделать это пару раз. О результатах пишите в комментариях к посту.

P.S. Если у вас есть интересные материалы, справки, советы, лайфхаки абсолютно по любой теме, то присылайте их на почту проекта #Ликбез Этот e-mail адрес защищен от спам-ботов, для его просмотра у Вас должен быть включен Javascript .