Частотность слов в английском языке: интуиция и факты
07/07/2015
Когда мы ведем занятия на курсах английского языка в “Школе Дмитрия Никитина” в Ярославле, мы стараемся избегать реплик со стороны учителя It’s a mistake (Это ошибка). Мы говорим I’ve never heard that (Я никогда не слышал, чтобы так говорили). Это не столько политкорректность и признаие модного педагогического принципа, что неправильных ответов не бывает (они бывают), а признание того, что выражение, сказанное в классе и неестественное в конкретной ситуации может быть допустимо в другом месте и при других обстоятельствах. При этом мы всегда обращаем внимание на то, что, хотя словари и сборники грамматических правил не всегда поспевают за живым меняющимся языком, лучше придерживаться частотного нормативного варианта, особенно если речь идет о подготовке к международному экзамену по английскому языку типа IELTS или TOEFL.
Но что такое частотные и, как следствие, более естественные слова и словосочетания? Современный английский язык огромен и постоянно обогащается новыми словами и выражениями. Проведем математические расчеты. Только в Англии сегодня проживает примерно 30 000 000 носителей английского языка. Представим, что каждый из них говорит 60 минут в день со средней скоростью 120 слов в минуту — в сумме это около 220 миллиардов слов, которые произносятся англичанами в день. Не говоря уже об объеме слов, звучащих на английском языке по всему миру. Это невероятное количество различных вариантов языковых форм, при этом каждый из нас имеет свое собственное представление о языковой норме. Если перевести этот объем в печатную версию, получим интересную картину. По данным авторов книги Longman Grammar of Spoken and Written English, типовая страница английского текста состоит из 300-400 слов, таким образом, в книге объёмом 300 страниц найдем примерно 100 000 слов, а 10 книг будут содержать миллион слов. Среднестатистический англичанин говорит со скоростью 120 слов в минуту. Из этого следует, что 1 000 000 слов равен примерно 140 часам беспрерывного устного общения. В год одним человеком произносится, таким образом, около 15 миллионов слов. При этом то, что мы говорим на самом деле, и наше представление о языковой норме (как мы должны говорить) часто расходятся.
Например, словосочетание “to make a mistake” многие назовут естественным. С точки зрения словаря это на самом деле так, однако в речи немного более частотно другое сочетание, как, например, в предложении: I think we probably made a mistake when we… Проверим частотность словосочетаний “to make a mistake”, “make a mistake” и “made a mistake” через аналитический сайт. Вот что получилось.
Выходит, что реально при изучении английского языка лучше запоминать выражение “made a mistake”, чем словарный вариант “to make a mistake”.
Как же определить, какие словосочетания и выражения более частотны, а значит, на запоминание каких из них имеет смысл тратить больше времени? Ответить на эти вопросы нам помогут данные корпуса английского языка — собрание почти всех слов и словосочетаний английского языка, представленное в электронном виде. Давайте проведем небольшой эксперимент и проверим вашу языковую интуицию. Ответьте, пожалуйста, на вопросы ниже.
- Какое слово чаще встречается в английском языке: a или the?
- Какие слова являются десятью самыми частотными в английском языке?
- Какой процент слов десятимиллионного корпуса английского языка встречается в корпусе только один раз и НЕ формирует устойчивых словосочетаний?
а. 50 % b. 25% c. 10 % d. 5 % d. менее 5 %.
Проверим ответы?
- Артикль the употребляется в английском языке в два раза чаще, чем артикль a вместе с его вариацией an.
- Согласно опубликованному списку Cobuild, десятью самыми частотными словами английского языка являются: the, of, and, to, a, in, that, I, it, was.
- Примерно половина слов из десятимиллионного корпуса английского языка встречается в нем лишь однажды и практически никода не используется в речи.
Практическое применение этих статистических данных простое. Не надо заучивать англо-русский словарь для того, чтобы хорошо говорить по-английски. Имеет смысл запоминать устойчивые СЛОВОСОЧЕТАНИЯ с частотными словами. Частотность слов можно уточнить в современных словарях английского языка, например здесь частотность будет отмечена звездочками. Также хорошей идеей будет запоминать не словарную версию словосочетания, а частотное “жизненное” словосочетание, погружённое в грамматику: не учить to make somebody redundant (сокращать (увольнять) кого-то), а запомнить намного более частотное сочетание he was made redundant (он был сокращён).