Речь человека: Происхождение речи у человека – аналитический портал ПОЛИТ.РУ

Автор: | 29.01.1975

Содержание

Происхождение речи у человека – аналитический портал ПОЛИТ.РУ

Заведующий Центром антропологии ИЭА РАН, д.и.н. Сергей Владимирович Васильев рассказывает о различных гипотезах возникновения речи у человека. Первая часть.

Речь как передача понятийной информации формировалась в процессе эволюции медленно, шаг за шагом. Судить о том, была ли в определенный момент речь или нет, так же трудно, как и о времени появления орудийной деятельности: она развивалась на протяжении всего эволюционного пути человека. Провести границу: вот это еще не речь, а это уже речь – невозможно.Но можно попытаться проследить процесс формирования речи в эволюции человека.

Со времен античности и первых философов человек задумывался о том, как и когда появилась речь. За 2000 лет было предложено более 200 гипотез происхождения речи, которые хорошо описаны Якушиным (Якушин Б.В. Гипотезы о происхождении языка.

М., 1984). Начав заниматься этим вопросом, для себя я разделил гипотезы на три категории:

Первая – это ненаучные или околонаучные. Например, гипотеза божественного происхождения или мутационная гипотеза, согласно которой человек ходил-ходил, произошла мутация — и вдруг он заговорил. Есть гипотеза договоренности. Многие возвращаются к мутационной гипотезе (это о гене FOXP2), не столько генетики, а те, кто читает генетические работы, не понимая, что делают генетики.

Вторая категория гипотез – физикалистские, которые рассматривают явление только с точки зрения физиологии, но никак не психологии, когнитивных возможностей и т.д. Эти гипотезы могут так или иначе объяснить возникновение

звуковых сигналов, их сочетаний, но при этом не объясняют, как формировались понятия, как они передавались, как формировалась смысловая нагрузка. Физикалистские гипотезы – это, например, о том, чторечь возникла из детских лалий (детского лепета) или от того, что люди повторяли шумы природы. Есть трудовая гипотеза: человек сидит, делает каменное орудие и повторяет раздающиеся звуки. Поскольку эти гипотезы не объясняют формирование понятий, их нельзя считать исчерпывающими.

Две первые категории гипотез описывают «одномоментное» происхождение речи: мутация произошла – речь появилась, договорились – речь появилась.

 

Третья категория гипотез объясняет происхождение речи в контексте длительного процесса эволюции. Предполагая, что речь произошла эволюционным путем, и зная, что предками человека были приматы, надо изучать коммуникативные системы приматов, чтобы понять, как из этих систем в процессе эволюции могла появиться та речь, которой мы сейчас пользуемся. Есть ряд гипотез, в том числе отечественных исследователей, антрополога Виктора Валериановича Бунака, психолога Лурии, предполагающих, что речь произошла от звуковых сигналов. Бунак писал, что это были «жизненные шумы» — звуки переклички приматов, а Лурия считал, что речь возникла именно из агрессивных звуковых сигналов.

Американский антрополог Гордон Хьюз в 1973 году опубликовал свою жестовую гипотезу происхождения речи. По его мнению, вначале появилась не звуковая, а жестовая речь. То есть первые понятия передавались при помощи жестов, а затем уже звуки стали передавать понятия. Эта гипотеза долго была модной: в 70-е, в 80-е годы стало понятно, что все звуковые сигналы, продуцируемые человекообразными обезьянами типа шимпанзе, генетически детерминированы, шимпанзе им не обучаются. Эти сигналы инстинктивные, врожденные, новым сигналам шимпанзе научиться не может.

Все звуковые сигналы человекообразных обезьян типа шимпанзе генетически детерминированы, шимпанзе им не обучаются. Но какие именно и когда произносить звуки – этому надо учиться в сообществе себе подобных.

Это показал в свое время, правда, не специально, Леонид Александрович Фирсов, один из крупнейших приматологов советского времени. Когда в его лаборатории родился маленький шимпанзенок по имени Чингиз, мамаша не могла его выкармливать, и тогда Леонид Александрович взял его домой. Чингиз первые года два рос среди людей, не видя и не слыша своих сородичей. Мы с Леонидом Александровичем много общались — я работал в Колтушах, где у него была большая группа шимпанзе, которыми занималась лаборатория изучения антропоидов Института физиологии имени Павлова. Он рассказывал мне, а потом писал, что Чингиз воспроизводит все звуки, характерные для данного вида шимпанзе, но не умеет их правильно, ситуативно использовать. Какие звуки, когда, в каких ситуациях произносить – этому надо учиться в сообществе себе подобных.

Жестам же приматы обучаются легко. Жестовый язык используется ими не только в неволе, но и в природе. В отличие от языка животных, который, по мнению большинства этологов и зоологов, является языком эмоций (животное при помощи тех или иных сигналов передает информацию о своем эмоциональном состоянии), Фирсов показал, что у шимпанзе появляется жесты, которые не только передают информацию об эмоциональном состоянии животного, но и передают смысловую нагрузку,

понятия, которые Фирсов, упрощенно говоря, связывал с глаголами и называл «жесты действия». Например, протянутая рука в зависимости от ситуации могла означать «подойди ко мне» или «дай мне». И гипотеза Хьюза на это хорошо ложится.

 

В 70-е годы задавались вопросом, как формировались «жесты-понятия» (стол, стул). Помогли исследования по онтогенезу человека: как человек в первые годы жизни учится говорить, как он формирует понятия-существительные. Польские ученые открыли, что в районе 12 месяцев (об этом позднее писал Выготский в своей книге «Мышление и речь») ребенок активно начинает использовать указательные жесты: он показывает на предмет и издает звуковые сигналы, лалии. Он обозначает предмет звуком и жестом, затем жест можно убрать, а звук оставить. Роль указательного жеста сначала была сформулирована американским антропологом Осборном, потом была поддержана отечественным психологом Выготским.

Ребенок обозначает предмет звуком и жестом, затем жест можно убрать, а звук оставить.

Но не было понятно, как в процессе эволюции понятийная информация перешла с жестов на акустические сигналы.

Немаловажную роль в разработке темы происхождения речи у человека играли работы Бунака: в базовой работе 1951 года «Происхождение речи по данным антропологии» разбираются морфологические особенности скелета, позволяющие в той или иной степени говорить о том, была ли предрасположенность к речевой функции у данного рода гоминид, или ее не было. В ней, в частности, разбираются угол гортани, строение гортани, подбородочный выступ и др.

Сейчас эти особенности дополняются, но исследователи очень плохо понимают, чем именно они дополняют. Например, речь связывают с толщиной спинного канала позвоночника, вариации которого для ископаемых форм мы не знаем. Но дыхание никак не связано со спинным каналом, регуляция дыхания связана с развитием небольшой структуры, соединяющей спинной мозг с головным — продолговатым мозгом, где находится дыхательный центр. Один англоязычный автор написал об этой предполагаемой связи, и, к сожалению, наши исследователи цитируют его без понимания. Другой пример: речь зависит от толщины подъязычного нерва, но на толщину нерва влияют многие факторы, она может зависеть не только от количества аксонов, но и от количества миелина.

Поэтому анатомические особенности не доказывают, была ли речь на данном этапе развития, и какой она была.

Я, безусловно, сторонник эволюционной гипотезы. Как можно судить об этапах развития речи? По этологии, изучая коммуникативные системы приматов. Отряд приматов – уникальный, поскольку до сегодняшнего дня дожили практически все его эволюционные стадии, начиная от самых примитивных, появившихся в начале кайнозоя, 65 млн. лет назад – тупайеобразных. Во времена палеоцена появляются долгопятовые и лемуровые, эоценовые – уже наполовину обезьяны (например, пондаунгия), дальше появляются обезьяны. Для нас это хорошо тем, что мы можем изучать любой контекст поведения от низших приматов к высшим, можем видеть вектор развития этого контекста и можем потом экстраполировать наблюдения на эволюцию приматов – можем представить, как дальше могла развиваться та или иная система в эволюции человека.

Например, Маргарита Александровна Дерягина занималась изучением возникновения труда (термин Энгельса) или, как сейчас говорят,- орудийной деятельности. Чтобы понять, каким образом могла сформироваться орудийная деятельность в эволюции человека, надо было изучить манипуляционную активность приматов- как в отряде приматов от одного этапа развития к другому меняется захват предмета, какие действия с предметом он делает – деструктивные, конструктивные и т.д., а дальше – какие возникают манипуляционные цепочки. Это все есть преадаптация к возникновению на каком-то из этапов эволюции человека орудийной деятельности, появлению орудий.

Точно так же, изучая социальные системы приматов, мы можем говорить и о древнем человеческом первобытном обществе. Приматы уникальны еще и тем, что в пределах отряда у них есть разные социальные системы: односамцовые, мультисамцовые, некоторые виды ведут парный, моногамный образ жизни, другие — одиночный и т.д., имеются разные системы иерархии. Понимая, как происходит развитие социальной структуры в отряде приматов, мы можем себе представлять, каким могло быть общество первобытного человека.

То же самое касается и речи, но здесь ситуация намного сложнее: мы можем изучить коммуникативные системы приматов и можем себе представить, как формировалась сигнальная структура речи, но как формировались понятия, сказать трудно. Здесь стоит обратиться к психологическим и философским словарям, ведь сознание неразрывно связано с речью и оно дуально, то есть оно как материально, так и идеально. Объяснить происхождение идеального трудно, доказать через материальное – невозможно, можно только приблизиться к пониманию того, как это происходило. Именно эволюционные гипотезы более или менее приближаются к доказательству, основываясь и на изучении коммуникативных систем приматов, и на изучении эндокранов (слепков внутренней поверхности мозговой коробки), и на изучении морфологических особенностей анатомических структур, так или иначе связанных в основном с мышцами, обеспечивающими артикуляцию при речи.

Тут начинается путаница. С одной стороны, «старые» авторы (Кочеткова, ранние работы Филиппа Тобаиса) пишут, что в коре больших полушарий есть зоны, связанные с речью. Самая известная – зона Брока (44-45 поля Бродману, расположена в лобных долях), где идет контроль за артикуляцией, сложными движениями нижней челюсти, языка, губ и зона Вернике (височные доли), отвечающая за слуховое восприятие речи. Эти две зоны есть уже у приматов, у шимпанзе есть, но у них они еще не выполняют те функции, которые выполняют у человека. Кочеткова писала, что, судя по эндокранам питекантропов, у них идет разрастание коры в зонах, связанных с речевой функцией, и что это может говорить о том, что у них появляется речь. С другой стороны, есть авторы, которые считают, что такое разрастание никак не связано с речью – так как у приматов эти зоны не несут речевой функции, поэтому разрастание не может свидетельствовать о наличии речи.

Разрастание в процессе эколюции зон больших полушарий мозга, связанных с речью и ее восприятием (зона Брока и зона Вернике) может отражать накопление понятий.

Мне кажется, здесь есть третий вариант — разрастание не говорит ни о том, ни о другом. Как себе представить эволюционное происхождение речи? В процессе эволюции идет элементарное накопление словарного запаса. И разрастание, активизирование этих зон не означает уже наличие речи, а как раз говорит о накоплении понятий.

Что касается генетики, злополучного FOXP2, о нем сначала сразу писали, что открыли «ген речи». Оказывается, этот ген контролирует 3 или 4 мышцы рта, без которых нет артикуляции, если этот ген «поражен», человек не может говорить, потому что не может артикулировать, но слышать он может. Потом стали писать, что это более сложный ген – второго порядка, регулирующий генорегуляторы, при его поражении нарушения происходят во многих частях головного мозга.

Функции речи: коммуникативная и мыслительная.

У многих нет понимания того, что речь полигенна, и одним-двумя генами ее невозможно объяснить. Речь – это не только слуховое восприятие, но и передача, консервация информации, своевременное ее «вытаскивание», это озвучивание, осмысление.

В университетских учебниках психологии давно написали о том, что речь выполняет две основные функции, и эволюцию ее необходимо рассматривать в этих двух функциях. Первая функция – система коммуникации, при помощи речи мы общаемся; вторая функция – система мышления, при помощи речи, понятий мы думаем. Конечно, кроме речевого мышления есть наглядно-образное, которое человек нередко использует, например, в технических отраслях, представляя себе целиком, как в итоге должна выглядеть та или иная конструкция.

Урок 1. какая бывает речь — Русский язык — 2 класс

Русский язык. 2 класс.

Урок 1. Какая бывает речь

Перечень вопросов, рассматриваемых в теме:

1) Изучение понятий «язык» и «речь».

2) Изучение роли русского языка в жизни и в обществе.

3) Знакомство с видами речи: устной, письменной, внутренней.

Тезаурус:

Речь — это способность говорить, выражать, передавать что-либо словами — устно или письменно.

Устная речь — это способность человека говорить и слушать, умение человека произносить слова при помощи языка, губ, рта.

Письменная речь — способность человека писать и читать.

Внутренняя речь — речь про себя.

Основная и дополнительная литература по теме урока

1.  Канакина В. П., Горецкий В. Г. Русский язык. 2 класс. Учебник для общеобразовательных организаций. В 2-х частях. Ч. 1. – М.: Просвещение, 2017. — С. 6–7.

2. Канакина В. П. Русский язык. Рабочая тетрадь. 2 класс. Ч. 1. С. — М.: Просвещение, 2012. — С. 3–4.

Открытый электронный ресурс по теме урока

Канакина В. П. и др. Русский язык. 2 класс. Электронное приложение. — М.: Просвещение, 2011. Ссылка для скачивания: http://catalog.prosv.ru/attachment/ca950bac-d794-11e0-acba-001018890642.iso

Теоретический материал для самостоятельного изучения

Прочитайте высказывание Л. Успенского: «Всё, что люди совершают в мире человеческого, совершается при участии и посредством языка. Язык есть важнейшее орудие общения между людьми. Умело и с наибольшей пользой применять любое орудие может лишь тот, кто его глубоко, тщательно изучил, кто знает, как оно устроено, из каких частей состоит, как работает, какого обращения требует с собой».

Надо ли изучать язык? Трудное ли это дело — знать родной язык?

Несомненно.

Знать свой родной язык — это огромное счастье, так как знание родного языка даёт человеку очень многое. Это и чувство уверенности в себе, и чувство гордости за достижения в области культуры своего народа, которые он может познать с помощью родного языка. Всё это очень важно для человека. Речь человека «растёт», «взрослеет», «развивается» вместе с ним. Общение с человеком тем приятнее, чем богаче его речь.

Сегодня на уроке вы узнаете, какая бывает речь, научитесь различать устную речь и письменную.

Язык — слов. русский нелегко, но интересно. На огромной Земля нам, дан дар — при слова. отвечать на вопросы, составлять и делиться мыслями и человек владеть

Что такое Речь — это способность говорить, выражать, передавать что-либо словами — устно или письменно.

Для нужна речь? Речь помогает передавать знания, узнавать новое,общаться; делиться мыслями и чувствами; договариваться о чём-нибудь; согласовывать свои действия.

Речь разных слушание, речь про (внутренняя чтение и

Слушание —вид речевой деятельности, направленный на восприятие и понимание звучащей речи. Слушание важным который влияет на взаимодействие и между

Говорение — высказывание своих мыслей и передача чужих мыслей в устной форме на родном или иностранном языке.

Устная — это человека и умение произносить при губ, рта. и «устная речь» от уста —

Во устной речи говорящие и друг замечают собеседника, исправить речевые

Письменная — это человека писать и читать. Для мы буквы.

В Руси на — берёзовой коре. тогда ещё не

А мы в печатаем на

Во письменной речи тот, кто не и не того, к  обращается; не реакцию может предугадать её; при можно допущенные

Итак, которой мы пользуемся при и называют речью. А которой мы пользуемся при и называют письменной.

Существует ещё внутренняя речь. Это про себя. С ней мы не к людям. Она не средством

Внутренняя связана с и важное в человека. Например, мальчик думает, как попросить маму записать его в кружок «Лёгкая атлетика». Он делает это про себя, без внешнего проявления.

Кстати, «про себя» так остаться «про себя», а преобразоваться в или речь.

Обратите внимание! Вам понять Вы узнали, что речь, познакомились с речи.Теперь вы знаете, что «устная» и «письменная» речь себя» речь), а их

Ваше велось на русском языке. Русский язык по праву считается из богатых, и языков На нём и многие писатели, Именно передает нам о и приобщает к богатству, многими людей. изучать язык в мире становится всё и больше. Любите и изучайте русский язык! Развивайте речь!

Примеры и разбор решения заданий тренировочного модуля

Задание.Верные высказывания.

Закрасьте рядом с высказыванием цветом, квадраты —

С устной люди:

  • бегают
  • рассказывают другу
  • пишут

Подсказка: устная речь — это способность человека говорить и слушать, умение человека произносить слова при помощи языка, губ, рта.

Правильный

  • бегают
  • рассказывают другу
  • пишут

Задание. Устная и письменная речь.

Разместите предложенные слова в колонки по указанному критерию.

Устная речь

Письменная речь

говорение письмо слушание чтение

Подсказка.Устная речь – это способность человека говорить и слушать, умение человека произносить слова при помощи языка, губ, рта; письменная речь – способность человека писать и читать.

Правильный

Устная речь

Письменная речь

говорение

письмо

слушание

чтение

РЕЧЬ ЧЕЛОВЕКА — ЧТО ТАКОЕ? КТО ТАКОЙ?


РЕЧЬ ЧЕЛОВЕКА — великое чудо. Попробуй чему-нибудь выучиться без языка, не умея говорить… Ты убедишься, что это невозможно. Без языка человек перестаёт быть человеком.

Люди научились говорить тогда, когда они стали вместе трудиться, помогать друг другу. Пчёлы или муравьи тоже помогают один другому, но они каждый день, каждый год по велению инстинкта делают одно и то же, выполняют одну работу. А люди способны каждый день выполнять самые разные дела: плести сети, как пауки, копать подземелье, подобно кротам, плавать лучше рыб, строить дома из глины, куда более сложные, чем гнездо ласточек или жилище термитов. Всё это делать позволяет людям разум, а разум пользуется для своих целей языком. Можно сказать, что труд и речь создали теперешнего разумного человека.

Главное в нашей речи—это слово. Чудеснее слова ничего нельзя найти на земле. Когда ты сфотографируешь своего друга, на фото получится, конечно, человек. Но это будет именно этот человек, именно Вова Чайкин или Женя Лапина.

А когда я скажу слово «человек», в этом слове будет всё: и «вот этот человек» (если я сказал «смотри, по дороге идёт человек»), и «любой человек мира» (если я произнесу слова «человек нам дороже всего»).

Если ты нарисуешь воду, ты можешь нарисовать её только какую-нибудь: бегучую или стоячую, льющуюся водопадом или капающую мелким дождиком. Ты не можешь нарисовать «воду вообще», всякую воду. А произнеся слово «вода», ты назвал именно любую воду, какая есть в мире: солёную и синюю в океане, холодную и чистую, текущую на кухне из крана, ту, которую дворник пускает вдоль улицы из шланга, и ту, особо чистую, что продают в аптеках… Слово — самое общее и самое точное обозначение любой вещи, любого действия, любого качества предмета. Именно поэтому оно и только оно позволяет человеку думать о чём угодно.

Речь человека прежде всего основное и главное орудие для обмена мыслями, для связи между людьми. Если тебе надо попросить позволения пойти в кино, ты начинаешь говорить. И если Главный конструктор космических ракет должен дать задание строителям звёздного корабля, он не может обойтись без слов, без речи. Вот видишь, речь — это важнейшее, самое первое, необходимое средство связи людей между собой, или, как говорят учёные, средство коммуникации.

Но есть у человеческой речи и другое, ничуть не менее важное назначение: она служит людям на протяжении всей жизни человечества в области ИСКУССТВА.

Когда тебе весело, ты запеваешь песенку. А ведь песня — это особая, связанная с музыкой речь. И когда человеку тяжко, он тоже выражает свои чувства в песне, в её словах. Поэт пишет стихи, где рифмы играют, переливаясь и звеня. Стихи то забавные и остроумные, то глубокие, как море, и могучие, как ураган. А любые стихи, даже самые гениальные,— речь.

Математическая формула, открывающая нам самые главные законы мира,— речь. Лукавая эпиграмма — словесная КАРИКАТУРА, от которой плохо приходится недругу,— речь. Колыбельная песня, под которую ты засыпал в детстве,— речь, и великие сочинения лучших людей мира, что учат нас правде и добру,— МАРКСА, ЭНГЕЛЬСА, ЛЕНИНА —тоже речь, речь гениальная, возвышенная, мудрая.

А если она так важна, так необходима, так всемогуща, значит, каждый человек должен сделать всё, что может, чтобы овладеть ею в совершенстве. Изучай же и оберегай наш язык, великолепную человеческую речь.


 

Наука: Наука и техника: Lenta.ru

На прошлой неделе почти одновременно были опубликованы три важные научные работы, которые имеют большое значение для понимания эволюции речи. Как уникальное свойство человека, речь, и вообще вокальная коммуникация, давно привлекает внимание ученых. До настоящей нейробиологической теории языка исследователям еще очень далеко, поэтому пока что они пытаются подобраться к ней, исследуя дельфинов, крыс и пациентов с эпилепсией.

Песня и речь

Речью обладает только человек, но вокальную коммуникацию, то есть использование звуков для передачи сигналов, используют очень многие животные — от цикад и кузнечиков до лягушек и певчих птиц. От человеческой речи вокальная коммуникация отличается не только своей структурой и степенью сложности, но и тем, что она переходит из поколения в поколение: большинство звуков, издаваемых животными, инстинктивны, и способ их извлечения передается по наследству.

Случаи обучения новым звукам, конечно, тоже хорошо известны — например, у певчих птиц. И хотя такая способность вовсе не делает попугая обладателем речи (даже в ее зачаточном состоянии), тем не менее надо понимать, что и человеческий язык возник не на пустом месте. Нейробиологические механизмы, включившиеся у нас в производство речи, в том или ином виде наверняка уже присутствовали у животных, поэтому изучение работы этих механизмов на их примере может прояснить и историю появления человеческого языка.

Однако ситуация с животными моделями складывается для исследователей эволюции речи не самым благоприятным образом. Певчие птицы для таких исследований подходят плохо: их мозг устроен очень отлично от мозга млекопитающих, и за вокализацию отвечают узко специализированные механизмы.

Красная канарейка


Известно, например, что пение у птиц контролируется половыми гормонами, которые стимулируют рост и деление новых нейронов. В брачный период ответственные за «производство» песен зоны мозга у самцов канареек сильно увеличиваются, а когда сезон заканчивается — возвращаются к исходному состоянию. Это наблюдение Фернандо Ноттебома, кстати, в свое время позволило ученым обнаружить обновление нейронов, которое раньше считалось невозможным, и установить его механизм. Но все это, к сожалению, имеет мало отношения к эволюции человеческой речи: у млекопитающих ничего подобного не наблюдается.

Шимпанзе и другие человекообразные обезьяны, как это ни странно, тоже плохо подходят для таких исследований. Из-за своеобразного строения гортани они не способны производить достаточно сложные звуки и не могут заниматься звукоподражанием. Шимпанзе общаются в основном при помощи жестов, более того, они даже могут говорить на адаптированном языке для глухонемых. Однако звуки, которые они воспроизводят, не выходят за пределы врожденного стандартного набора.

Позывной «Вилли»

Способностью к звукоподражанию, к счастью, обладают другие высокоинтеллектуальные млекопитающие, которым по воле эволюции язык жестов оказался недоступен, — дельфины.

В 1986 году Петер Тяк (Peter Tyack) показал, что пара дельфинов Tursiops truncatus, содержавшихся в аквариуме зоопарка в Беустере, штат Массачусетс, способны воспроизводить свисты друг друга.

Дельфины вообще довольно болтливые создания. В дикой природе они постоянно издают звуки, из которых примерно половину составляют свисты, индивидуальные для каждого животного. Эти звуки молодые дельфины перенимают от матери, однако копирование не является «дословным». В результате такого обучения каждый дельфин в стае становится обладателем собственного «позывного», позволяющего отличить его от других особей.

В 2010 году в Science была опубликована статья, подтверждающая данные Петера Тяка. На этот раз в исследовании принимали участие дикие взрослые животные, и они тоже оказались способны копировать позывные друг друга. Ученым, однако, не удалось убедительно доказать значение таких позывных из-за недостаточного знания отношений в изучаемой группе и ее малого размера.


Несколько дней назад были опубликованы самые масштабные на сегодняшний день исследования вокализации дельфинов. Ученые воспользовались данными отлова животных, проводившегося с 1984 года в Сарасота Бей во Флориде. Объектом масштабного исследования была динамика местной популяции дельфинов. Параллельно ученые записывали звуки, которые издавали пойманные на пару часов животные.

В результате было доказано, что имитация свистов не является каким-то исключением, присущим только животным, содержащимся в неволе. Кроме того, ученые показали, что афалины преимущественно копируют «позывные» тех своих сородичей, с которыми имеют тесные социальные связи и проводят много времени. Особенно часто дельфины издают такие звуки, когда теряют друг друга из виду. По мнению ученых, это однозначно говорит о том, что животные в данном случае зовут друг друга, желая вновь воссоединиться, а характерные звуки выступают в роли полноценного имени.

Какие именно структуры мозга позволяют дельфинам копировать звуки своих сородичей, пока неясно. Неизвестны и генетические основы такой способности. Однако можно с уверенностью утверждать, что важную роль в этом процессе играет ген FOXP2, который, как показали недавние исследования, одинаково важен и для неречевой вокализации мышей, и для речи человека.

Ген речи

FOXP2 — ген с необычной судьбой. В отличие от большинства других генов человека, когда его удалось обнаружить, было уже совершенно ясно, какое важное значение он имеет для эволюции человека.

Исследования, которые привели к открытию FOXP2, проводились в самом конце 1980-х годов на семье британцев. Члены семьи «испытывали трудности с контролем движений в нижней части лица, из-за которых они не могли воспроизводить сложные звуки». Кроме того, исследуемые не могли составить хоть сколько-нибудь длинного списка слов, начинающихся на какую-либо заданную букву.

Характерные проблемы с речью наследовались в семье по очень простой схеме, поэтому генетикам быстро стало ясно, что речь идет о мутации в единственном гене. В 2001 году удалось найти его и определить, какие именно мутации доставляют неудобства британскому семейству.

FOXP2 оказался транскрипционным фактором, то есть белком, управляющим считыванием других генов. Это довольно распространенная специализация для функциональных генов — тех, которые связаны с каким-либо внешним признаком. Необычным оказалось то, что FOXP2 был связан не только с речью человека, но и вообще с вокализацией у очень разных животных.

Так, было показано, что наличие его двух функциональных копий необходимо мышам, чтобы «правильно» пищать. Летучим мышам он оказался необходим для эхолокации, а птицам — для пения брачных песен, причем его экспрессия сопровождает рост соответствующих нейронов.

Тот факт, что FOXP2 у человека и шимпанзе отличается (на две аминокислоты), позволил многим ученым предполагать его ключевую роль в появлении настоящей речи. Интересно, что неандертальцы, судя по всему, были носителями как раз человеческой версии гена.

Распределение белка FOXP2 в мозгу эмбриона мыши показано черными точками. Ген преимущественно экспрессируется в области мозжечка и заднего мозга.

Однако до недавнего времени никто не обращал внимание на различие в работе человеческого FOXP2 у мальчиков и девочек, хотя существует много исследований, где показано неравенство их способностей на ранних стадиях развития. Чтобы показать, что и в данном случае ключевую роль играет FOXP2, ученым сначала пришлось прибегнуть к помощи модельных животных.

Исследователи отделили мышат обоих полов от их матерей в специальном боксе и наблюдали за тем, как они зовут своих родителей. Оказалось, что маленькие самцы мышей издают в среднем больше звуков в единицу времени. Такая стратегия действовала на родителей: они чаще первыми переносили к себе именно самцов, а не самок. Ученые установили, что эта разница в поведении сопровождается и разницей в активности FOXP2. В зонах мозга, связанных с производством звуков, количество этого гена у самцов оказалось в два раза больше. Эффект работал и в обратную сторону: когда при помощи РНК-интерференции ученые искусственно снизили количество FOXP2 у самцов мышей, они стали гораздо более молчаливыми.

Данные, полученные на мышах, ученые в зеркальном виде подтвердили на мозге погибших в результате катастроф детей. Более «способным к языкам» оказался женский пол. У девочек четырех-пяти лет активность FOXP2 в речевых зонах мозга оказалась почти на треть выше, чем у мальчиков.

Новое исследование подводит генетическую основу под лингвистические способности женского пола. Но как именно работа FOXP2 влияет на производство речи, ученые пока не знают.

Считается, что ген стимулирует образование синапсов, однако как выбираются те нейроны, которые должны участвовать в этом процессе, пока неясно. В качестве первого этапа для установления их идентичности могла бы послужить одна работа.

Механика фонетики

Исследования речи, как уже говорилось ранее, осложняются тем, что ей обладает только человек. И если работу генов можно изучать по крайней мере на биоматериале, то как быть с самим производством речи? Да, сейчас нейрофизиологи обладают томографией, — мощным инструментом, способным неинвазивно заглянуть внутрь мозга (и иногда даже рассмотреть, что видит человек). Однако картина, которую дает томография, имеет ограниченное размером вокселя разрешение, и для изучения мелких структур, не говоря уже об отдельных нейронах, его недостаточно.

Ответственная за производство речи зона мозга, куда была имплантирова пластинка с электродами

Bouchard, Mesgarani, Johnson& Chang, Nature, 2013


Исследования на открытом мозге человека сами по себе запрещены, однако у нейрофизиологов имеется одна любопытная лазейка. Дело в том, что в случае тяжелых форм эпилепсии медики вынуждены удалять поврежденный участок мозга хирургическим путем. Чтобы точно установить место его локализации, перед операцией пациенту вживляют пластинку с сотнями электродов, которые считывают электрическую активность мозга, указывая хирургам границы поврежденной зоны.

В этот момент с согласия пациента можно провести небольшое исследование, ценность которого заключается в том, что полученные данные об электрической активности отличаются беспрецедентной точностью. Именно таким образом недавно удалось обнаружить у человека зону мозга, отвечающую за распознавание лиц. Исследование стало возможным благодаря мужеству одного пациента, готовившегося к операции.

Ученые, чья работа была опубликована на прошлой неделе, проводили исследование на областях мозга, отвечающих за производство речи. В нем приняли участие всего три человека, однако с учетом редкости таких работ и это число кажется значительным.

Ученым удалось определить, какие микрозоны речевой области мозга за производство каких звуков отвечают и как они между собой соотносятся. Добровольцы (у всех родным языком был американский английский) произносили различные звуки — отдельно или в составе слов. В это время ученые при помощи пластинки с электродами записывали активность мозга и наблюдали за движением речевого аппарата.

Сопоставив полученные данные, они получили дерево звуков американского английского, каждому из которых соответствовала электрическая активность и определенное положение языка, губ и других частей речевого аппарата.

Подобные деревья уже давно составляют лингвисты, и с ними действительно интересно сопоставить полученные данные. Однако фонетические деревья лингвистов основаны исключительно на механике речи и не содержат информации о том, какие нейрофизиологические механизмы ее определяют. В новой же работе можно видеть не только то, насколько различные звуки близки друг к другу механически или на слух, но и насколько близкие зоны мозга отвечают за их производство.

Дерево подобия звуков английского языка, составленное по результатам нейрофизиологического исследования

Bouchard, Mesgarani, Johnson& Chang, Nature, 2013


Одним из побочных результатов работы ученых стало объяснение того, почему же так сложно произносить скороговорки. Как оказалось, в скороговорках содержатся звуки, в производстве которых участвуют перекрывающиеся области нейронов. Нечто подобное ученые, конечно, уже подозревали, да и лингвистов таким открытием не удивить, но факт тем не менее любопытный.

Единственное, пожалуй, о чем можно было бы пожалеть, — это то, что все трое пациентов оказались носителями одного и того же языка. Было бы крайне интересно сравнить людей, говорящих, например, на разных диалектах одного языка, отличающихся друг от друга только некоторыми особенностями произношения, или на тех языках, в которых есть экзотические с нашей точки зрения звуки — как в щелкающих койсанских языках. Для таких исследований ученым придется ждать новых мужественных добровольцев с эпилепсией или (что, конечно, предпочтительнее) изобрести новый неинвазивный способ точного считывания активности мозга. Впрочем, такого метода ждут все нейробиологи, а не только те, кто занимается речью. Но пока, к сожалению, его нет.

Факторы, влияющие на речевой аппарат и речь человека Текст научной статьи по специальности «Языкознание и литературоведение»

УДК 81’33

Н. А. Бурыгина

аспирант кафедры прикладной и экспериментальной лингвистики Института прикладной и математической лингвистики английского факультета МГЛУ; e-mail: [email protected]

ФАКТОРЫ, ВЛИЯЮЩИЕ НА РЕЧЕВОЙ АППАРАТ И РЕЧЬ ЧЕЛОВЕКА

В центре внимания статьи — устная речь человека. В настоящее время исследование влияния различных факторов на речевой сигнал является одной из главных задач прикладного речеведения. В работе была предпринята попытка выявить факторы, влияющие на речевой аппарат и речь человека. Для их определения был проведен обзор и анализ научной литературы российских и зарубежных авторов. Учитывая сложность и комплексность процесса речепроизводства, при анализе факторов явление устной речи рассматривалось с точки зрения разных дисциплин: наркологии, психолингвистики, анатомии, фоноскопии, психиатрии, отоларингологии, психологии.

В результате исследования был выявлен ряд факторов, влияющих на речевой аппарат и речь человека в целом. К ним относятся: дефекты в строении артикуляторных органов, интоксикация, возраст, заболевания, а также эмоциональное состояние. Однако следует отметить, что в ряде случаев сложно установить, каким из факторов вызваны те или иные изменения речи. Кроме того, эксперименты в данной области сложны, учитывая трудность выявления нейтрального эмоционального состояния, а также возможность имитации речи диктором.

Ключевые слова: речевой аппарат; речь; интоксикация; возраст; эмоциональное состояние; заболевания; дефекты артикуляторных органов.

Burygina N. A.

Postgraduate Student, Department of Applied and Experimental Linguistics, Institute of Applied and Mathematical Linguistics, Faculty of the Humanities and Applied Sciences, MSLU; е-mail: [email protected]

FACTORS OF INFLUENCE ON ORGANS OF ARTICULATION AND HUMAN SPEECH

The article is focused on speech. At present, the study of influence of various factors on the speech signal is one of the main tasks of applied speech studies. The paper is an attempt to discover factors affecting vocal apparatus and speech. To gain the objective a review and analysis of scientific literature of Russian and foreign authors was performed. Taking into account the interdisciplinarity of speech production, during the analysis the phenomenon was viewed in the context of a variety of sciences: narcology, psycholinguistics, anatomy, phonoscopy, psychiatry, otolaryngology, and psychology.

As a result of the study, a set of factors affecting the vocal apparatus and the speech of the person as a whole was discovered. They include: defects in articulatory organs structure, intoxication, age, illness, and emotional state. However, it is worth noting that in some cases it is difficult to establish which of the factors one or another change in speech was caused by. Moreover, experiments in this area are difficult, given the complexity of detecting neutral emotional state and the possibility of speech simulation.

Key words: vocal apparatus; speech; intoxication; age; emotional state; diseases; injuries and defects of articulatory organs.

Введение

Речевая коммуникация представляет собой особый вид взаимодействия людей, связанный с передачей информации, относящейся как к внешнему, так и к внутреннему миру человека. «Производство речи представляет собой чрезвычайно сложный многоступенчатый процесс. Сообщение начинает формироваться на доязыковом уровне и заканчивается созданием акустического сигнала, проходя через множество промежуточных стадий» [5].

С точки зрения нейрофизиологии речевой аппарат состоит из двух частей, тесно связанных между собой: 1) центрального (или регулирующего) речевого аппарата и 2) периферического (или исполнительного). Центральный речевой аппарат находится в головном мозге. Он состоит из коры головного мозга (преимущественно левого полушария), подкорковых узлов, проводящих путей, ядер ствола (прежде всего продолговатого мозга) и нервов, идущих к дыхательным, голосовым и артикуляторным мышцам» [12, с. 8].

«Периферический речевой аппарат (далее — ПРА) состоит из трех основных отделов: дыхательного (бронхи, трахея, диафрагма), голо-сообразовательного (гортань и голосовые складки) и артикуляционного (активные и пассивные органы артикуляции)» [4, с. 270]. «Помимо вышеуказанных органов, ПРА включает в себя ряд соединенных между собой воздушных полостей — полость легких, трахеи, гортанную полость, глотку, ротовую и носовую полости. Данные полости участвуют в производстве речевых звуков, а их последовательность образует особую аэродинамическую структуру, которая называется речевым (голосовым) трактом» [5].

Для решения ряда задач, связанных с прикладным речеведением, необходимо выявить факторы, влияющие на речевой аппарат человека. Учитывая сложность и комплексность процесса речепроизводства,

при анализе факторов следует рассматривать явление устной речи с точки зрения разных дисциплин: наркологии, психолингвистики, анатомии, фоноскопии, психиатрии, отоларингологии, психологии.

Дефекты строения артикуляторных органов

Устная речь определяется дефектами в строении органов артикуляции (далее — ОА). Любые нарушения в строении АО врожденного или рано приобретенного характера (в возрасте до 7 лет) неизменно влекут за собой трудности в формировании и развитии речи. Более поздние приобретенные дефекты АО как правило не приводят к тяжелой речевой патологии, но могут существенно влиять на качество и отдельные характеристики речи. Наибольшее значение в отношении влияния на функцию голосо- и речеобразования имеют аномалии развития органов артикуляции — губ, твердого и мягкого нёба, языка, челюстей и зубов [15].

Речь у детей с дефектами губы и нёба становится глухой, недостаточно внятной, приобретает гнусавость (открытая ринолалия), наблюдаются нарушения в произношении, как согласных, так и гласных звуков (полная назализация). Аномально высокий свод твердого нёба («готическое» нёбо) также может вызвать нарушение звукопро-изношения [14].

Наиболее выраженные дефекты речи, несомненно, связаны с «волчьей пастью»: речь приобретает гнусавость, становится глухой и недостаточно внятной, наблюдается нарушение в произношении как согласных, так и гласных звуков (полная нозализация). При других врожденных аномалиях губы и нёба их проявление в речи менее выражено [15].

Дефекты развития челюстей и зубного ряда чаще всего проявляются в виде аномалий прикуса. Под прикусом понимают взаимное расположение верхнего и нижнего зубных рядов при сомкнутых челюстях. Все дефекты строения и расположения зубов чаще всего сопровождаются нарушениями произношения в форме шепелявости [15]. Кроме того, эффекты развития языка существенно снижают возможности освоения звукообразования. «К аномалиям развития языка относится, прежде всего, полное его отсутствие, или аглоссия; недоразвитие языка (микроглоссия) или ненормально большой язык (макроглоссия)» [15, с. 67].

Интоксикация

Несомненно, разные виды интоксикации — как постоянной, так и временной влияют на РА. В целом, интоксикацию можно разделить на три типа: алкогольную, наркотическую и медикаментозную. По времени воздействия интоксикацию можно разделить на два типа: острую и хроническую. К обеим категориям можно отнести алкогольную, наркотическую и медикаментозные интоксикации.

Речь у человека при интоксикации героином становится замедленной, голос тихим. Можно заметить появление таких характеристик голоса, как сдавленность, надтреснустость, охриплость, сиплость, гнусавость. По этим признакам можно определить опьянение из соседней комнаты, по телефонному разговору. Наркоманы пытаются объяснить изменения голоса «простудой», но других признаков простуды не наблюдается [13]. Невнятная речь (дизартрия) наблюдаеся также при употреблении барбидуратов, атропина и седативных препаратов [20]. К первитиновой наркомании относят смазанную речь. При фенилпропаноламиновой наркомании — речь дизартрична [11], наблюдается речевое возбуждение. При развитии кокаиновой наркомании — речь «вязкая», медлительная, с персеверацией, лишенной какой-либо продуктивности. В течение 1,5-2 лет развивается опустошение психической сферы, речь становится монотонной и односложной [9].

В рамках хронической интоксикации следует отдельно выделить табакокурение, поскольку данный вид интоксикации накладывает особый отпечаток на речь. С точки зрения речевого аппарата вследствие курения происходит обжиг слизистой оболочки гортани и дыхательных путей, появление отечности, кровоизлияний, утолщений, узлов и полипов голосовых связок, появляются частые несмыкания голосовых связок. Курение поражает слизистую оболочку гортани отчего голос теряет звонкость, выносливость и диапазон. Голос курильщика всегда сиповат на низких тонах и визглив на высоких, ограничен его диапазон, он слабый, часто срывается.

К четырем основным эффектам, связанными с употреблением алкоголя, относятся: замедленная, «невнятная», «нечеткая», «спутанная» речь, речевые ошибки, нечеткое произношение звуков, а также слышимые изменения в качестве речи [7; 18]. «На акустическом уровне: меняется уровень ЧОТ и увеличивается ее вариативность, понижается темп, увеличивается число и длина пауз, иногда снижаются

параметры амплитуды и интенсивности, резко снижается беглость» [7]. В рамках автоматического распознавания речи А. Л. Ронжиным был проведен эксперимент в результате которого была определена зависимость точности автоматического распознавания речи от степени алкогольной интоксикации говорящего (учитывались как изменения параметров голосового тракта, так и семантико-синтаксическая связность произносимой речи). Уровень ошибок распознавания возрастал на первых стадиях интоксикации, затем постепенно фиксировался на определенном уровне. Длительность тестовой фразы также повлияла на точность распознавания; вначале тестирования диктор делал больше ошибок и меньше в конце. Это объясняется тем, что при произношении первой фразы он испытывал большее волнение, что сказывалось на качестве речи, а при увеличении интоксикации, это волнение усиливалось [10].

Возраст

Ввиду того, что по голосу можно легко определить возраст человека, его следует рассматривать как фактор, влияющий на речевой аппарат (далее — РА) человека. Считается, что у пожилых людей диапазон голоса относительно узкий, голос отличается грубым тембром, нестабилен по силе, также меняется высота голоса. По мнению многих авторов, у пожилых женщин голоса более низкие, у пожилых мужчин, наоборот, более высокие, чем у лиц молодого возраста. Степень выраженности возрастных изменений голоса зависит от состояния организма, образа жизни, конституциональной и расовой принадлежности, наследственных, социальных и экологических факторов. Для обозначения физиологических изменений голоса, характерных для пожилого возраста, используется термин «пресбифония». При этом состоянии характерен ряд изменений РА:

• атрофия мышечного аппарата органа;

• постепенная кальцификация и оссификация хрящей гортани, снижение подвижности черпаловидных хрящей;

• смещение гортани книзу;

• увеличение плотности голосовых складок, ведущее к формированию более высокой ЧОТ, у мужчин и атрофия голосовых складок и снижение ЧОТ у женщин;

• неполное смыкание голосовых складок при фонировании звуков в результате атрофических процессов в собственной пластинке слизистой оболочки гортани.

Люди с пресбифонией часто описывают свой голос как хриплый. Субъективно отмечается появление добавочных призвуков в голосе, изменение тональности, придыхание, замедление темпа речи, дрожание голоса. Голос становится более «тонким», грубым «блеющим».

В результате сравнительного анализа акустических параметров голоса в различных возрастных группах, проведенного В. В. Шилен-ковой, было установлено, что в зрелом возрасте женщины имеют объективно лучшие показатели голосовой функции по сравнению с мужчинами, что проявляется более широким частотным диапазоном, лучшими возможностями использования тихого голоса и положительными значениями DSI. С возрастом эти различия стираются, понижение частоты основного звука наблюдается не только у женщин, но и у мужчин. Однако это явление у лиц мужского пола менее заметно. Период старения сопровождается сужением частотного и динамического диапазона голоса, нарастанием jitter, ослаблением силы голоса и, как следствие, смещением DSI в сторону отрицательных значений. В большей степени эти изменения выражены у женщин [7, с. 24, 26].

Заболевания

Нарушениями речи занимается наука логопедия. Логопедические нарушения речи, в свою очередь, делятся на нарушения фонационного (внешнего) оформления речи и на нарушения структурно-семантического (внутреннего) оформления речи:

«а) Нарушения фонационного (внешнего) оформления речи:

— афония, дисфония — отсутствие или расстройство голоса;

— брадилалия — патологически замедленный темп речи;

— тахилалия — патологически ускоренный темп речи;

— заикание — нарушение темпо-ритмической стороны речи, обусловленное судорожным состоянием мышц речевого аппарата;

— дислалия — нарушение звукопроизношения при нормальном слухе и сохранной иннервации речевого аппарата;

— ринолалия — нарушение тембра голоса и звукопроизноше-ния, обусловленное анатомо-физиологическими дефектами речевого аппарата;

— дизартрия — нарушение произносительной стороны речи, обусловленное недостаточной иннервацией речевого аппарата;

б) нарушения структурно-семантического (внутреннего) оформления речи:

— алалия — отсутствие или недоразвитие речи вследствие органического поражения речевых зон коры головного мозга;

— афазия — полная или частичная утрата речи, связанная с локальными поражениями головного мозга» [6, с. 59, 64].

Однако нарушения речи не появляются сами по себе, а возникают в результате различных заболеваний.

К заболеваниям, влияющим на РА, можно отнести лор-заболевания, т. е. заболевания горла, носа и ушей. К наиболее распостраненным аболеваниям носа относятся: ринит, синусит, искривление перегородки носа. Основным заболеванием горла является ларингит (охриплость и осиплость голоса, его грубость, отек слизистой подголосовой полости, которая приобретает вид гиперемированных валиков, суживающих просвет гортани. Заболевания ушей, влияющие на голос, связаны с нарушением слуха, что приводит к усилению громкости речи.

Другая группа заболеваний, влияющих на речь, — это заболевания, касающиеся психического здоровья. Для острого психотического расстройства характера дезорганизованная речь; ускоренная речь является одним из симптомов мании. Речь людей, перенесших эпилептический припадок, а также при некоторых психических расстройствах часто характеризуется обеднением словарного запаса или упрощенным построением предложений. При таких заболеваниях, как болезнь Альц-геймера, прогрессивный паралич, энцефалит в речи больных наблюдается периодическое повторение слогов или отдельных слов. Также в научной литературе широко описана речь больных шизофренией. Речь шизофреника прерывается остановками, продолжающимися до нескольких секунд. С точки зрения построения и содержания речь отличается спутанностью и разорванностью. При этом в речи больного часто слышны особенные интонации, многочисленные логические ударения иногда в местах, где их наличие не предполагается.

Эмоциональное состояние

Речь, являясь формой поведения, также подвержена влиянию, изменяется во внешней коммуникативной среде, что говорит о том, что эмоциональное состояние играет заметную роль в формировании речевого сигнала.

В результате исследования, проведенного на материале польских записей базовых эмоциональных состояний (гнев, грусть, счастье, страх, отвращение, удивление), на распознавание голоса было установлено, что EER (уровень ошибок биометрической системы доступа, при котором FAR и FRR равны) определенно зависит от эмоционального состояния диктора [24]. В другом исследовании записи были сделаны с учетом ряда физиологических параметров, включая характеристики голосовых связок, дыхание, ЭКГ, поверхностную электромиограмму. Акустические параметры, связанные с пороговым значением ЧОТ, диапазоном ЧОТ, jitter и спектральным распределением энергии, были проанализированы и сравнивались с психологическими параметрами. Ряд параметров также статистически сравнивался по разным эмоциям. Хотя методологические проблемы всё еще препятствуют подобным исследованиям, факторный анализ психологических и акустических параметров эмоционального состояния диктора обещает пролить свет на более четкую интерпретацию влияния эмоций на качество звука и речи. В результате исследования было установлено, что:

— наименьший нижний порог ЧОТ характерен для скуки и депрессии, а наивысшей — для счастья и тревоги, что является результатом увеличения напряжения мышц при сильных эмоциональных переживаниях;

— депрессивная речь обладает ограниченным диапазоном ЧОТ, счастливая речь же наоборот. Ограниченный диапазон ЧОТ для напряженной, раздраженной и тревожной речи, вероятно, отражает общее напряжение мускулатуры гортани, которая ограничивает корректировку напряжения голосовых складок и положение гортани;

— анализ времени открытия и закрытия голосовой щели показал, что эмоции влияют на время закрытия голосовой щели. При сильных эмоциональных переживаниях с высокой ЧОТ голосовая щель закрывается быстрее. Подобное быстрое закрытие является признаком повышенного голосового усилия и / или напряжения мышц гортани как в резком голосе [20].

Заключение

Принимая во внимание сложность и важность речи в нашей жизни, для решения задач прикладного речеведения необходимо выделить ее важные аспекты и особенности. На основе анализа научных работ

российских и зарубежных авторов по множеству дисциплин был выявлен следующий ряд факторов, влияющих на речевой аппарат и речь человека в целом с учетом междисциплинарности явления «речь»:

— дефекты в строении артикуляторных органов;

— интоксикация;

— возраст;

— заболевания;

— эмоциональное состояние.

Однако отметим, что в ряде случаев сложно установить, каким из факторов вызваны те или иные изменения речи. Кроме того, эксперименты в данной области сложны, учитывая трудность выявления нейтрального эмоционального состояния, а также возможность имитации речи диктором.

Также следует заметить, что для фундаментальных исследований речевого сигнала необходимо применять несколько разных видов анализа данных: акустический, перцептивный и лингвистический.

СПИСОК ЛИТЕРАТУРЫ

1. Василенко Ю. С., Токарев О. П., Агапова Т. Н. Виброметрия голосового аппарата здоровых лиц и при заболеваниях полости носа и околоносовых пазух // Вестник оторинолар. — 1997. — № 6. — С. 26-29.

2. Взаимосвязь эмоциональных и когнитивных нарушений в структуре наркологических заболеваний / Т. В. Агибалова, О. В. Рычкова, Г. Л. Гуре-вич, Р. К. Потапова // Наркология. — 2014. — № 1. — С. 84-90.

3. Гиляровский В. А. Психиатрия. — М. : АМН СССР, 1931. — 757 с.

4. Дудьев В. П. Психомоторика: слов.-справ. — М. : ВЛАДОС, 2008. — 366 с.

5. Кодзасов С. В., Кривнова О. Ф. Общая фонетика. — М. : РГГУ 2001. — 592 с.

6. Логопедия: учебник для студентов дефектол. фак. пед. вузов / под ред. Л. С. Волковой, С. Н. Шаховской. — М. : ВЛАДОС, 1998. — 680 с.

7. Потапова Р. К., Потапов В. В. Язык, речь, личность. — М. : Языки славянской культуры, 2006. — 496 с.

8. Потапова Р. К., Потапов В. В., Лебедева Н. Н., Агибалова Т. В. Меж-дисциплинарность в исследовании речевой полиинформативности / под ред. Р. К. Потаповой. — М. : Языки славянской культуры, 2015. — 352 с.

9. Пятницкая И. Н. Наркомании: руководство для врачей. — М. : Медицина, 1994. — 544 с.

10. Ронжин А. Л. Определение степени алкогольной интоксикации человека на основе автоматического анализа речи / А. Л. Ронжин, О. О. Басов // Вестн. Моск. ун-та МВД России. — 2015. — № 5. — С. 216-220.

11. Русский народный сервер против наркотиков «NarCom.ru» [Электронный рессурс]. — Режим доступа: http://www.narcom.ru/publ/info/262

12. Сова Л. З. Аналитическая лингвистика. — 3-е изд. — М. : Директ-Медиа,

2014. — 318 с.

13. Участие газеты о проблемах молодежи [Электронный рессурс]. — Режим доступа: http://uchastie.narod.ru/spe3.htm

14. Филичева Т.Б., Чевелева Н. А., Чиркина Г.В. Нарушения речи у детей: пособие для воспитателей дошкольных учреждений. — М. : Профессиональное образование, 1993. — 232 с.

15. Швецов А.Г. Анатомия, физиология и патология органов слуха, зрения и речи: учебное пособие. — Великий Новгород, 2006. — 68 с.

16. Шеврыгин Б. В., Манюк М. К. Оценка некоторых патологических состояний в ринологии // Вестник оторинолар. — 1987. — № 6. — С. 52-56.

17. Шиленкова В. В. Пресбифония. Возрастные изменения акустических параметров голоса / В. В. Шиленкова, О. С. Бестолкова // Вестник оториноларингологии. — 2013. — № 6. — С. 24-27.

18. Brenner M, Cash JR. Speech analysis as an index of alcohol intoxication -the Exxon Valdez accident // Aviation Space and Environmental Medicine. -1991.

19. Gorham-Rowan M. M, Laures-Gore J. Acoustic-perceptual correlates of voice quality in elderly men and women. J Comm Disorders. — 2006. — # 39. -P. 171-184.

20. Johnstone T., Scherer K.R. The effects of emotions on voice quality. — URL: http://www.keck.waisman.wisc.edu/~tjohnstone/0602.pdf

21. Kelly F., Harte N. Forensic comparison of ageing voices from automatic and auditory perspectives // International Journal of Speech Language and the Law. — Vol. 22 (# 2). — 2015. — P. 176-202.

22. Narcozona.ru. Объективно о наркомании. — URL: http://www.narcozona.ru/ pudoc.html (Дата обращения: 15.05.2016).

23. Schiel F., Heinrich C. Disfluencies in the speech of intoxicated speakers // International Journal of Speech Language and the Law. — Vol. 22 (№ 1). —

2015. — P. 19-33.

24. Staroniewicz P. Analysis of Verbal and Nonverbal Communication and Enactment. The Processing Issues // Lecture Notes in Computer Science. -2011. — P. 223-228.

25. Zemlin W.R. Speech and Hearing Science: Anatomy and Physiology 3rd edition. — Prentice-Hall: Inc. Englewood Cliffs, New Jersey. — 1988.

Речь человека — зеркало его самого. Большая Переменка

Зачем нужно итоговое сочинение?

Современное поколение школьников все больше предпочитает виртуальное общение реальному. Язык, которым пользуются в социальных сетях, далёк от каких‑либо норм. В связи с этим упрощается и мышление, снижается индивидуальный запас слов, не формируется целостное мировоззрение, появляется неспособность критически оценивать факты. Об этом говорил и Алексей Николаевич Толстой: «Язык – орудие мышления. Обращаться с языком кое‑как – значит и мыслить кое‑как: неточно, приблизительно, неверно». Это, в свою очередь, влияет на формирование эмоциональной сферы подростков. В конечном итоге, все эти явления отражаются в речи. Чтобы избежать опасной ситуации и обратить более пристальное внимание на языковые навыки, в 2019-м году было введено итоговое собеседование по русскому языку в девятом классе. Его необходимость появилась после принятия Концепции преподавания русского языка и литературы. Это испытание является допуском к ОГЭ, оценивается по системе «зачёт/незачёт». Итоговое собеседование состоит из четырёх частей: чтение текста научно-публицистического стиля о выдающихся людях, пересказ текста с привлечением дополнительной информации, составление монолога, участие в диалоге с собеседником. Ещё раз подчеркиваем, что все эти навыки являются межпредметными и должны формироваться каждым учителем. Осмысленное чтение – это основа основ любой учебной деятельности. Пересказ предполагает умение выделять главную и второстепенную информацию, делить текст на микротемы, что отрабатывается, например, на уроках истории, обществознания, физики и других. Без этого говорить об успешном освоении программы, действительно, нельзя. При подготовке к третьему заданию школьнику предлагают выбрать, какой текст он будет составлять: повествование, описание, рассуждение. Мы уже отмечали, что эта работа ведётся, начиная с пятого класса. Только отличие в том, что устная речь будет спонтанной, менее продуманной, неподготовленной. Темы монолога обязательно близки подросткам, они касаются мира увлечений, спорта, школы, семьи, праздников и традиций. Диалог с собеседником позволяет создать ситуацию естественного общения, в которой наиболее ярко раскрывается личность школьника.

Казалось бы, итоговое собеседование не требует каких‑то специальных знаний. На одной из конференций даже была озвучена мысль, что к этому испытанию не нужно специально готовиться. Его логика в том, что у школьника к девятому классу должны быть сформированы эти умения. Но почему же на практике всё оказывается по‑другому? Многие выпускники испытывают трудности при участии в собеседовании. Почему же многолетняя подготовка не приносит долгожданных результатов?

Одна из причин состоит в том, что к старшим классам мы всё больше внимания уделяем письменной речи, а не устной. Происходит перекос в сторону письменных ответов, конспектов, тестов. Ученики меньше говорят на уроках, что приводит к элементарному страху перед выступлением или даже просто перед диалогом с учителем. Они психологически не готовы к такому экзамену. Думаем, многим знакома ситуация: «Я знаю, что нужно ответить, а вот сформулировать и выразить мысль не могу». Поэтому на всех уроках нужно больше времени отводить на устный опрос, выслушивать каждого ученика, организовывать дискуссии в парах, в группах, учить не только высказывать своё мнение, но и доказывать его. Если у ребят будут требовать соблюдения норм только учителя-словесники, разве они смогут привыкнуть всегда красиво и правильно говорить? Нет, конечно! Пока не будет единых требований, пока каждый учитель не будет обращать внимание на ошибки в речи учеников, коммуникативные компетенции не будут сформированы в полном объёме. И с этой точки зрения введение нового экзамена – это не прихоть, а необходимость, направленная на решение важной проблемы.

Ещё одним испытанием, призванным проверить общие умения выпускников, является итоговое сочинение в 11-м классе. На сайте ФИПИ об этом из экзаменов сказано следующее: «Итоговое сочинение, с одной стороны, носит надпредметный характер, то есть нацелено на проверку общих речевых компетенций обучающегося, выявление уровня его речевой культуры, оценку умения выпускника рассуждать по избранной теме, аргументировать свою позицию. С другой стороны, оно является литературоцентричным, так как содержит требование построения аргументации с обязательной опорой на литературный материал». Таким образом, итоговое собеседование в девятом и итоговое сочинение в 11-м классе – это результат многолетней работы всей школы. Это – результат всего того, чего достиг выпускник, изучая литературу, русский язык, историю и другие школьные предметы. Это – результат зрелости суждений, широты кругозора, умении воплощать мысли и чувства в словесную форму. Это – выражение себя как личности.

Что делать? Извечный вопрос, требующий однозначного ответа: учителям – учить, ученикам – учиться. А ещё читать, и ещё раз читать. Читать классику, статьи литературных критиков, литературоведческие эссе, очерки и комментарии. Наблюдать за правильным, грамотным языком писателей и литературных деятелей. Учиться вежливости и такту в обращении с устным и письменным словом. Овладевать историко-литературными знаниями и формировать речевые умения и навыки.

Дмитрий Поляков,

заместитель директора Старооскольского института развития образования, кандидат педагогических наук, доцент

Опубликовано в газете «Доброжелательная школа Белогорья», № 5 (август), 2020 г.

Фото: https://orfo.pro

На одно лицо: как ученые в пандемию учат нейросети распознавать речь человека в маске

Пандемия коронавируса внесла коррективы в различные сферы жизни миллиардов людей, а обязательным «аксессуаром» пары последних сезонов стала медицинская маска. Но оказалось, что голосовые боты, цифровые секретари и прочие автоматизированные системы связи, массово внедряемые крупными компаниями по всему миру, не готовы эффективно работать при новых стандартах безопасности: искусственному интеллекту очень сложно «понять» речь человека в медицинской маске и дать нужный ответ. Проект по решению этой глобальной задачи в России — научить компьютер понимать речь человека в маске — Российскому фонду фундаментальных исследований предложила группа молодых ученых из Санкт-Петербурга, грантовая поддержка которых является одной из ключевых задач нацпроекта «Наука». В чем уникальность исследования и что необходимо, чтобы обучить искусственный интеллект «видеть» и «слышать» сквозь маску, узнал корреспондент портала «Будущее России. Национальные проекты», оператором которого является информационное агентство ТАСС.

Компьютерные системы распознавания окружают современного человека повсюду. Наиболее простыми из них являются системы записи видео- или аудиоинформации. Часто они используются для контроля безопасности на улицах города или в различных учреждениях.

Последние десятилетия искусственный интеллект применяется для определения личности человека по его уникальным биометрическим показателям, например по изображению лица или голосу.

Гораздо более сложными являются так называемые многомодальные системы. Они обеспечивают взаимодействие между человеком и машиной, когда компьютер с помощью камеры и микрофона понимает речь, жесты или мимику человека и может ему ответить. Сегодня такие программы активно используются в качестве секретарей в больницах, крупных компаниях и кол-центрах: они могут отвечать на вопросы, давать советы, сообщать справочную информацию и обслуживать сотни абонентов сразу.

«Во время распространения эпидемии в мире стремительно распространяется медицинская маска. Это единственный дешевый и в то же время эффективный фактор, который позволяет сдерживать распространение вируса. Однако исследования показывают, что при взаимодействии человека в медицинской маске с искусственным интеллектом речь значительно искажается, а если маска сложная, то речь вообще изменяется. Соответственно, боты, отвечающие на телефонные звонки, не понимают, что говорит абонент, а биометрические системы, например в банке, не работают — посетители на одно лицо, и люди не могут получить доступ к своему имуществу. Сейчас стало ясно, что системы распознавания нуждаются в серьезной адаптации к условиям пандемии», — говорит руководитель гранта, заведующий лабораторией речевых и многомодальных интерфейсов Санкт-Петербургского федерального исследовательского центра РАН Алексей Карпов.

Многомодальные интерфейсы

Разработки в сфере взаимодействия между человеком и компьютером являются сегодня одними из наиболее перспективных в области искусственного интеллекта. Поэтому ими занимаются крупнейшие представители IT-отрасли: Google, Facebook, Microsoft, Baidu, Amazon, Huawei и другие. В России сфера многомодальных технологий пока развита слабо, всего несколько научных коллективов по всей стране обладают необходимыми компетенциями в этой дисциплине. По словам Карпова, исторически сложилось, что признанный центр обработки речи находится в Санкт-Петербурге.

«Наша лаборатория была создана в 1980-е годы. Мы занимаемся распознаванием речи, преобразованием речи в текст, синтезом речи, обратным преобразованием текста в речь. Все это можно назвать паралингвистикой. Исследования были начаты в советские годы профессором Косаревым, который стал основателем научной школы, посвященной направлению. С тех пор центром речевых технологий и является Петербург <…> Примерно 80% специалистов по этой тематике в стране ведут исследования в Петербурге», — отмечает Карпов.

Ученый добавляет, что за прошедшие 30 лет его лаборатория научила компьютер распознавать речь человека в самых сложных условиях, даже в том случае, если у говорящего есть какие-либо заболевания или увечья, искажающие речь. Так, петербургские ученые разработали первую в РФ систему распознавания жестового языка глухих людей. Кроме того, были созданы не имеющие аналогов в стране многомодальные интерфейсы для тех, у кого были парализованы руки, и другие проекты. «Поэтому, когда мы столкнулись с пандемией и теми трудностями, которые она создавала для искусственного интеллекта, у нас уже имелся опыт решения подобных задач», — поясняет ученый.

Международный опыт

По словам Карпова, проект распознавания речи людей в масках, над которым сейчас работают петербургские ученые, органично вырос из опыта участия в пяти международных соревнованиях по компьютерной паралингвистике ComParE(Computational Paralinguistics Challenges), которые ежегодно проводятся в рамках международной конференции Interspeech — наиболее статусного форума в сфере речевых и многомодальных технологий.

Организаторы соревнований каждый год предлагают участникам задания по распознаванию речи в различных условиях, для участия они выкладывают базы данных высказываний или звуков, которые издают люди разного пола и возраста в различных условиях. Побеждает команда, предложившая наиболее верные решения.

«Мы участвуем в этих соревнованиях в течение пяти лет, из них последние три года выигрывали соревнования Interspeech ComParE совместно с нашими турецкими коллегами. Каждый раз задачи были совсем нетривиальные. В первый раз мы представили наилучшее распознавание речи в задании, где требовалось определить тип еды по речи человека по время приема пищи. На следующий год было задание понять, когда человек врет, по его речи. Да, есть такие особенности в разговоре с человеком, который врет. Например, он совершает определенные паузы, говорит медленнее и так далее. Там мы снова победили. В 2017 году нужно было прослушать аудиозаписи храпа людей и на каждой из них определить тип храпа согласно медицинской классификации, это необходимо для диагностики заболеваний во время сна», — вспоминает ученый.

Наконец, в начале 2020 года организаторы соревнований из Шанхая выдвинули на конкурс задачу распознать по речи человека, говорит ли он в маске или без нее, рассказывает Карпов. «Мы подали свою заявку, получили базу данных немецкой речи трех десятков людей (врачей) на несколько часов и приступили к работе. Оказалось, что даже самая обычная маска существенно влияет на способности компьютера к распознаванию. Мы поняли, что это очень актуальная тема, большая и долгоиграющая, учитывая, как разворачиваются в мире события с пандемией. Поэтому мы решили запустить собственный проект на русском языке, который был поддержан Российским фондом фундаментальных исследований по недавно открытому направлению, связанному с фундаментальными проблемами распространения коронавирусных инфекций», — говорит Карпов.

Научить нейросеть

Петербургские ученые сейчас формируют перечень задач, которые необходимо решить в ближайшие два года выполнения проекта, рассказывает ученый. Он считает, что к этому времени наверняка удастся придумать эффективное лекарство от коронавирусной инфекции, однако защитная маска теперь навсегда останется обязательным атрибутом человека: новый опасный вирус может появиться в любое время.

«На сегодняшний день единственное исследование, которое мы пока закончили, — это анализ базы данных по конкурсу «Интерспич». Благодаря проделанной работе мы поняли, что речь искажается из-за типа маски: тряпичная или медицинская маска, пластиковый щиток или респиратор, сбором таких многомодальных данных на русском языке мы сейчас занимаемся в наших теоретических построениях», — поясняет Карпов.

По его словам, параллельно ученые разрабатывают способы распознавания человека в маске с помощью камер, когда более половины, а иногда и до 90% его лица закрыто или искажено. «Тут остается сосредоточиться на том, что у нас имеется — глаза (а иногда и они закрыты очками), лоб и уши. Дополнительная сложность, и ее надо учитывать, — принты на масках, это могут быть геометрические рисунки, животные и даже изображение части лица другого человека. Компьютер должен уметь это все различать. Соответственно, сейчас мы адаптируем компьютерные алгоритмы на основе искусственных нейросетей для работы в таких условиях, но это потребует значительно скорректировать модель распознавания», — поясняет ученый, добавляя, что разработки по проекту могут повысить эффективность многомодальных интерфейсов практически во всех сферах, где они используются сейчас: на улицах, в банках, магазинах и больницах. В некоторых странах такие системы востребованы в клиниках, чтобы без камер с помощью распознавания речи определять людей без масок.

«Одна из главных задач в нашем проекте — создать русскоязычную базу данных людей в масках, ее пока просто нет. Мы будем создавать ее сами, опрашивая сотрудников нашего института, студентов и прочих добровольцев. В идеале нам нужны десятки часов записи и десятки дикторов разного пола, от детей до пожилых. Для небольшого коллектива нашей лаборатории это серьезная задача, но без нее ничего не получится. Мы ставим себе цель собрать такую базу данных и обучить по ней искусственный интеллект, чтобы уже в следующем году представить действующий прототип системы распознавания», — отмечает Карпов.

Почему человеческая речь особенная

Спустя полвека после того, как в Хаскинсе вышла из строя говорящая машина, соединяющая фонемы, компьютерные системы, распознающие и синтезирующие человеческую речь, стали обычным явлением. Все эти программы, такие как цифровой помощник Siri на iPhone, работают на уровне слов. То, что лингвисты теперь знают о том, как мозг функционирует для извлечения слов из потоков речи, теперь поддерживает этот подход к воспроизведению речи на уровне слов. То, как люди обрабатывают речь, также определяется физиологией речевого образования.Исследования нейронных основ других аспектов моторного контроля, таких как выученные движения рук и рук, показывают, что фонемы отражают наборы команд для команд в моторной коре головного мозга, которые в конечном итоге управляют мышцами, которые двигают наши языки, губы, челюсти и гортань, когда мы разговаривать. Но это остается гипотезой. Однако в отношении языка ясно то, что люди уникальны среди существующих видов в животном мире. От анатомии наших голосовых трактов до сложности нашего мозга и разнообразия культур, зависящих от обмена подробной информацией, люди развили способность общаться, как никакой другой вид на Земле.

Как вокализация превращается в человеческую речь

Органы труб являются полезной аналогией функции голосового тракта человека. Эти инструменты относятся к средневековому периоду Европы и состоят из сильфона, обеспечивающего необходимую акустическую энергию, и набора трубок разной длины. Каждая клавиша на органе управляет клапаном, который направляет турбулентный поток воздуха в определенную трубу, которая действует как акустический фильтр, позволяя максимальной энергии проходить через нее с набором частот, определяемых ее длиной и тем, открыт ли он с одного или обоих концов. .Более длинная труба приведет к набору пиков потенциальной акустической энергии — так называемым «формантным частотам» — на относительно низких частотах, тогда как более короткая труба даст более высокий набор формантных частот. В человеческом теле легкие служат мехами, обеспечивая источник акустической энергии для производства речи. Надгортанный голосовой тракт (SVT), дыхательные пути над гортани, действует как трубы, определяя формируемые частоты формант.

Как Чарльз Дарвин указал в 1859 году, легкие млекопитающих и других наземных видов представляют собой переделанные плавательные пузыри, наполненные воздухом органы, которые позволяют костистым рыбам регулировать свою плавучесть.Легкие сохранили эластичность плавательных пузырей. Во время нормального дыхания диафрагма, а также мышцы живота и межреберные мышцы, проходящие между ребрами, работают вместе, расширяя легкие. Затем упругая отдача легких создает силу, которая выталкивает воздух во время выдоха, при этом альвеолярное (легочное) давление воздуха начинается с высокого уровня и линейно падает по мере того, как легкие сдуваются. Однако во время речи диафрагма обездвижена, и альвеолярное давление воздуха поддерживается на почти одинаковом уровне до конца выдоха, поскольку говорящий настраивает свои межреберные и брюшные мышцы, чтобы «сдерживать» силу, создаваемую упругой отдачей мышц живота. легкие.

Дискретные фонемы не существуют как таковые в речевом сигнале, а вместо этого всегда смешиваются вместе в словах.

Это давление в сочетании с напряжением мышц, составляющих голосовые связки гортани, определяет скорость, с которой голосовые связки открываются и закрываются — так называемая основная частота фонации (F0), воспринимаемая как высота голоса говорящего. В большинстве языков F0 имеет тенденцию оставаться достаточно ровным, с мгновенными контролируемыми пиками, которые сигнализируют о выделении, а затем резко снижается в конце предложения, за исключением некоторых вопросов, которые часто заканчиваются повышением или уровнем F0.Контуры и вариации F0 также передают эмоциональную информацию.

В тональных языках контуры F0 различают слова. Например, в китайском языке слово ma имеет четыре разных значения, которые передаются разными локальными контурами F0. Однако во всех языках мира основными акустическими факторами, определяющими гласный или согласный звук, являются его формантные частоты, определяемые положением языка, губ и гортани, которые могут перемещаться вверх или вниз в ограниченной степени. .SVT, по сути, действует как пластичная труба для органа, пропуская через нее максимум энергии на наборе частот, определяемых ее формой и длиной. Временные признаки, такие как длина гласного, также играют роль в различении гласных и согласных. Например, продолжительность гласного слова см. больше, чем продолжительность гласного слова sit , которое имеет почти такие же формантные частоты.

Восприятие формантных частот речи и соотнесение их со словами, которые человек намеревается передать, сложно.Во-первых, люди различаются длиной голосового тракта, что влияет на формантные частоты их речи. В 1952 году в одном из первых экспериментов, направленных на машинное распознавание речи, Гордон Петерсон и Гарольд Барни из Bell Telephone Laboratories обнаружили, что средние формантные частоты гласного [i] — например, в слове heed — составляли 270, 2290 и 3010 Гц для 76 взрослых мужчин. Другими словами, локальные пики энергии в акустическом сигнале возникают на этих частотах формант и передают гласный звук. 2 Средние формантные частоты гласного [u] — как в слове , который — составляли 300, 870 и 2240 Гц для той же группы мужчин. У взрослых женщин частота формант была выше для одних и тех же гласных, потому что их SVT были короче, чем у мужчин. Частота формант у подростков была еще выше. Тем не менее, слушатели-люди обычно способны идентифицировать эти произносимые гласные звуки благодаря когнитивному процессу, известному как перцепционная нормализация, с помощью которого мы бессознательно оцениваем длину SVT говорящего и корректируем соответствующий сдвиг формантных частот.

Исследования показали, что слушатели могут определить длину SVT, услышав короткий отрезок речи или даже обычную фразу или слово. Комплексное исследование 1978 года лингвиста из Университета Альберты Терренса Нири показало, что гласная [i] была оптимальным сигналом для определения длины SVT, а [u] — лишь немного меньше. 3 Это объясняет один из результатов проекта Петерсона и Барни 1952 года, направленного на разработку системы голосового набора номера по телефону, которая должна работать для мужчин, женщин и людей, говорящих на разных диалектах английского языка.Дуэт представил группе слушателей слова, имеющие форму h-vowel-d [hVd], такие как had и heed, произнесенные 10 разными говорящими в квазислучайном порядке, и попросил участников идентифицировать каждое слово. Из 10 000 попыток слушатели неверно идентифицировали [i] только два раза и [u] только шесть раз, но ошибочно идентифицировали слова, содержащие другие гласные, сотни раз. Точно так же в эксперименте 1994 года, в котором слушатели должны были оценивать рост людей (который примерно коррелирует с длиной голосового тракта), слушая, как они производят изолированную гласную, гласная [i] работала лучше всего. 4

Короче говоря, люди неосознанно принимают во внимание тот факт, что частотные паттерны формант, которые играют важную роль в определении слов, зависят от длины речевого тракта говорящего. И летопись окаменелостей, и онтогенетическое развитие детей предполагают, что анатомия нашей головы, шеи и языка была сформирована эволюцией, чтобы производить звуки, которые ясно передают предполагаемую информацию.

Акустика и физиология человеческой речи

Люди обладают уникальной анатомией, которая поддерживает нашу способность воспроизводить сложный язык.Эластичная отдача легких обеспечивает необходимую акустическую энергию, в то время как диафрагма, межреберные мышцы и мышцы живота управляют тем, как этот воздух выпускается через гортань, сложную структуру, в которой находятся голосовые связки и надглазничный речевой тракт (СВТ). который включает полость рта и глотку, полость позади рта и над гортани.

Когда воздух из легких устремляется к мышцам, хрящам и другим тканям голосовых связок и через них, они быстро открываются и закрываются, создавая так называемую основную частоту фонации (F0) или высоту голоса говорящего.Основные звуки, образующие слова, известные как форманты, производятся при изменении положения губ, языка и гортани.

В дополнение к анатомии СВТ, люди развили повышенную синаптическую связность и гибкость в определенных нейронных цепях мозга, важных для воспроизведения и понимания речи. В частности, цепи, соединяющие корковые области и подкорковые базальные ганглии, по-видимому, имеют решающее значение для поддержки человеческого языка.

© laurie o’keefe


Эволюция голосового тракта человека

В книге « О происхождении видов » Дарвин отметил «странный факт, что каждая частица еды и питья, которую мы глотаем, должна проходят через отверстие трахеи с некоторым риском попадания в легкие.«Из-за этой странной анатомии, которая отличается от анатомии всех других млекопитающих, подавление пищей остается четвертой ведущей причиной смерти от несчастных случаев в Соединенных Штатах. Эта видоспецифическая проблема является следствием мутаций, которые сформировали человеческое лицо, глотку и язык, чтобы облегчить разговор и правильно интерпретировать акустические речевые сигналы, которые мы слышим.

При рождении человеческий язык плоский во рту, как и у других млекопитающих. Гортань, которая лежит поверх трахеи, прикреплена к корню языка.Когда младенцы сосут грудь, они поднимают гортань, образуя герметичный проход от носа к легким, позволяющий им дышать, в то время как жидкость течет по гортани. Большинство видов млекопитающих сохраняют эту морфологию на протяжении всей жизни, что объясняет, почему кошки или собаки могут пить воду во время дыхания. Однако у людей процесс развития, охватывающий первые 8-10 лет жизни, формирует взрослую версию СВТ. Во-первых, изменяется форма черепа, что сокращает относительную длину ротовой полости. Язык начинает опускаться в глотку, при этом шея увеличивается в длину и становится округлой в спине.После этих изменений половина языка располагается горизонтально в полости рта (и поэтому называется SVTh), а другая половина (SVTv) расположена вертикально в глотке. Две половины встречаются примерно под прямым углом в задней части горла. Внешние мышцы языка, закрепленные в различных костях головы, могут двигать языком, вызывая резкое 10-кратное изменение площади поперечного сечения СВТ. (См. Иллюстрацию ниже.)

САМАЯ ОБЕЗЬЯНА

Язык у младенцев плоский и почти полностью расположен во рту.В результате гортань, прикрепленная к корню языка, может образовывать закрытые дыхательные пути, позволяющие младенцам дышать во время сосания. У других млекопитающих аналогичная конфигурация. Однако с возрастом анатомия человека меняется. В течение первых 8-10 лет жизни относительная длина ротовой полости укорачивается, и язык уходит вниз в глотку. Это дает супралингеальному голосовому тракту (СВТ) взрослого человека две части почти равной длины, которые встречаются под прямым углом: горизонтальную часть ротовой полости и вертикальную часть, связанную с глоткой.На пересечении этих двух сегментов происходят резкие изменения в площади поперечного сечения СВТ, которые позволяют людям издавать ряд звуков, недоступных для младенцев и животных.

© laurie o’keefe


Как оказалось, конфигурация оральных и глоточных пропорций и формы языка взрослого человека позволяет голосовым трактам зрелого человека воспроизводить гласные [i], [u] и [ а] (как в слове ма). Эти квантовые гласные производят частотные пики, аналогичные насыщенным цветам, более отчетливы, чем другие гласные, и устойчивы к небольшим ошибкам в расположении языка. 5 Таким образом, хотя эти гласные и не требуются для языка, они защищают речь от неправильного толкования. Это может объяснить, почему все человеческие языки используют эти гласные.

Эта анатомия также начинает отвечать на давние вопросы языковых исследований: как возникла человеческая речь и почему другие животные не разговаривают? В 1969 году я и мои коллеги использовали технику компьютерного моделирования, чтобы вычислить частотные паттерны формант гласных, которые может воспроизводить SVT макаки-резуса, на основе предполагаемого диапазона форм и положений языка.Мы обнаружили, что даже когда язык обезьян был расположен как можно дальше по отношению к конфигурациям SVT, используемым говорящими взрослыми людьми для получения гласных [i], [u] и [a], животные не могли воспроизводить соответствующие частоты формант. . Три года спустя, используя рентгеновские видеозаписи, показывающие движение голосового тракта во время крика новорожденного ребенка, мы уточнили и воспроизвели это исследование и обнаружили, что, хотя шимпанзе и новорожденные люди (которые начинают жизнь с СВТ, похожей на обезьяну) производят ряд из гласных они не могли произвести [u] s или [i] s. 6 С тех пор этот вывод был воспроизведен в независимых исследованиях, в том числе в 2017 году, проведенном Tecumseh Fitch Венского университета и его коллегами. Эти ученые использовали современные компьютерные методы, которые легко моделируют каждую форму речевого тракта, которую может воспроизвести макака, и исследовательская группа подтвердила, что голосовые тракты обезьян не способны воспроизводить эти гласные7,8. Команда Фитча продолжала утверждать, что речевые тракты обезьян «являются« голосовыми путями ». готов к речи », что на самом деле так и есть, поскольку исследования давно установили, что эти гласные не являются предпосылками для языка.

Недавние геномные исследования обнаружили эпигенетические модификации, которые, по-видимому, объясняют эволюцию видоспецифичного голосового тракта человека. Теперь очевидно, что массивная эпигенетическая реструктуризация генов, определяющих анатомию головы, шеи, языка, гортани и рта, улучшила нашу способность говорить после того, как анатомически современные люди отделились от неандертальцев и денисовцев более 450 тысяч лет назад. Несколько лет назад Дэвид Гохман, работавший тогда в Еврейском университете в Иерусалиме, и его коллеги реконструировали метилированные области генома окаменелости неандертальца возрастом 40000 лет, более древней окаменелости денисовцев, четырех древних людей, живших от 7000 до 40000 лет назад, и шести шимпанзе, сравнивая их с картой метилирования костных клеток человека, собранной более чем у 55 современных людей.Это сравнение позволило команде идентифицировать дифференциально метилированные области (DMR) между людьми и группами неандертальцев-денисовцев, а также между людьми и шимпанзе ,9,10 Исследователи обнаружили, что больше всего пострадали гены, которые контролировали развитие гортань и глотка, предполагая, что эпигенетические регуляторные изменения позволили человеческому речевому тракту принять форму, оптимальную для речи.

Текущие исследования предполагают глубокое эволюционное происхождение человеческого языка и речи.

Мы, потому что можем говорить

Конечно, тот факт, что обезьяны не разговаривают так, как люди, обусловлен не только физическими ограничениями их голосовых путей. У них также отсутствуют нейронные сети, необходимые для воспроизведения и обработки речи.

Одним из ключевых факторов эволюции речи человека является фактор транскрипции FOXP2. Люди, неандертальцы и денисовцы имеют общую мутацию в гене FOXP2, которой нет у нечеловеческих приматов. Ранние доказательства роли FOXP2 в человеческой речи и языке получены в исследованиях семьи KE, большой расширенной семьи, жившей в Лондоне во второй половине 20-го века.У некоторых участников была только одна копия FOXP2, и им было крайне трудно разговаривать; их речь была неразборчивой, и проблемы распространялись на орофациальную моторику. У них также были трудности с формированием и пониманием английских предложений.

Важность FOXP2 была дополнительно подтверждена исследованиями на мышах. Когда человеческая версия гена фактора транскрипции FOXP2 вставляется в эмбрионы мыши, животные проявляют повышенную синаптическую связность и пластичность в нейронных цепях кортикально-базальных ганглиев, которые регулируют моторный контроль, включая речь.11 У эволюции этих цепей, по-видимому, есть глубокая эволюционная история, восходящая к пермскому периоду, 300 миллионов лет назад. Птичьи версии факторов транскрипции FOXP1 и FOXP2 воздействуют на цепи базальных ганглиев, когда певчие птицы учатся и исполняют песни. 12

Остается неясным, как именно мозг диктует движения голосового тракта для воспроизведения речи. Многие исследования показали, что «матрисомы» нейронов моторной коры представляют собой наборы инструкций для моторных команд, которые организуют заученный акт.13 Сборки нейронов в моторной коре формируются, когда задача усвоена, и эти сборки направляют скоординированную мышечную активность. Чтобы выпить чашку кофе или набрать текст на клавиатуре, например, рука, рука, запястье и другие движения кодируются в матрисомах. Подобные матрисомы, вероятно, управляют мышцами, которые двигают язык, губы, челюсть и гортань, и контролируют давление в легких во время речи, но исследователи только начинают изучать эту идею. Короче говоря, мозг и анатомия участвовали в эволюции человеческой речи и языка.

В 1971 году мы с Эдмундом Крелином из Йельского университета опубликовали исследование с компьютерным моделированием реконструированного речевого тракта неандертальца14. Мы пришли к выводу, что у неандертальцев речевые тракты были похожи на речевые тракты новорожденных человеческих младенцев и обезьян и, следовательно, не могли воспроизводить квантовые гласные [ a], [i] и [u]. Однако доступные археологические данные свидетельствуют о том, что их мозг был довольно развитым и, в отличие от обезьян, они могли говорить, хотя и с ограниченной разборчивостью. Мы пришли к выводу, что неандертальцы обладали и речью, и языком.Короче говоря, текущие исследования предполагают глубокое эволюционное происхождение человеческого языка и речи, когда наши предки обладали способностями, близкими к нашим, еще 300000 лет назад. 14

Речь является неотъемлемой частью человеческой культуры и, следовательно, человеческой эволюции. В первом издании О происхождении видов Дарвин подчеркнул взаимодействие естественного отбора и экосистем: человеческая культура действует как агент для создания новых экосистем, который, в свою очередь, направляет ход естественного отбора.Язык — это механизм, с помощью которого передаются совокупные знания о человеческих культурах, и до самого недавнего времени речь была единственным средством языка. У людей сохранился странный голосовой тракт, повышающий устойчивость речи. Мы могли сказать, что да, потому что можем говорить.

Филип Либерман — почетный профессор Университета Джорджа Хазарда Крукера в Университете Брауна.

Список литературы

  1. A.M. Либерман и др., «Восприятие речевого кода», Psychol Rev , 74: 431–61, 1967.
  2. г. Петерсон, Х.Л. Барни, «Методы контроля, используемые при изучении гласных», J Acoust Soc Am , 24: 175–84, 1952.
  3. Т. Нири, Системы фонетических признаков для гласных , Блумингтон: Университет Индианы Клуб лингвистики, 1978.
  4. WTS Fitch, Восприятие длины голосового тракта и эволюция языка , докторская диссертация Университета Брауна, 1994.
  5. K.N. Стивенс, «О квантовой природе речи», В: E.E. David Jr., P.B. Денес (ред.), Human Communication: A Unified View , McGraw Hill, New York, 1972.
  6. P. Lieberman et al., «Фонетические способности и родственная анатомия новорожденного и взрослого человека, неандертальца и шимпанзе», Am Anthropol , 74: 287–307, 1972.
  7. WT Fitch et al., «Голосовые тракты обезьяны готовы к речи», Sci Adv , 2: e1600723, 2016.
  8. П. Либерман, «Комментарий на «Голосовые тракты обезьян готовы к речи», Sci Adv , 3: e1700442, 2017.
  9. D. Gokhman et al., «Реконструкция карт метилирования ДНК неандертальцев и денисовцев», Science , 344: 523–27, 2014.
  10. D. Gokhman et al., «Недавние регуляторные изменения сформировали человека. анатомия лица и голоса », bioRxiv , DOI: 10.1101 / 106955, 2017.
  11. S. Reimers-Kipping et al.,« Humanized Foxp2 специфически влияет на контуры кортико-базальных ганглиев », Neuroscience , 175: 75–84 , 2011.
  12. Z. Shi et al., «MiR-p регулирует базальные ганглии-зависимые навыки обучения вокалу и способность взрослых певчих птиц», eLife , 7: e29087, 2018.
  13. П. Либерман, Теория, которая изменила все: «Происхождение видов» как работа в стадии разработки . Нью-Йорк: Columbia University Press, 2018.
  14. P. Lieberman, E.S. Крелин, «О речи неандертальца», Linguist Inq , 2: 203–22, 1971.

Как сделать речь запоминающейся

Что вы помните из последней услышанной речи? Если вы похожи на большинство людей, то, наверное, немного. В этой статье мы расскажем, как сделать ваши выступления более запоминающимися.

Как сделать речь запоминающейся

Примерно две недели назад я присутствовал на турнире Большого шлема 2009 года в Филадельфии. Это конкурс, в котором участникам предлагается рассказать правдивую пятиминутную историю. Как только я услышала историю Кая Меттлера, я повернулась к мужу и сказала: «О, она точно победитель».

В то время я мог бы перечислить десятки вещей, которые она сделала правильно. Десятки вещей, которые выделяли ее историю. Но как насчет сегодняшнего дня, почти две недели спустя; что я помню о ее выступлении? Могу ли я перечислить десятки вещей, которые она сделала правильно? (То есть без просмотра ее видео на ютубе).

Она была хороша, но запоминалась ли она?

Оказывается, я кое-что помню. Итак, я подумал, что было бы полезно повторить то, что я помню из ее выступления, чтобы объяснить, как сделать речь запоминающейся.

Вспомните последнюю презентацию, которую вы посетили; вспомните ЛЮБУЮ презентацию, которую вы посетили. Что ты помнишь? В самом деле, подумайте об этом; что ты помнишь? Немного, правда? Скорее всего, вы помните только одну или две (или максимум три) вещи, о которых говорил говорящий (и это, если это был хороший оратор)!

Забыть — это нормально

Психологи говорят о теории увядания.Они говорят, что след или отметка, которая запечатлевается в вашем мозгу, подобна тропе, которую вы делаете в лесу, когда постоянно идете по одному и тому же маршруту. Если вы не пойдете по тому же пути, он в конце концов зарастет — пока не исчезнет.

В известном исследовании забывчивости учебников сравнивается процент материала, запоминаемого через разные промежутки времени. Результаты были интересными:

  • Через 1 день запомнилось 54%.

  • Через 7 дней запомнилось 35%.

  • Через 14 дней запомнился 21%.

  • Через 21 день запомнилось 18%.

  • Через 28 дней запомнилось 19%.

  • Через 63 дня, примерно через два месяца, запомнились только 17%.

Вспоминать то, что вы слышите на лекциях, еще труднее, потому что вы не можете замедлить, сделать паузу, задуматься или перечитать, если вы не сделаете отличные записи! В исследовании воспоминаний после прослушивания семинара студенты забыли более 90% баллов лекции через 14 дней!

Страницы

2.1 Как люди производят речь — основы лингвистики

Фонетика изучает человеческую речь. Речь производится путем подачи воздуха из легких в гортань (дыхание), где голосовые складки могут быть открыты, чтобы воздух мог проходить через них, или могут вибрировать, чтобы издавать звук (фонация). Затем воздушный поток из легких формируется артикуляторами во рту и носу (артикуляция).

Проверь себя


Видео скрипт

Область фонетики изучает звуки человеческой речи.Когда мы изучаем звуки речи, мы можем рассматривать их с двух сторон. Акустическая фонетика , помимо лингвистики, также является разделом физики. Он связан с физическими, акустическими свойствами звуковых волн, которые мы производим. Мы поговорим об акустике звуков речи, но нас в первую очередь интересует артикуляционная фонетика , то есть то, как мы, люди, используем свое тело для воспроизведения звуков речи. Для воспроизведения речи нужны три механизма.

Первый — это источник энергии.Все, что издает звук, требует источника энергии. Для звуков человеческой речи воздух, исходящий из наших легких, обеспечивает энергию.

Второй — источник звука: воздух, выходящий из легких, попадает в гортань. Положите руку на переднюю часть горла и осторожно ощупайте костную часть под кожей. Это передняя часть гортани . На самом деле он сделан не из кости; это хрящи и мышцы. На этом снимке показано, как выглядит гортань спереди.

Автор Олек Ремеш (wiki-pl: Orem, commons: Orem) [CC BY-SA 2.5-2.0-1.0 (https://creativecommons.org/licenses/by-sa/2.5-2.0-1.0)], через Wikimedia Commons

На следующем снимке показан вид человека в горло.

Автор OpenStax College [CC BY 3.0 (http://creativecommons.org/licenses/by/3.0)], через Wikimedia Commons

. Здесь вы видите, что отверстие гортани может быть покрыто двумя треугольными частями кожи. . Их часто называют «голосовыми связками», но на самом деле они не похожи на шнуры или струны. Лучшее название для них голосовых складок .

Отверстие между голосовыми складками называется голосовой щелью .

Мы можем управлять своими голосовыми связками, чтобы издавать звук. Я хочу, чтобы вы опробовали это, поэтому найдите время и закройте дверь или убедитесь, что рядом нет никого, кого вы могли бы побеспокоить.

Сначала я хочу, чтобы вы произнесли слово «э-э-э». Теперь скажите это еще раз, но остановитесь на полпути: «Э-э…». Когда вы это делаете, вы закрываете свои голосовые связки, сводя их вместе. Это остановит прохождение воздуха через ваш голосовой тракт.Эта небольшая тишина в середине «э-э-э» называется остановкой голосовой щели, потому что воздух полностью останавливается, когда голосовые связки закрывают голосовую щель.

А теперь я хочу, чтобы вы открыли рот и тихо выдохнули: «Хаааааааааа». Когда вы это делаете, ваши голосовые связки открываются, и воздух свободно проходит через голосовую щель.

Теперь снова выдохните и скажите «аааа», как будто врач смотрит вам в горло. Чтобы издать этот звук «аааа», вы держите свои голосовые связки близко друг к другу и быстро их вибрируете.

Когда мы говорим, мы издаем одни звуки с раскрытыми голосовыми связками, а другие — с вибрирующими голосовыми связками. Снова положите руку на переднюю часть гортани и издайте длинный звук «SSSSS». Теперь переключитесь и издайте звук «ZZZZZ». Вы можете почувствовать вибрацию гортани на «ZZZZZ», но не на «SSSSS». Это потому, что [s] — это безмолвный звук , созданный с открытыми голосовыми связками, а [z] — это голосовой звук , при котором мы вибрируем голосовыми связками. Сделайте это еще раз и почувствуйте разницу между озвученным и глухим.

Теперь уберите руку с гортани, заткните уши и снова издайте два звука с заткнутыми ушами. Вы можете услышать разницу между глухими и звонкими звуками у себя в голове.

Вначале я сказал, что есть три важнейших механизма, участвующих в создании речи, и пока мы рассмотрели только два:

  • Энергия поступает из воздуха, поступающего через легкие.
  • Голосовые связки издают звук в гортани.
  • Затем звук фильтруется или формируется артикуляторами .

Полость рта — это пространство во рту. Несомненно, носовая полость — это пространство внутри и за носом. И, конечно же, мы используем язык, губы, зубы и челюсти, чтобы произносить речь. В следующем разделе мы более подробно рассмотрим, как мы используем артикуляторы.

Итак, три механизма, которые мы используем для создания речи:

  • дыхание в легких,
  • фононирование гортани и
  • сочленение во рту.

13.7: Космос и культура: NPR

Примерно 1,75 миллиона лет назад наши человеческие предки, гоминины (которых вы, возможно, помните как гоминиды), совершили технологический прорыв. Они начали изготавливать каменные ручные топоры (так называемые инструменты Acheulean ) способами, которые требовали большего планирования и точности, чем те, которые использовались в более ранних процессах изготовления инструментов. Примерно в то же время эти доисторические люди заговорили.

Другими словами, навыки изготовления инструментов и языковые навыки развивались вместе; наш язык, как и наши технологии, имеет долгую предысторию.

Язык мог развиваться вместе с созданием инструментов. Сергей Лаврентьев / iStockphoto.com скрыть подпись

переключить подпись Сергей Лаврентьев / iStockphoto.com

Язык мог развиваться вместе с созданием инструментов.

Сергей Лаврентьев / iStockphoto.com

Это заключение исследования, опубликованного в прошлую пятницу археологом Натали Таис Уомини и психологом Георгом Фридрихом Мейером в журнале PLOS ONE. Их провокационное исследование, в котором используются современные методы визуализации мозга, чтобы исследовать острые вопросы нашего далекого прошлого.

Спросить, когда наши предки впервые начали говорить, — сложный вопрос.Это сильно отличается от поиска истоков двуногого мышления, когда скелетный материал может раскрыть ключевые ключи к разгадке, или происхождения технологий или искусства, где артефакты могут содержать ответы. Речевые органы не превращаются в окаменелости, и сложно связать артефакты с самой ранней речью.

Итак, эта новая статья заслуживает некоторого внимания. Я хотел бы объяснить контекст того, почему и как исследователи занялись происхождением речи, сообщить о своих экспериментальных результатах и ​​рассмотреть некоторые критические отклики на их выводы.

Уомини и Мейер начинают свою статью с ключевого различия: самые ранние каменные орудия ( олдовских орудий ) в археологических записях о деятельности гомининов надежно датированы (по крайней мере пока) 2,5 миллионами лет назад. Напротив, время возникновения речи горячо обсуждается — что неудивительно, учитывая проблемы, изложенные выше. Предполагаемые даты колеблются между двумя миллионами и 50 тысячами лет назад. Это огромный диапазон и явный мотиватор для дальнейших исследований.

Подход Уомини и Мейера, основанный на более ранних формулировках, таких как представленные во влиятельной статье 1991 года Патрисии Гринфилд, заключался в измерении паттернов активации мозга у современных людей, поскольку они продемонстрировали как лингвистические, так и технологические навыки, которые разделяют то, что называется » потребность в структурированных и иерархических планах действий.«Авторы решили искать» прямые доказательства того, что оба навыка задействованы в общих областях мозга или приводят к общим паттернам активации мозга . их мастерство, будучи подключенным к устройству fTCD — функциональному аппарату транскраниальной допплерографии, который измеряет церебральный кровоток. В отличие от методов fMRI и PET, fTCD не требует, чтобы человек оставался неподвижным во время сканирования.Фактически, он вмещает большое количество движений.

Перед участниками, подключенными к fTCD, ​​были даны две задачи: сделать ручной топор в традициях древних гомининов (технологическая задача) и придумать, но не озвучивать вслух список слов, все начинающиеся с такая же обозначенная буква (лингвистическое задание). Задачи перемежались контрольными периодами (удары по сердцевине, но не изготовление инструмента и тихое сидение соответственно). Прогноз исследователей был следующим:

Лица, у которых наблюдаются высоколатерализованные быстрые изменения кровотока для языка, должны демонстрировать аналогичную реакцию во время удара по камню.

И это именно то, что они обнаружили, «общие признаки латерализации мозгового кровотока» у участников, открытие, «соответствующее» совместной эволюции лингвистических и умелых ручно-моторных навыков. Затем Уомини и Мейер приходят к большому эволюционному выводу:

Наши результаты подтверждают гипотезу о том, что аспекты языка могли возникнуть уже 1,75 миллиона лет назад, с началом ашельских технологий.

В своих теоретических рассуждениях об эволюции языка я всегда думал, что более ранняя, чем более поздняя дата происхождения речи более вероятна.

Коммуникативные навыки (как вокальные, так и жестовые) наших ближайших ныне живущих родственников — шимпанзе, бонобо и горилл — сложны и предположительно (хотя и не определенно) указывают на эволюционную платформу, на которой развились лингвистические навыки гомининов. Но действительно ли подход Уомини и Мейера, основанный на моделях кровотока у современных человек, помогает нам узнать о прошлом?

В публикации AAAS Science Майкл Балтер сообщил об оценках нового исследования другими учеными в этой области.Наиболее примечательно для меня беспокойство археолога Томаса Винна по поводу того, что метод fTCD измеряет кровоток в больших областях мозга, но без такого высокого разрешения, как фМРТ или ПЭТ.

Я спросил Иэна Дэвидсона, почетного профессора археологии Университета Новой Англии в Австралии, человека, эксперта в вопросах эволюции человека, языка и инструментов (см. Его в действии, начиная с 38:00 на этом видео), что он думает о новое исследование. Дэвидсон ответил мне в электронном письме:

Конечно, современный человек, стремящийся сделать ручной топор, делает это с планом и с реальной концептуальной мыслью о том, как действовать дальше, и это может быть большим облегчением для новых френологов. мозг отслеживает, что их исследования показывают это.Но это ничего не говорит нам о том, как были сделаны ручные топоры или какие отношения могли быть связаны с когнитивными функциями, когда у гомининов был другой мозг и неизвестная потребность в планах или концептуализации при создании таких инструментов.

Я согласен с Дэвидсоном. Методология, использованная в этом исследовании, проведенном с помощью портативного fTCD, ​​может иметь высокий фактор прохлады, но насколько дает нам надежные ключи к разгадке речи гомининов? Я бы сказал нет: действия и модели кровотока десяти людей 21 века не могут нас туда привести.Узнаем ли мы когда-нибудь, когда наш вид начал говорить? Это остается открытым вопросом.

Самая последняя книга Барбары — How Animals Grieve . Вы можете быть в курсе того, что она думает, в Twitter: @bjkingape

Эволюция человеческой речи в JSTOR

Абстрактный

Человеческая речь включает в себя видоспецифичную анатомию, основанную на опускании языка в глотку. Форма и положение человеческого языка соответствуют пропорциям 1: 1 орально-глоточного надглазничного речевого тракта.Для речи также требуется мозг, который может «повторять» — свободно переупорядочивать конечный набор двигательных жестов, чтобы сформировать потенциально бесконечное количество слов и предложений. Конечные точки эволюционного процесса ясны. У шимпанзе отсутствует надглазничный речевой тракт, способный воспроизводить «квантовые» звуки, которые способствуют как производству речи, так и восприятию, а также мозг, который может повторять фонетические контрасты, очевидные в его фиксированных вокализациях. Традиционная теория языка мозга Брока-Вернике неверна; нейронные цепи, соединяющие области коры с базальными ганглиями и другими подкорковыми структурами, регулируют моторный контроль, включая производство речи, а также когнитивные процессы, включая синтаксис.Датирование гена FOXP2, который управляет эмбриональным развитием этих подкорковых структур, дает представление об эволюции речи и языка. Отправными точками человеческой речи и языка, возможно, были ходьба и бег. Однако анатомия полностью человеческой речи впервые появляется в летописи окаменелостей в верхнем палеолите (около 50 000 лет назад) и отсутствует как у неандертальцев, так и у людей более раннего возраста.

Информация о журнале

Текущие выпуски теперь размещены на веб-сайте Chicago Journals.Прочтите последний выпуск. Current Anthropology — это транснациональный журнал, посвященный исследованиям человечества, охватывающий весь спектр антропологических исследований человеческих культур, человека и других видов приматов. В журнале представлены статьи в самых разных областях, включая социальную, культурную и физическую антропологию, а также этнологию и этноисторию, археологию и предысторию, фольклор и лингвистику.

Информация об издателе

С момента своего основания в 1890 году в качестве одного из трех основных подразделений Чикагского университета, University of Chicago Press взяла на себя обязательство распространять стипендии высочайшего стандарта и публиковать серьезные работы, которые способствуют образованию, способствуют общественному пониманию. , и обогатить культурную жизнь.Сегодня Отдел журналов издает более 70 журналов и сериалов в твердом переплете по широкому кругу академических дисциплин, включая социальные науки, гуманитарные науки, образование, биологические и медицинские науки, а также физические науки.

Права и использование

Этот предмет является частью коллекции JSTOR.
Условия использования см. В наших Положениях и условиях
© 2007 Фонд антропологических исследований Веннера-Грена.Все права защищены.
Запросить разрешения

Параллели в последовательной организации пения птиц и человеческой речи

Наборы данных пения птиц

Мы проанализировали записи песен четырех разных видов: европейского скворца ( Sturnus vulgaris ), бенгальского зяблика ( Lonchura striata domestica ), vireo Кассина (). Vireo cassinii ) и калифорнийский трэшер ( Toxostoma redivivum ).Поскольку каждый из четырех наборов данных сегментировался вручную или алгоритмически различными исследовательскими группами, методология сегментации варьируется в зависимости от вида. Выбор акустической единицы, используемой в нашем анализе, в некоторой степени произвольный, и выбор термина «слог» используется как синоним для всех четырех видов в этом тексте, однако единицы, которые упоминаются здесь как слоги для калифорнийского трэшера и вирео Кассина, иногда являются именуется фразами в другой работе 21,22,34,35 .Информация о длине и разнообразии репертуара каждого слога представлена ​​в таблице расширенных данных 1.

Набор данных по бенгальскому зяблику 33,52 был записан от звукоизолированных особей и помечен вручную. Наборы данных Cassin’s vireo 21,34,63 и California thrasher 35 были взяты из базы данных Bird-DB 40 и записаны в горах Сьерра-Невада и Санта-Моника, соответственно. Оба набора данных помечены вручную.Песня европейского скворца 64 была получена от выловленных в дикой природе скворцов-самцов (разделенных по морфологическим признакам) в возрасте 1 года и старше. Песня Starling записывалась с частотой 44,1 или 48 кГц в течение нескольких дней или недель в разные моменты года в звукоизолированных камерах. Некоторым европейским скворцам перед аудиозаписью вводили тестостерон, чтобы улучшить певческое поведение. Методы аннотирования набора данных по европейским скворцам подробно описаны в разделе «Аннотации к корпусу европейских скворцов».

Процедуры и методы соответствуют всем применимым этическим нормам для испытаний и исследований на животных и выполнялись в соответствии с руководящими принципами Институционального комитета по уходу и использованию животных Калифорнийского университета в Сан-Диего.

Speech corpra

Расшифровки телефонных разговоров были взяты из четырех различных наборов данных: корпус Buckeye спонтанной разговорной американо-английской речи 36 , корпус спонтанной немецкой речи IMS GECO 37 , корпус AsiCA спонтанной итальянской речи Калабрийский диалект 38 (южно-итальянский) и корпус спонтанной японской речи CSJ 39 .

Корпус американо-английской речи (Buckeye) состоит из разговорной речи, взятой от 40 говорящих в Колумбусе, штат Огайо. Помимо записей, корпус включает стенограммы речи и синхронизированную по времени сегментацию на слова и телефоны. Фонетическое выравнивание было выполнено в два этапа: сначала с использованием автоматического выравнивания HMM, за которым следовала ручная корректировка и перемаркировка для согласования с обученным этикетировщиком. Набор данных Buckeye также расшифровывает паузы, которые используются в качестве основы для границ высказывания в нашем анализе.

Немецкий речевой корпус (GECO) состоит из 46 диалогов продолжительностью около 25 минут каждый, в которых записаны ранее не знакомые женщины-субъекты, разговаривающие друг с другом. Корпус GECO автоматически выравнивается на уровне фонемы и слова с использованием принудительного выравнивания 65 из вручную созданных орфографических транскрипций. Затем используется второй алгоритмический шаг для сегментации набора данных на слоги 65 .

Данные итальянской речи (AsiCA) состоят из направленных, информативных и спонтанных записей.Только спонтанный набор данных использовался для нашего анализа, чтобы оставаться совместимым с другими наборами данных. Спонтанный набор данных состоит из 61 транскрипта, каждый продолжительностью в среднем 35 минут. Набор данных AsiCA транскрибируется с использованием гибридного метода орфографической / фонетической транскрипции, при котором определенные фонетические особенности были отмечены метками международного фонетического алфавита.

CSJ состоит из спонтанной речи монологов или разговоров, записанных вручную.Мы используем основное подмножество корпуса как потому, что это полностью аннотированное подмножество набора данных, так и потому, что оно похоже по размеру с другими используемыми наборами данных. Основное подмножество корпуса содержит более 500 000 слов с аннотациями для фонем и некоторых других речевых характеристик и состоит в основном из спонтанно произнесенных монологов. CSJ также аннотируется на уровне мора , слогоподобная единица, состоящая из одной или нескольких фонем и служащая основой структуры 5–7–5 в Haiku 66 .Кроме того, CSJ транскрибируется на уровне межпаузальных блоков (IPU), которые представляют собой периоды непрерывной речи, окруженные паузой не менее 200 мс. Здесь мы называем IPU высказываниями, чтобы оставаться совместимыми с набором данных Buckeye.

Поскольку каждый из наборов данных был расшифрован с использованием разной методологии, это несоответствие между методами транскрипции может объяснить некоторые различия в наблюдаемом распаде МИ. Влияние использования различных методов транскрипции в настоящее время неизвестно.Такое же несоответствие справедливо и для наборов данных о пении птиц.

Аннотация корпуса европейских скворцов

Корпус европейских скворцов был аннотирован с использованием нового алгоритма неконтролируемой сегментации и аннотации, который поддерживается на GitHub.com/timainb/AVGN. Схема алгоритма приведена здесь.

Спектрограммы каждой композиции были созданы путем взятия абсолютного значения одностороннего кратковременного преобразования Фурье формы волны с полосовой фильтрацией. Результирующая мощность была нормализована от 0 до 1, логарифмически масштабирована и задана пороговая величина, чтобы удалить фоновый шум с низкой амплитудой в каждой спектрограмме.Порог для каждой спектрограммы задавался динамически. Начиная с порога базовой мощности, вся мощность в спектрограмме ниже этого порога была установлена ​​на ноль. Затем мы оценили периоды молчания в спектрограмме как участки спектрограммы, где сумма мощности по всем частотным каналам в заданный момент времени была равна нулю. Если не было промежутков молчания в течение по крайней мере n секунд (описано ниже), пороговое значение мощности было увеличено, и процесс повторялся до тех пор, пока не были выполнены наши критерии минимальной длительности молчания или не был превышен максимальный порог.Бои песен, для которых в нашем алгоритме превышен максимальный порог, были исключены как слишком шумные. Этот метод также отфильтровывал предполагаемые приступы, состоящие из неголосовых звуков. Спектрограммы с пороговыми значениями были свернуты с помощью Mel-фильтра с 32 равноотстоящими частотными полосами между верхним и нижним срезами полосового фильтра Баттерворта, а затем масштабированы между 0 и 255.

Чтобы сегментировать партии песни на слоги, мы вычислили спектральную огибающую спектрограмма каждой песни как суммарная мощность по частотным каналам со шкалой Mel в каждой временной выборке спектрограммы.Мы определили слоги как периоды непрерывной вокализации, заключенные в тишину. Чтобы найти слоги, мы сначала отметили паузы минимумами в спектральной огибающей и рассматривали сигнал между каждым молчанием как предполагаемый слог. Затем мы сравнили продолжительность предполагаемого слога с верхней границей ожидаемой длины слога для каждого вида. Если предполагаемый слог был длиннее ожидаемой длины слога, предполагалось, что это соединение двух или более слогов, которые еще не были сегментированы, и порог молчания был повышен, чтобы найти границу между этими слогами.Этот процесс повторяется итеративно для каждого предполагаемого слога, пока он не будет либо сегментирован на несколько слогов, либо не будет достигнут максимальный порог, после чего он будет принят как длинный слог. Этот алгоритм динамической сегментации важен для улавливания некоторых вступительных свистов в песне европейского скворца, которые могут быть в несколько раз длиннее, чем любой другой слог в схватке.

В алгоритме сегментации использовалось несколько гиперпараметров. Минимальная и максимальная ожидаемая длина слога в секундах (ebr_min, ebr_max) была установлена ​​на 0.25 / 0,75 с. Минимальное количество слогов (min_num_sylls), ожидаемое в схватке, было установлено на 20. Максимальный порог тишины (max_thresh) относительно максимума спектральной огибающей был установлен на 2%. Чтобы отсечь излишне шумную песню, в каждом бою ожидалось минимальное значение порога тишины (min_silence_for_spec), установленное на 0,5 с. Базовый порог спектрограммы (журнала) для мощности, считающейся спектральным фоновым шумом (spec_thresh), был установлен на 4,0. Это пороговое значение было установлено динамически, при этом минимальный спектральный фоновый шум (spec_thresh_min) был установлен равным 3.5.

Мы изменили форму слоговых спектрограмм, чтобы создать входные данные одинакового размера для алгоритма уменьшения размерности. Оси времени слогов были изменены с помощью сплайн-интерполяции, чтобы соответствовать частоте дискретизации 32 кадра, равной верхнему пределу длины слога для каждого вида (например, самые длинные слоги скворца составляют ~ 1 с, поэтому все слоги изменяются в соответствии с выборкой скорость 32 отсчета / с). Слоги, которые были короче, чем установленная частота слогов, дополнялись нулями с обеих сторон, чтобы равняться 32-кратным выборкам, а слоги, которые были длиннее верхней границы, были изменены до 32-кратных образцов, чтобы вписаться в сеть.

Существует несколько алгоритмов расшифровки корпусов пения птиц на отдельные элементы. Наш метод уникален тем, что он не полагается на контролируемую (экспериментатор) маркировку элементов или вручную спроектированные акустические особенности, характерные для отдельных видов за пределами длины слога. Метод состоит из двух шагов: (1) спроецировать сложные характеристики каждого набора данных пения птиц на двумерное пространство с использованием алгоритма уменьшения размерности UMAP 41 и (2) применить алгоритм кластеризации для определения границ элементов 67 .Необходимые параметры (например, минимальный размер кластера) были установлены на основе визуального осмотра распределения категорий в двумерном скрытом пространстве. Мы демонстрируем результаты этого метода на рис. 1 как на наборе данных о европейском скворце с использованием нашей автоматической транскрипции, так и на наборах данных о вирео Кассина, калифорнийском трэшере и бенгальском вьюрке. Процедура уменьшения размерности использовалась для наборов данных вирео Кассина, бенгальского зяблика и калифорнийского трэшера, но с использованием сегментации рук, а не алгоритмической сегментации границ.Для этих трех видов также используются ручные ярлыки, а не ярлыки UMAP.

Наборы песен

Наборы данных были либо предоставлены, сегментированы на фрагменты авторами каждого набора данных, как в случае с бенгальскими зябликами, либо были сегментированы на фрагменты на основе межслоговых промежутков более 60 секунд в случай с вирео Кассина и калифорнийскими трэшерами и 10 с — с европейскими скворцами. Эти пороговые значения были установлены на основе распределения межслоговых промежутков для каждого вида (дополнительный рис.9).

Оценка взаимной информации

Мы рассчитали MI, используя распределение пар слогов (или телефонов), разделенных некоторым расстоянием в пределах вокальной последовательности. Например, в последовательности « a b c d e », где буквы обозначают экземпляры определенного слога или категории телефонов, распределение пар на расстоянии «2» будет (( a , c ), ( b , d ), ( c , e )).Мы вычисляем МИ между этими парами элементов как:

$$ \ hat I (X, Y) = \ hat S (X) + \ hat S (Y) — \ hat S (X, Y), $$

(1)

, где X — это распределение отдельных элементов ( a , b , c ) в примере, а Y — это распределение отдельных элементов ( c , d , e ). \ (\ hat S (X) \) и \ (\ hat S (Y) \) — предельные энтропии распределений X и Y , соответственно, и \ (\ hat S (X, Y) \) — энтропия совместного распределения X и Y , (( a , c ), ( b , d ), ( c , e )).K {N_i} \ psi \ left ({N_i} \ right), $$

(2)

, где ψ — функция дигаммы, K — количество категорий (например, слогов или телефонов), а N — общее количество элементов в каждом распределении. Мы учитываем нижнюю границу MI, вычисляя MI на том же наборе данных, где последовательность слогов перемешивается:

$$ \ hat I _ {{\ rm {sh}}} (X, Y) = \ hat S \ left ({X _ {{\ rm {sh}}}} \ right) + \ hat S \ left ({Y _ {{\ rm {sh}}}} \ right) + \ hat S \ left ({X_ {{\ rm {sh}}}, Y _ {{\ rm {sh}}}} \ right), $$

(3)

, где X sh и Y sh относятся к тем же распределениям, что и X и Y , описанным выше, взятым из перемешанных последовательностей. d + f $$

(7)

, где x представляет собой межэлементное расстояние между блоками (например,г., телефоны или слоги). Чтобы подогнать модель к логарифмической шкале, мы вычислили остатки между логарифмом MI и оценкой модели логарифма MI. Поскольку наши расстояния были обязательно выбраны линейно как целые числа, мы масштабировали остатки во время подгонки на логарифм расстояния между элементами. Это было сделано, чтобы подчеркнуть соответствие распада в логарифмическом масштабе. Модели были подогнаны с использованием пакета lmfit Python 69 .

Выбор модели

Мы использовали информационный критерий Акаике (AIC) для сравнения относительного качества экспоненциальной, составной и степенной моделей.AIC учитывает степень соответствия и простоту модели, штрафуя за большее количество параметров в каждой модели (3 для экспоненциальной и степенной моделей, 5 для составной модели). Во всех сравнениях используется оценка AICc 42 , которая налагает дополнительный штраф (помимо штрафа, налагаемого AIC) для корректировки моделей с более высокими параметрами, переоснащенных для меньших наборов данных. Мы выбираем наиболее подходящую модель для спада MI каждой песни птицы и наборов данных человеческого речевого телефона, используя разницу в AICc между моделями 42 .В тексте мы сообщаем об относительной вероятности данной модели (по сравнению с другими моделями), которая вычисляется непосредственно из AICc 42 (см. Дополнительную информацию). Мы сообщаем результаты с использованием данных, преобразованных в журнал, в основном тексте (таблицы 3 и 4 с расширенными данными).

Чтобы определить разумный диапазон расстояний между элементами для всех наборов данных пения и речи птиц, мы проанализировали относительное соответствие (AICc) и долю объясненной дисперсии ( r 2 ) для каждого модель распадается на расстояниях от 15 до 1000 телефонов / слогов.Составная модель наилучшим образом подходит для расстояний до 1000 телефонов на каждом языке (дополнительный рисунок 10) и минимум первых 100 слогов для всех видов певчих птиц (дополнительный рисунок 11). Для обеспечения единообразия анализа по языкам и видам певчих птиц мы сообщаем об анализах с использованием расстояний до 100 элементов (слоги в пении птиц и телефоны в речи). Рисунки 3 и 4 показывают более длительный диапазон распада для каждого языка и вида певчих птиц, нанесенный на график до расстояний между элементами, где коэффициент детерминации ( r 2 ) оставался в пределах 99.{\ frac {3} {2}}}} $$

(8)

, где y — логарифмический индекс MI. Затем мы нашли локальные минимумы и следующие локальные максимумы функции кривизны, которые соответствуют «изгибу» экспоненциальной части функции затухания, и переход между основным вкладом экспоненциального затухания и основным вкладом мощности распад закона.

Анализ последовательности

Наш первичный анализ проводился на последовательностях слогов, которые были произведены в течение одного дня, чтобы учесть динамику как внутри схватки, так и между схватками.Для этого мы рассматривали все слоги, образованные в течение одного дня, как единую последовательность и вычисляли МИ по парам слогов, пересекавшим приступы, независимо от задержки во времени между парами слогов. В дополнение к первичному анализу в течение дня мы выполнили три контроля, чтобы выяснить, было ли наблюдаемое снижение ИМ исключительно из-за организации во время или между схватками. Первый контроль заключался в вычислении MI только между слогами, которые встречаются в одном и том же схватке (что определяется 10-секундным интервалом между слогами).Подобно первичному анализу (рис. 4), наиболее подходящей моделью для распада инфаркта миокарда внутри участка является составная модель (дополнительные рис. 7b и 5). Чтобы более четко разделить зависимости слогов внутри схватки и между схватками у певчих птиц, мы вычислили ослабление ИМ после удаления структуры внутри схватки или между схватками. Для этого мы перетасовали порядок боев в течение дня, сохраняя порядок слогов в каждом бою (дополнительный рис. 7c), или перетасовали порядок слогов в каждом бою, сохранив порядок боев (дополнительный рис.7г). Анализы проводились на отдельных певчих птицах, содержащих не менее 150 слогов в наборе данных (дополнительный рисунок 7), а также на полном наборе данных по всем птицам данного вида. Мы выполнили аналогичный анализ перемешивания для наборов речевых данных (дополнительный рисунок 2). Для речи мы изменили порядок телефонов в словах (при сохранении порядка слов), чтобы удалить информацию внутри слова, и перемешали порядок слов (при сохранении порядка номеров телефонов в словах), чтобы удалить информацию между словами. Мы использовали аналогичную стратегию перетасовки на уровне высказывания, удаляя информацию внутри и между высказываниями.Наборы речевых данных не были разбиты на отдельных лиц из-за ограничений в размере набора данных на индивидуальном уровне, а также из-за того, что язык явно разделяется между людьми в каждом наборе речевых данных.

Чтобы устранить возможность того, что повторяющиеся слоги могут объяснять дальний порядок, мы провели отдельный анализ как исходных последовательностей слогов (созданных птицей), так и сжатых последовательностей, в которых все последовательно повторяющиеся слоги считались одним слогом.Исходная и сжатая последовательности показывают схожие формы распада MI (дополнительный рис. 12). Мы также оценили, как наши результаты соотносятся с временной шкалой сегментации и дискретизации слогов или телефонов, вычислив затухание ИМ между дискретизированными спектрограммами речи и пения птиц при различных временных разрешениях (дополнительный рисунок 13) для подмножества данных. Связи дальнего действия присутствуют как в речи, так и в пении птиц независимо от сегментации, но характер распада ИМ не так точно следует гипотетическим моделям распада, как наблюдаемый, когда сигналы дискретизируются по телефонам или слогам, что подтверждает непредвзятость этих низких частот. уровень производственных единиц.

Вычислительные модели

Мы сравнили распад МИ последовательностей, созданных тремя различными искусственными грамматиками: (1) модели Маркова, используемые для описания песни двух бенгальских зябликов 31,32 , (2) иерархическая модель, предложенная Лином и Тегмарк 3 , и (3) модель, состоящая из иерархической модели, предложенной Лином и Тегмарком, и модели Маркова. Хотя эти модели не охватывают полный набор возможных последовательных моделей и их характерных черт в распаде ИМ, они хорошо отражают прогнозы, сделанные на основе обсуждаемой литературы 2,3,6,7,14 , и обеспечивают иллюстрацию того, что могло бы произойти. можно ожидать, учитывая наши конкурирующие гипотезы.Для каждой модели мы генерируем корпуса последовательностей, а затем вычисляем распад MI последовательностей, используя те же методы, что и для данных пения птиц и речи. Таким же образом мы аппроксимируем степенную, экспоненциальную и составную модель распада МИ (рис. 2).

Марковская модель — это последовательная модель, в которой вероятность перехода в состояние ( x n ) зависит исключительно от предыдущего состояния ( x n -1 ).Последовательности генерируются из модели Маркова путем выборки начального состояния, x 0 из набора возможных состояний S . x 0 Затем за следует новое состояние из распределения вероятностей P ( x n | x n −1 ). Таким образом, марковские модели могут быть захвачены Матрицей M условных вероятностей M ab = P ( x n = a | x n −1 905 b ), где a S и b S .В примере (рис. 2b) мы производим набор из 65 536 (2 16 ) последовательностей из моделей Маркова, описывающих двух бенгальских зябликов 31,32 .

Иерархическая модель от Лин и Тегмарк 3 выборки последовательностей рекурсивно аналогично тому, как модель Маркова выбирает последовательности последовательно. В частности, состояние x 0 строится вероятностно из набора возможных состояний S , как в марковской модели. Начальное состояние x 0 затем заменяется (а не за ним, как в модели Маркова) q новых состояний (а не одним состоянием, как в модели Маркова), которые подвергаются такой же вероятностной выборке, как P ( x i | x 0 ), где x i — любое из новых состояний q , заменяющих x 0 .Следовательно, иерархическая грамматика может быть отражена с помощью матрицы условной вероятности. б ). Разница между двумя моделями заключается в том, что выбранные состояния рекурсивно заменяются в иерархической модели, тогда как в модели Маркова они добавляются последовательно к начальному состоянию. В примере (рис.2a) мы производим набор из 1000 последовательностей из модели, параметризованной алфавитом из 5 состояний, рекурсивно подвергнутых подвыборке 12 раз, причем 2 состояния заменяют начальное состояние при каждой подвыборке (генерируя последовательности длиной 4096).

Последняя модель сочетает в себе как марковскую, так и иерархическую модель, используя сгенерированные Марковом последовательности в качестве конечных состояний иерархической модели. В частности, комбинированная модель генерируется в трехэтапном процессе: (1) Марковская модель используется для генерации последовательностей, равных количеству возможных состояний иерархической модели ( S ).(2) Комбинированная модель выбирается таким же образом, как и иерархическая модель, для создания последовательностей. (3) Конечные состояния иерархической модели заменяются соответствующими им марковскими состояниями из (1). В примере (рис. 2c) мы создаем последовательности так же, как и иерархическая модель. Затем каждое состояние этих последовательностей заменяется последовательностями длиной от 2 до 5 состояний, созданными марковской моделью с алфавитом из 25 состояний.

Ни иерархическая модель, ни комбинированная модель не предназначены для исчерпывающей выборки потенциальных способов, которыми иерархические сигналы могут быть сформированы или объединены с марковскими процессами.Вместо этого обе модели призваны проиллюстрировать теорию, предложенную в предыдущей работе, и служить базой для сравнения для нашего анализа сигналов реального мира.

Сводка отчетов

Дополнительная информация о дизайне исследования доступна в Сводке отчетов по исследованиям природы, связанной с этой статьей.

Неандертальцы обладали способностью воспринимать и воспроизводить человеческую речь — ScienceDaily

Неандертальцы — ближайшие предки современных людей — обладали способностью воспринимать и воспроизводить человеческую речь, согласно новому исследованию, опубликованному международной многопрофильной группой специалистов. исследователи, включая доцента антропологии Бингемтонского университета Рольфа Куама и аспиранта Алекса Велеса.

«Это одно из самых важных исследований, в которых я принимал участие за всю свою карьеру», — сказал Квэм. «Результаты убедительны и ясно показывают, что неандертальцы обладали способностью воспринимать и воспроизводить человеческую речь. Это одно из очень немногих текущих направлений исследований, которые опираются на ископаемые останки для изучения эволюции языка, заведомо сложного предмета в антропологии. »

Эволюция языка и, в частности, лингвистических способностей неандертальцев — давний вопрос эволюции человека.

«На протяжении десятилетий одним из центральных вопросов в исследованиях эволюции человека было то, присутствовала ли человеческая форма общения, разговорный язык, у каких-либо других видов предков человека, особенно у неандертальцев», — сказал соавтор Хуан Луис Арсуага, профессор палеонтолог в Мадридском университете Комплутенсе и содиректор раскопок и исследований археологических памятников Атапуэрка на севере Испании. Последнее исследование реконструировало то, как неандертальцы слышали, чтобы сделать некоторые выводы о том, как они могли общаться.

Исследование опиралось на компьютерную томографию с высоким разрешением для создания виртуальных трехмерных моделей структур уха у Homo sapiens и неандертальцев, а также на более ранних окаменелостях с территории Атапуэрка, которые представляют собой предков неандертальцев. Данные, собранные на трехмерных моделях, были введены в программную модель, разработанную в области слуховой биоинженерии, для оценки слуховых способностей до 5 кГц, что охватывает большую часть частотного диапазона звуков современной речи человека.По сравнению с окаменелостями Атапуэрка, неандертальцы показали немного лучший слух в диапазоне 4-5 кГц, больше напоминающий современных людей.

Кроме того, исследователи смогли вычислить частотный диапазон максимальной чувствительности, технически известный как занимаемая полоса пропускания, для каждого вида. Занимаемая полоса пропускания связана с системой связи, так что более широкая полоса пропускания позволяет использовать большее количество легко различимых акустических сигналов при устном общении вида.Это, в свою очередь, повышает эффективность общения, способность доставлять четкое сообщение в кратчайшие сроки. Неандертальцы демонстрируют более широкую полосу пропускания по сравнению со своими предками из Атапуэрки, более похожими по этой характеристике на современных людей.

«Это действительно ключ», — сказала Мерседес Конде-Вальверде, профессор Университета Алькала в Испании и ведущий автор исследования. «Наличие аналогичных слуховых способностей, особенно полосы пропускания, демонстрирует, что неандертальцы обладали системой связи, столь же сложной и эффективной, как современная человеческая речь.«

«Одним из других интересных результатов исследования было предположение, что речь неандертальцев, вероятно, включала повышенное использование согласных», — сказал Куам. «Большинство предыдущих исследований речевых способностей неандертальцев были сосредоточены на их способности воспроизводить основные гласные в разговорной речи на английском языке. Однако мы считаем, что этот акцент неуместен, поскольку использование согласных — это способ включить больше информации в голосовой сигнал, а также отделяет человеческую речь и язык от коммуникативных паттернов почти у всех других приматов.Тот факт, что наше исследование выявило это, является действительно интересным аспектом исследования и новым предположением относительно лингвистических способностей наших ископаемых предков ».

Таким образом, неандертальцы обладали схожей с нами способностью воспроизводить звуки человеческой речи, и их ухо было «настроено» на восприятие этих частот. Это изменение слуховых способностей у неандертальцев по сравнению с их предками из Атапуэрки соответствует археологическим свидетельствам все более сложных моделей поведения, включая изменения в технологии изготовления каменных орудий, приручение огня и возможные символические практики.Таким образом, исследование предоставляет убедительные доказательства в пользу совместной эволюции все более сложных форм поведения и повышения эффективности голосового общения на протяжении всей эволюции человека.

Команда, стоящая за новым исследованием, развивает это направление исследований в течение почти двух десятилетий и постоянно сотрудничает с целью расширения анализа на дополнительные ископаемые виды. Однако на данный момент новые результаты впечатляют.

«Эти результаты особенно отрадны», — сказал Игнасио Мартинес, профессор Университета Алькала в Испании.«Мы считаем, что после более чем столетнего исследования этого вопроса мы предоставили окончательный ответ на вопрос о речевых способностях неандертальцев».

Исследование «Неандертальцы и современные люди обладали схожими слуховыми и речевыми способностями» было опубликовано в журнале « Nature Ecology and Evolution ».

.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *