[userpic]

Как мозг классифицирует звуки речи

metanymous в Metapractice (оригинал в ЖЖ)

Сводные темы, выпуск 12

Сводные темы
  24. Ранжирование коммуникативных моделей 5 metanymous
  21. Модель-конструкция. Аксиоматика моделирования. 3 metanymous
  20. Ребусы настраивают на буквализм и ТДП/Б 2 metanymous
  19. Субмодальности: я-ковые, мы-ковые, ты-ковые, вы-ковые, он-ковые, она-ковые, оно-ко 5 metanymous
  18. НЛП, EMDR, ECEM, EMI, EMDR-НЛП-ЭГ 6 metanymous
  17. "Бутылочка" в буквализме, рефрейминге и терапии 4 metanymous
  16. NeuroNet Matrix 27 metanymous
  15. Магия удачи. Калибровка удачи. 18 metanymous
  14. Часть "внутренний метамоделист/ программист" 1 metanymous
  13. Компьютерная метафора "я"/эго 47 metanymous
  12. Как мозг классифицирует звуки речи 12 metanymous
  11. Всеобщая человечность vs ч. на жизненном цикле проектов vs бесчеловечность 69 metanymous
  10. Гипнотическое якорение 88 metanymous
  9. Дрессировка и отзеркаливание в применении к роботам 2 metanymous
  8. Сознание есть конфигурация внимания 14 metanymous
  7. "Окно возможностей" 170 metanymous
  6. Субмодальное определение Воображения и Представления через их "границы" 1 metanymous
  5. Лево -правая экспрессия; Spinning World; Моделируем EMDR. 11 metanymous
  4. Внимание и Восприятие 1 metanymous
  3. Буквализм/literalism + The nature of hypnosis 4 metanymous
  2. Собрать ссылки на уже опубликованные сводные темы 4 metanymous
  1. Интерфейсы + DHE интерфейсы + КГД + Ресурсные КГД-стратегии + Кинестетический ресур 4 metanymous
Сводные темы
  11. Всеобщая человечность vs ч. на жизненном цикле проектов vs бесчеловечность metanymous
Моделирование нейрологии
  3. Проверенные источники нейрологических паттернов metanymous
Моделируем ВД - ОВД
  5. Сатпрем - Андреас С. metanymous
academ.org
  http://pix.academ.org/img/2014/12/17/d6fbbfe969ed1339b2159fe0f25ac287.jpg
  http://pix.academ.org
  http://pix.academ.org/img/2014/12/17/8277888412b4858f8890dea18970372b.jpg
  http://pix.academ.org/img/2014/12/17/d5f77b38818dc511907e6e690cce7972.jpg
  http://pix.academ.org/img/2014/12/17/06d454e9a57e37834fb73e7efa6c4883.jpg
  http://pix.academ.org/img/2014/12/17/c9c1022cc89b8588c07dce2a8606dbec.jpg
  http://pix.academ.org/img/2014/12/17/5d6658398842d2efec87aea738a77a72.jpg
  http://pix.academ.org/img/2014/12/17/e09f8ae6e03141ec0376fe50339891f7.jpg
  http://pix.academ.org/img/2014/12/17/de573e7a5bf1d5fd8d16c1cb38c96e82.jpg
  http://pix.academ.org/img/2014/12/17/c92ee58ebe79d33d981a88027528f8ba.jpg
  http://pix.academ.org/img/2014/12/17/36039edb9645a9ee752115f039534a9b.jpg
  http://pix.academ.org/img/2014/12/17/4157feb0dff9fc8e933fc74975e1bb72.jpg
  http://pix.academ.org/img/2014/12/17/bb67da8b413d3f3d099beea37f62b899.jpg
biodiversityexplorer.org
  http://www.biodiversityexplorer.org/birds/ploceidae/images/Village_weaver_327w.jpg
compulenta.ru
  http://science.compulenta.ru/730784/
habrahabr.ru
  http://habrahabr.ru/post/92771/
livejournal.com
  http://klizardin.livejournal.com/608518.html
  http://wolf-kitses.livejournal.com/335739.html
  http://wolf-kitses.livejournal.com/340831.html
  http://wolf-kitses.livejournal.com/427645.html
planetavsego.ru
  http://www.planetavsego.ru/news/html/164.html
unm.edu
  https://sora.unm.edu/sites/default/files/journals/condor/v102n01/p0060-p0080.pdf
vk.com
  https://vk.com/neuroling?w=wall-57960434_43
  http://vk.com/wall-57960434_71
vk.me
  http://cs616017.vk.me/v616017141/10648/lMxR4cvGuNc.jpg
Моделирование нейрологии
  5. Поиск функционального элемента нервной системы metanymous
    Функциональные единицы коры по Хьюбелу metanymous
    "Данный процесс напоминает работу зрительных детектор metanymous
Сводные темы
  13. Компьютерная метафора "я"/эго metanymous
http://metapractice.livejournal.com/452423.html
Моделирование нейрологии (4)
http://metapractice.livejournal.com/396165.html
Моделируем ВД - ОВД (6)
http://metapractice.livejournal.com/330301.html

Оригинал взят у klizardin в Как мозг классифицирует звуки речи
Originally posted by wolf_kitses at Как мозг классифицирует звуки речи

«Команда исследователей сообщает, что мозг не реагирует на отдельные сегменты звуков, известные как фонемы (например, на звук б в слове "бой"), но вместо этого способен распознавать простейшие языковые элементы.
"Данный процесс напоминает работу зрительных детекторов для краев и форм, которые позволяют распознавать объекты, например бутылки, в независимости с какой точки зрения мы их рассматриваем", - говорит ведущий автор работы Эдвард Чанг.
Специальные зоны в речевых центрах отслеживают общие характеристики у звуков, создающиеся при перемещении губ, языка или голосовых связок, сходных по акустике и произношению, благодаря чему мы распознаём их вне зависимости от особенностей дикции говорящего.
Одни группы нейронов ("узнают") избирательно реагируют на:
- взрывные согласные (смычные) – п, т, к, б, г (губы и язык препятствуют движению воздуха, вырывающегося из лёгких),
другие – на фрикативные согласные (щелевые согласные), такие как с, з и в (они лишь частично заслоняют дыхательные пути, создавая трение воздуха).
- гласные заднего ряда
- гласные переднего ряда вместе с полугласными согласными.
"Изучив все звуки английской речи, мы обнаружили, что мозг имеет системную организацию для основных звуковых единиц. Мы преобразуем звуки в значения, фонемы в слова, а слова – в смысл, – подводит итоги Чанг (Edward F. Chang). – Это похоже на структурирование элементов периодической таблицы".

"Когда мы слышим чью-то речь [разные звуки], "загораются" различные области мозга, – комментирует один из авторов работы Нима Месгарани (Nima Mesgarani). – По сути, мы слышим поток различных элементов речи".

Мы можем узнать звуки речи независимо от того, кто и как их говорит: громко, тихо, растягивая слова или, наоборот, торопливо. «Б» мы услышим как «б», а «п» как «п» при любой дикции (разумеется, особо клинические случаи не в счёт). Отсюда можно сделать вывод, что в нашем мозге, вероятно, есть особая система, которая различает такие элементарные речевые единицы. Осталось только эту систему найти.
Например, среди согласных есть так называемые взрывные, которые характеризуются одинаковой манерой произношения и обладают рядом общих звуковых черт. Вот именно такие общие характеристики, объединяющие согласные — взрывные, фрикативные или сонорные, — и регистрировали нейроны зоны Вернике (верхней височной извилины/STG). Благодаря этому умению мозга различать систематические признаки звуков речи мы можем узнать звук «б» независимо от особенностей дикции говорящего.
Разумеется, мозг способен различать и отдельно взятые звуки, но в данном случае речь идёт о нейронных кластерах, которые сильнее реагируют именно на классовые признаки речевых звуков и не обращают внимания на индивидуальные отличия «б» от «д».
Похожая вещь есть и у обезьян, так что те, кто занимается проблемой возникновения речи, получили новую пищу для размышлений.  "phoneme similarity space in STG is driven more by auditory-acoustic properties than articulatory ones"
P.S. Давно хотел сказать, что эпилептикам, участвующих в экспериментах, нужно поставить памятник за вклад в науку!
См. также по теме
А) "Получена детальная карта речевых паттернов, по разному запускающих единый нервно–мышечный аппарат звукопроизношения (язык, губы, челюсть и голосовые связки гортани)":
1. У гласных и согласных — разные группы нейронов, спасибо им за членораздельность.
2. Нейроны выделены в функциональные блоки — звуки на кончике языка (переднеязычные - [С],[З],[Ш]), с задней поверхности языка [Г], [К], [Х], губные звуки [М],[В],[Ф].
Нейронная активность для чистых гласных звуков разделилась на две части: та, которая нужна для округления губ (лабиализованные - [о],[у]), и необходимая для звуков ([а],[и], [ы], [э]), где губы округлять не нужно.
3. Мозг воспроизводит речь не фонетически (на слух), а механически (через сложную нервно–мышечную память звукообразования). То есть образец для сравнения — не звучащее слово, а набор движений языка, голосовых связок, губ и щёк[1].
Давно заметил, что длительное пребывание в новой языковой среде приводит к забыванию вокализации родного языка, что объясняет смешной акцент (американизация русского, например) по возвращению.
4. Скороговорки с похожими согласными (С и Ш, например) приводят к одновременной активации пересекающихся по общим паттернам нейронов. То есть сложность произнесения скороговорок определяется близостью групп нейронов, которые нужны для произнесения чередуемых в них звуков. Мозг ориентируется не на итоговый звук, а на работу языка.
В будущем, надеются авторы работы, эти сведения помогут в терапии речевых расстройств, от лёгких дефектов речи до немоты.
“If we can crack the neural code for speech motor control, it could open the door to neural prostheses,” Hickok says. “There are already neural implants that allow individuals with spinal-cord injuries to control a robotic arm. Maybe we could do something similar for speech?”
Источник
Б) Незаметная смерть распознавания речи.
В) Как заставить машину понимать живую речь?
Источник ВКонтакте
P.P.S. Забавно, что системы коммуникации животных строятся тем же способом. Они базируются на системе оппозиций, задающих незначимые «атомы поведения» - модели движений (элементарные двигательные акты, ЭДА), и на устойчивых корреляциях по времени предъявления ЭДА. Последние «стягивают» их в уже значащие «молекулы поведения» - демонстрации, так что здесь наблюдается «двойное членение», присущее также и языку. Кроме случаев, о которых уже писал, см. «расшифровку» сигнальных систем маскового ткача[2] или полосатого мангуста, устроенных» именно так.

Понятно, что это изоморфизм, а не гомология, но красивый, и, главное, превосходно укладывающийся в параллелизм форм инстинктивного и выученного, который наблюдается и между разными видами животных, и между людьми и животными.


[1]Это изоморфизм с точным воспроизведением специфических форм демонстраций в скоординированных телодвижениях у животных, аналогия с фигурами танца эвристична в обоих случаях.
[2]Вокализации этого вида составлены из т.н. базовых элементов, варьирующих по продолжительности, частоте, громкости и тональности сигналов. При «производстве» сигналов они объединяются в пары с противоположными характеристиками, благодаря чему уменьшается двусмысленность каждого из них и «подчёркиваются» границы между сигналами, идущими друг за другом в последовательности, даже если они включают акустически близкие вокализации. В сущности это коммуникационный код.

12 комментариев

сначала старые сначала новые