Saltar para o conteúdo

Sistemas Sensoriais/Sistema Auditivo

Origem: Wikilivros, livros abertos por um mundo aberto.

O sistema sensorial responsável pela audição é o sistema auditivo. Este Wikilivro cobre a fisiologia do Sistema Auditivo e a sua aplicação na prótese neuro-sensorial mais bem sucedida - o implante coclear. A física e engenharia sobre a acústica são abordadas num Wikilivro separado, Acústica (em inglês). "Viagem ao Mundo da audição"[1] é uma excelente fonte de imagens e animações.

A capacidade de ouvir não é tão comum no reino animal quando comparada com outros sentidos, como o tacto, paladar e olfacto. De facto, encontra-se limitada principalmente aos vertebrados e insectos. Dentro destes, mamíferos e aves possuem o sentido da audição mais desenvolvido. A tabela abaixo mostra as gamas de frequência dos seres humanos e de alguns animais seleccionados:

Seres Humanos 20-20'000 Hz
Baleias 20-100'000 Hz
Morcegos 1'500-100'000 Hz
Peixes 20-3'000 Hz

O órgão que detecta o som é o ouvido. Este órgão atua como receptor no processo de recolha de informação acústica, que é posteriormente transmitida através do sistema nervoso para o cérebro. O ouvido inclui simultaneamente estruturas responsáveis pelo sentido da audição e o sentido de equilíbrio. Não só desempenha um papel importante como parte do sistema auditivo para receber som, como também é um elemento crucial para o equilíbrio e posição do corpo.


Mãe e Filho
Baleias Humpback em posição de canto
Morcego Townsend de orelhas grandes
Peixe Hyphessobrycon pulchripinnis

Os seres humanos têm um par de ouvidos, colocados simetricamente em ambos os lados da cabeça, possibilitando a localização de fontes sonoras. O cérebro extrai e processa diferentes tipos de dados para localizar sons, tais como:

  • a forma do espectro sonoro na membrana timpânica (tímpano)
  • a diferença na intensidade do som entre os ouvidos esquerdo e direito
  • a diferença no tempo-de-chegada entre os ouvidos esquerdo e direito
  • a diferença no tempo-de-chegada entre as reflexões dentro do ouvido (em outras palavras, a forma do pavilhão auricular (padrão de dobras e nervuras) capta as ondas sonoras de uma forma que ajuda a localizar a fonte do som, em particular, sobre o eixo vertical).

Nos seres humanos, os jovens saudáveis ​​são capazes de ouvir sons numa gama de frequências de 20 Hz a 20 kHz. Somos mais sensíveis a frequências entre 2000 e 4000 Hz, que é a gama de frequência da fala. A resolução na frequência é de 0.2%, o que significa que um ser humano consegue distinguir entre um tom de 1000 Hz e 1002 Hz. Um som a 1 kHz consegue ser detectado se deformar a membrana timpânica (tímpano) por menos de 1 Angstrom, que é menor do que o diâmetro de um átomo de hidrogénio. Esta sensibilidade extrema do ouvido pode explicar a razão pela qual o ouvido contém o osso mais pequeno que existe no corpo humano: estapédio (estribo). Este osso mede entre 0.25 a 0.33 cm de comprimento e pesa entre 1.9 e 4.3 mg.

O seguinte vídeo apresenta uma visão geral que resume os diversos conceitos que serão apresentados nas secções seguintes.

Este vídeo animado ilustra como os sons atravessam o ouvido interno, até ao cérebro, onde são interpretados e compreendidos. A cóclea, no ouvido interno, é um órgão em forma de espiral com células ciliadas, que percepcionam as vibrações sonoras. As células ciliadas convertem as vibrações sonoras em sinais químicos que o nervo auditivo consegue compreender.

Anatomia do Sistema Auditivo

[editar | editar código-fonte]
Ouvido (externo) Humana

O objectivo desta secção é explicar a anatomia do sistema auditivo dos seres humanos. Este capítulo ilustra a composição dos órgãos auditivos pela ordem em que recebem a informação acústica durante a percepção sonora.
Note-se que a informação central sobre os “Componentes dos Órgãos Sensoriais” pode também ser encontrada na página da Wikipedia do “Sistema Auditivo”, excluindo algumas modificações feitas neste artigo como extensões e especificações. (consulte: Wikipedia Sistema Auditivo (página em inglês))

O sistema auditivo detecta ondas de som, que são alterações na pressão do ar, e converte-as em sinais eléctricos. Estes sinais são depois processados, analisados ​​e interpretados pelo cérebro. Esta secção começará por se focar na estrutura e componentes do sistema auditivo. O sistema auditivo é composto por duas partes:

  • o ouvido
  • o sistema nervoso auditivo (sistema auditivo central)

O ouvido é o órgão onde ocorre o primeiro processamento do som e onde se localizam os receptores sensoriais. É composto por três partes:

  • ouvido externo
  • ouvido médio
  • ouvido interno
Anatomia do ouvido humano (verde: ouvido externo / vermelho: ouvido médio / roxo: ouvido interno)

Ouvido Externo

[editar | editar código-fonte]

Função: Recolha de energia do som e amplificação da pressão sonora.

Os relevos da cartilagem em torno do canal auditivo (meato auditivo externo, meato acústico externo) são chamados de pavilhão auricular. Esta é a parte visível do ouvido. As ondas sonoras são refletidas e atenuadas quando atingem o pavilhão auricular, e essas alterações fornecem informações adicionais que irão ajudar o cérebro a determinar a direção da origem dos sons. As ondas sonoras entram no canal auditivo, que é um tubo aparentemente simples. O canal auditivo amplifica sons entre 3 e 12 kHz. Na terminação do canal auditivo está a membrana timpânica (tímpano), que marca o início do ouvido médio.

Ouvido Médio

[editar | editar código-fonte]
Imagem de Micro-TC da cadeia ossicular, mostrando a posição relativa de cada ossículo.

Função: Transmissão da energia acústica do ar para a cóclea.
As ondas sonoras que percorrem o canal auditivo chegam à membrana timpânica (tímpano). A informação das ondas circula através do ar na cavidade do tímpano (cavidade do ouvido médio), através de uma série de ossos: o malleus (martelo), a incus (bigorna) e o estapédio (estribo). Estes ossículos actuam como uma alavanca e um teletipo, convertendo as vibrações de som de baixa pressão do tímpano em vibrações de som de alta pressão numa membrana mais pequena chamada janela oval (ou elíptica), que é uma das duas aberturas da cóclea para o ouvido interno. A segunda abertura é chamada janela redonda. Esta permite que o fluido na cóclea se mova.

O martelo articula-se com a membrana timpânica através do manúbrio, enquanto que o estribo articula-se com a janela oval através da sua base. Uma pressão mais elevada é necessária porque o ouvido interno, localizado após a janela oval, contém líquido em vez de ar. O som não é amplificado de modo uniforme ao longo da cadeia ossicular. O reflexo do estapédio dos músculos do ouvido médio ajuda a proteger o ouvido interno de danos.

O ouvido médio ainda contém a informação do som em forma de onda; esta é convertida em impulsos nervosos na cóclea.

Ouvido Interno

[editar | editar código-fonte]
Diagrama da estrutura da cóclea Secção transversal da cóclea Cóclea e Sistema Vestibular a partir de dados de RM


Função: Transformação de ondas mecânicas (som) em sinais eléctricos (sinais neuronais).

O ouvido interno consiste na cóclea e em várias estruturas não auditivas. A cóclea é uma parte do ouvido interno em forma de caracol. Esta tem três secções preenchidas com um fluído: Scala Tympani (canal horizontal), Scala Media (canal posterior, ducto coclear) e Scala Vestibuli (canal superior). A cóclea suporta uma onda de fluído impulsionada pela pressão através da membrana basilar que separa duas das secções (Scala Tympani e Scala Media). A membrana basilar tem cerca de 3 cm de comprimento e 0.5 a 0.04 mm de largura. A Membrana de Reissner (membrana vestibular) separa a Scala Media e a Scala Vestibuli.

Surpreendentemente, a Scala Media, contém um fluido extra-celular cuja composição é semelhante à da endolinfa, que geralmente se encontra no interior das células. O órgão de Corti está localizado neste ducto e converte ondas mecânicas em sinais eléctricos que são transmitidos aos neurónios. As outras duas secções, Scala Tympani e Scala Vestibuli, estão localizadas no labirinto ósseo que está preenchido com um líquido chamado perilinfa. A diferença na composição química entre os fluidos endolinfa (na Scala Media) e a perilinfa (na Scala Tympani e Scala Vestibuli) é importante para a função do ouvido interno.

Órgão de Corti

[editar | editar código-fonte]

O órgão de Corti forma uma banda de epitélio sensorial que se estende ao longo do comprimento de toda a cóclea. As células ciliadas do órgão de Corti transformam as ondas do fluido em sinais nervosos. A viagem através de mil milhões de nervos começa com este passo; a partir daqui os processamentos seguintes conduzem a uma série de reacções e sensações auditivas.

Transição do ouvido para o sistema nervoso auditivo

[editar | editar código-fonte]
Secção da espiral do órgão de Corti

Células ciliadas

[editar | editar código-fonte]

As células ciliadas são células cilíndricas, cada uma com um feixe de 100-200 cílios especializados no topo, daí o seu nome. Estes cílios são os mecanossensores da audição. Os cílios mais curtos são designados estereocílios, e o mais longo na terminação de cada grupo de células ciliadas é o quinocílio. A localização do quinocílio determina a direção de ativação da célula, isto é, a direção de deflexão que induz a excitação máxima da célula ciliada. Posicionada em cima do cílio mais longo está a membrana tectorial, que se move para trás e para a frente em cada ciclo de sons, inclinando o cílio e permitindo que a corrente eléctrica flua através da membrana da célula ciliada.

A função das células ciliadas ainda não foi totalmente determinada. Atualmente, o conhecimento da função das células ciliadas permite substituir estas células com implantes cocleares em caso de perda de audição. No entanto, estudos futuros sobre a função das células ciliadas poderão permitir reparar estas células. O modelo vigente indica que os cílios estão ligados uns aos outros através de “ligações apicais" ("tip links” em inglês), que são estruturas que ligam as extremidades de um cílio a outro. Através de ciclos de extensão e compressão, as “ligações apicais” abrem um canal iónico e produzem um potencial de receptor na célula ciliada. Note-se que uma deflexão de 100 nanómetros é suficiente para activar 90% do potencial de receptor total.

O sistema nervoso distingue entre feixes nervosos que transportam informação para o sistema nervoso central e as feixes nervosos que transportam informação a partir do mesmo:

  • Neurónios aferentes (neurónios sensoriais ou receptores) transportam impulsos nervosos dos receptores (órgãos sensoriais) para o sistema nervoso central
  • Neurónios eferentes (neurónios motores ou efectores) transportam os impulsos nervosos a partir do sistema nervoso central para os efectores, tais como músculos ou glândulas (e também para as células ciliadas do ouvido interno).

Os neurónios aferentes inervam as células ciliadas do interior da cóclea; nas sinapses, o neurotransmissor glutamato transfere os sinais das células ciliadas para as dendrites dos neurónios auditivos primários.

Existem muito menos células ciliadas no interior da cóclea do que feixes nervosos aferentes. As dendrites neurais pertencem aos neurónios do nervo auditivo que, juntamente com o nervo vestibular, constitui o nervo vestíbulo-colear, ou oitavo (VIII) nervo craniano.

As projeções eferentes do cérebro para a cóclea também desempenham um papel na percepção do som. As sinapses eferentes ocorrem em células ciliadas externas e nas dendrites aferentes (em direção ao cérebro) sob as células ciliadas internas.

Sistema nervoso auditivo

[editar | editar código-fonte]

A informação do som, agora re-codificada sob a forma de sinais eléctricos, viaja ao longo do nervo auditivo (nervo acústico, nervo vestíbulo-colear, VIII nervo craniano), através de estações intermédias, tais como o núcleo coclear, o complexo olivar superior do tronco cerebral e o colículo inferior do mesencéfalo, sendo sucessivamente processado em cada passo. A informação chega ao tálamo, e é retransmitida para o córtex. No cérebro humano, o córtex auditivo primário está localizado no lóbulo temporal.

Córtex auditivo primário

[editar | editar código-fonte]

O córtex auditivo primário (A1) é a primeira região do córtex cerebral que recebe estímulos auditivos.

A percepção de som está associada com o Giro direito temporal superior posterior. O Giro temporal superior contém várias estruturas importantes do cérebro, incluindo as áreas de Brodmann 41 e 42, que definem a localização do córtex auditivo primário, que é a região cortical responsável pela capacidade de sentir características básicas do som como a altura e o ritmo.

A área de associação auditiva está localizada no lóbulo temporal do cérebro, numa área chamada área de Wernicke ou área 22. Esta zona, perto do sulco cerebral lateral, é uma região importante para o processamento de sinais acústicos no que diz respeito à distinção entre fala, música e ruído.

Processamento do Sinal Auditivo

[editar | editar código-fonte]

Após especificar a anatomia do sistema auditivo, esta secção irá analisar os processos fisiológicos que ocorrem durante a percepção de informação acústica e conversão dessa informação em dados que podem ser processados pelo cérebro. A audição começa com ondas de pressão que atingem o canal auditivo até serem percepcionadas pelo cérebro. Esta secção analisa em detalhe o processo de transformação das vibrações em percepção.

Efeito da cabeça

[editar | editar código-fonte]

As ondas sonoras com um comprimento de onda mais curto do que a cabeça produzem uma sombra sonora no ouvido oposto em relação à origem do som. Quando o comprimento de onda é maior do que a cabeça, a difração do som gera intensidades sonoras aproximadamente iguais em ambos os ouvidos.

Diferenças na intensidade e no tempo ajudam a localizar a origem do sinal sonoro.

Recepção do som no pavilhão auricular

[editar | editar código-fonte]

O pavilhão auricular, devido à sua forma enrugada, capta as ondas de som no ar de forma diferente consoante estas sejam provenientes da parte de trás ou da frente do mesmo. As ondas sonoras são reflectidas e atenuadas ou amplificadas. Estas diferenças irão ajudar a localizar a origem do som.

No canal auditivo externo, os sons entre 3 e 12 kHz - a gama crucial para a comunicação humana - são amplificados. Este atua como um ressonador que amplifica as frequências recebidas.

Condução do som para a cóclea

[editar | editar código-fonte]

O som que entra no pavilhão auricular na forma de ondas viaja através do canal auditivo até chegar ao início do ouvido médio, assinalado pela membrana timpânica (tímpano). Visto que o ouvido interno está preenchido com fluido, o ouvido médio é uma espécie de dispositivo de equalização de impedâncias de forma a resolver o problema da reflexão da energia sonora na transição de ar para fluido. Por exemplo, na transição do ar para a água, 99.9% da energia sonora recebida é reflectida. Esta quantidade pode ser calculada usando:


Ir é a intensidade do som reflectido, Ii é a intensidade do som original e Zk é a resistência à propagação das ondas nos dois meios ( Zar = 414 kg m-2 s-1 e Zágua = 1.48*106 kg m-2 s-1). Três fatores que contribuem para a equalização de impedâncias são:

  • a diferença relativa entre o tamanho do tímpano e da janela oval,
  • o efeito de alavanca dos ossículos do ouvido médio,
  • a forma do tímpano.
Mecânica do efeito de amplificação do ouvido médio.

As alterações longitudinais na pressão de ar da onda sonora produzem vibrações na membrana timpânica que, por sua vez, faz oscilar sincronamente os três ossículos encadeados do ouvido médio (martelo, bigorna e estribo). Estes ossos vibram como uma unidade, aumentando a energia desde a membrana timpânica até à janela oval. Além disso, a energia do som é ainda reforçada pela diferença na área entre a membrana e a base do estribo. O ouvido médio actua como um transformador de impedância, alterando a energia sonora recolhida pela membrana timpânica numa força maior e com um movimento de menor amplitude. Este mecanismo facilita a transmissão de vibrações das ondas sonoras no ar para o fluido na cóclea. Esta transformação resulta do movimento de entrada e saída, como um pistão, da base do estribo que está localizado na janela oval. Este movimento realizado pela base do estribo induz o movimento do fluido na cóclea.

Através do músculo estapédio, o menor músculo do corpo humano, o ouvido médio tem a função de porta: a contração do músculo altera a impedância do ouvido médio, protegendo assim o ouvido interno de danos causado por sons altos.


Análise de frequência na cóclea

[editar | editar código-fonte]

Os três compartimentos com fluído na cóclea (Scala Vestibuli, Scala Media, Scala Tympani) estão separados pela membrana basilar e pela membrana de Reissner. A função da cóclea é separar os sons de acordo com o seu espectro e transformá-los num código neural. Quando a base do estribo é empurrada contra a perilinfa do Scala Vestibuli, a membrana de Reissner dobra-se sobre a Scala Media. Este alongamento da membrana de Reissner provoca o movimento da endolinfa dentro da Scala Media e induz o deslocamento da membrana basilar. A separação das frequências de som na cóclea deve-se às propriedades específicas da membrana basilar. O fluido na cóclea vibra (devido aos movimentos de entrada e saída da base do estribo) gerando um movimento ondular nesta membrana. A onda começa na base e progride em direcção ao ápice da cóclea. As ondas transversais na membrana basilar propagam-se com uma velocidade definida como:


sendo μ o módulo de cisalhamento e ρ a densidade do material. Uma vez que a largura e a tensão da membrana basilar mudam, a velocidade das ondas que se propagam ao longo da membrana também muda de cerca de 100 m/s perto da janela oval para 10 m/s perto do ápice.

Existe um ponto na membrana basilar onde a amplitude da onda diminui abruptamente. Neste ponto, a onda de som no fluído coclear produz o deslocamento máximo (amplitude máxima) da membrana basilar. A distância percorrida pela onda antes de chegar a este ponto característico depende da frequência do som original. Portanto, cada ponto sobre a membrana basilar corresponde a um valor específico da frequência de estimulação. Um som de baixa frequência percorre uma distância maior do que um som de elevada frequência até atingir o seu ponto característico. As frequências estão distribuídas ao longo da membrana basilar com altas frequências na base e baixas frequências no ápice da cóclea.

A posição x da amplitude máxima da onda em movimento corresponde à frequência do estimulo (de 1 para 1).


Transdução sensorial na cóclea

[editar | editar código-fonte]

A maioria dos sons do quotidiano são compostos por múltiplas frequências. O cérebro processa cada uma das frequências, e não os sons completos. Devido às suas propriedades não homogéneas, a membrana basilar aplica uma aproximação da Transformada de Fourier. Assim, o som é dividido nas suas diferentes frequências, e cada célula ciliada da membrana corresponde a uma certa frequência. A intensidade da frequência é codificada pela taxa de activação da fibra aferente correspondente. Tal deve-se à amplitude da onda na membrana basilar, que depende da intensidade do som que entra no ouvido.

Mecanismo de transdução numa célula ciliada auditiva ou vestibular. A inclinação da célula ciliada em direção ao quinocílio abre os canais de iões de potássio. Este evento altera os potenciais de receptor da célula ciliada. A consequente emissão de neurotransmissores pode provocar um potencial de ação (PA) na célula pós-sináptica.
As células ciliadas auditivas são muito semelhantes às células do sistema vestibular. Esta figura é uma imagem de microscopia eletrónica das células ciliadas do sáculo de um sapo.
Exemplo adicional das células ciliadas de um sapo.

As células sensoriais do sistema auditivo, designadas por células ciliadas, estão localizadas ao longo da membrana basilar no interior do órgão de Corti. Cada órgão de Corti contém cerca de 16.000 células deste tipo, inervadas por aproximadamente 30.000 fibras nervosas aferentes. Existem dois tipos de células ciliadas com diferenças anatómicas e funcionais: as células ciliadas internas e externas. Ao longo da membrana basilar, estes dois tipos estão dispostos numa fila de células internas e três a cinco filas de células externas. A maior parte da inervação aferente resulta das células ciliadas internas, enquanto que a maioria da inervação eferente destina-se às células ciliadas externas. As células ciliadas internas influenciam a taxa de activação de cada fibra nervosa auditiva que se liga a estas células ciliadas. Desta forma, as células ciliadas internas transferem a informação sonora para os centros nervosos auditivos superiores. Por outro lado, as células ciliadas externas amplificam o movimento da membrana basilar injectando energia no movimento da membrana e reduzindo as perdas por fricção, mas não contribuem para a transmissão de informação sonora. O movimento da membrana basilar deforma os estereocílios (cílios das células ciliadas) e diminui (despolarização) ou aumenta (hiperpolarização) os potenciais intracelulares das células ciliadas, consoante a direcção de deflexão. Quando estereocílios estão numa posição de repouso, há uma corrente de estado estacionário que flui pelos canais das células. Assim, o movimento dos estereocílios modula o fluxo de corrente em torno desta corrente estacionária.

Desta forma, os modos de acção dos dois tipos de células ciliadas são:

  • Células ciliadas internas:

A deflexão dos estereocílios das células ciliadas abre mecanicamente os canais de iões permitindo que alguns iões de potássio carregados positivamente (K+) entrem na célula e a despolarizem. Ao contrário de outras células electricamente activas, a célula ciliada não desencadeia um potencial de acção. Neste caso, o influxo de iões positivos vindos da endolinfa na Scala Media despolarizam a célula, gerando um potencial de receptor. Este potencial de receptor abre os canais de cálcio controlados por diferença de potencial eléctrico; posteriormente, iões de cálcio (Ca2+) entram na célula e desencadeiam a libertação de neurotransmissores na terminação basal da célula. Os neurotransmissores estão difundidos através do espaço estreito entre a célula ciliada e um terminal nervoso, onde estão ligados a receptores e assim desencadeiam potenciais de ação no nervo. Desta forma, o neurotransmissor aumenta a taxa de activação no oitavo (VIII) nervo craniano e o sinal mecânico sonoro é convertido num sinal eléctrico nervoso.
A repolarização da célula ciliada é efectuada de uma maneira especial. A perilinfa na Scala Tympani possui uma concentração muito baixa de iões positivos. O gradiente electroquímico faz com que os iões positivos fluam pelos canais até à perilinfa. (ver também: Wikipedia Hair cell)

  • Células ciliadas externas:

Nas células ciliadas externas dos seres humanos, o potencial de receptor desencadeia vibrações activas do corpo da célula. Esta resposta mecânica aos sinais eléctricos é chamada de motilidade elétrica somática e impulsiona oscilações no comprimento da célula, que ocorrem com a frequência do som original e proporcionam uma amplificação da realimentação mecânica (feedback mecânico). As células ciliadas externas apenas evoluíram nos mamíferos. Na ausência de células ciliadas externas, a sensibilidade diminui cerca de 50 dB (devido a maiores perdas por fricção na membrana basilar que amorteceriam o movimento da membrana). Estas também melhoraram a selectividade de frequência (discriminação de frequência), que é especialmente benéfica para os seres humanos, porque permite a fala sofisticada e música. (ver também: Wikipedia Hair cell)

Sem estimulação externa, os feixes nervosos auditivos descarregam os potenciais de ação numa sequência temporal aleatória. Esta ativação aleatória é chamada de atividade espontânea. As taxas de descarga espontânea das fibras variam de muito lentas a taxas de até 100 ativações por segundo. As fibras são classificados em três grupos dependendo se disparam espontaneamente a taxas elevadas, médias ou baixas. Fibras com taxas espontâneas elevadas (> 18 por segundo) tendem a ser mais sensíveis à estimulação sonora do que outras fibras.

Via auditiva dos impulsos nervosos

[editar | editar código-fonte]
Lemnisco lateral a vermelho, ligado ao núcleo coclear, ao núcleo olivar superior e ao colículo inferior. Visto de trás.

Assim, nas células ciliadas internas, o sinal mecânico sonoro é finalmente convertido em sinais eléctricos nervosos. As células ciliadas internas estão ligadas às fibras nervosas auditivas cujos núcleos formam o gânglio espiral. No gânglio espiral, os sinais eléctricos (picos eléctricos, potenciais de ação) são gerados e transmitidos ao longo do ramo coclear do nervo auditivo (VIII nervo craniano) para o núcleo coclear do tronco cerebral.

A partir deste ponto, a informação auditiva é dividida em pelo menos dois fluxos:

  • Núcleo coclear ventral:

Um dos fluxos é o núcleo coclear ventral que depois se divide no núcleo coclear posteroventral (NCPV) e no núcleo coclear anteroventral (NCAV). As células do núcleo coclear ventral projectam para uma coleção de núcleos chamado complexo olivar superior.

Complexo Olivar Superior: Localização sonora

[editar | editar código-fonte]

Considera-se que o complexo olivar superior - uma pequena massa de substância cinzenta - esteja envolvido na localização sonora no plano azimutal (ou seja, o seu ângulo para a esquerda ou para a direita). Existem duas indicações principais para a localização sonora: diferenças interaurais de intensidade (DII) e diferenças interaurais temporais (DIT). O DII mede as diferenças na intensidade sonora entre os ouvidos. Esta técnica funciona para frequências elevadas (acima de 1.6 kHz), onde o comprimento de onda é menor que a distância entre os ouvidos, causando uma região de sombra na cabeça - onde os sons de alta frequência atingem o ouvido oposto com menor intensidade. Os sons de baixa frequência não produzem esta região de sombra, visto que envolvem a cabeça. No entanto, devido ao seu comprimento de onda ser maior do que a distância entre os ouvidos, existe uma diferença de fase entre as ondas sonoras que entram nos ouvidos - a diferença de tempo medida pelo DIT. Este mecanismo funciona de forma bastante precisa para frequências inferiores a 800 Hz, onde a distância entre os ouvidos é menor que metade do comprimento de onda. A localização sonora no plano mediano (frente, acima, atrás, abaixo) é auxiliada pelo ouvido externo, que forma filtros direcionais seletivos.

No complexo olivar superior, as diferenças temporais e de intensidade da informação sonora em cada ouvido são comparadas. As diferenças na intensidade sonora são processadas nas células do complexo olivar superior lateral e as diferenças temporais (atrasos no tempo de execução) no complexo olivar superior medial. Os seres humanos conseguem detectar diferenças de sincronização entre o ouvido esquerdo e direito até 10 μs, o que corresponde a uma diferença de localização sonora de cerca de um grau (1º). Esta comparação de informações sonoras de ambos os ouvidos permite determinar a direção da origem do som. O complexo olivar superior é o primeiro nódulo onde os sinais de ambos os ouvidos se encontram e podem ser comparados. De seguida, o complexo olivar superior envia as informações para o colículo inferior através de uma via de axónios chamada lemnisco lateral. A função colículo inferior é integrar informações antes de enviá-las para o tálamo e córtex auditivo. É interessante notar que o colículo superior, próximo deste, demonstra uma interação dos estímulos auditivos e visuais.

  • Núcleo Coclear Dorsal:

O núcleo coclear dorsal (NCD) analisa a qualidade do som e projecta directamente através do lemnisco para o colículo inferior.

A partir do colículo inferior, a informação auditiva do núcleo coclear ventral e dorsal procede para o núcleo auditivo do tálamo, que é o núcleo geniculado medial. O núcleo geniculado medial transfere a informação para o córtex auditivo primário, a região do cérebro humano responsável pelo processamento da informação auditiva, localizado no lóbulo temporal. O córtex auditivo primário é o primeiro elemento envolvido na percepção consciente do som.

Córtex auditivo primário e áreas auditivas de ordem superior

[editar | editar código-fonte]

A informação sonora atinge o córtex auditivo primário (áreas de Brodmann 41 e 42), que é o primeiro elemento envolvido na percepção consciente do som. Este está organizado tonotopicamente e é responsável pelos fundamentos da audição: a altura e o volume. Dependendo da natureza do som (voz, música, ruído), este é encaminhado para as áreas auditivas de ordem superior. Os sons da fala são processados ​​na área de Wernicke (área de Brodmann 22). Esta área é responsável pela compreensão da linguagem escrita e falada (compreensão verbal). A produção de som (expressão verbal) está relacionada com a área de Broca (áreas de Brodmann 44 e 45). Os músculos que produzem o som necessário para falar são controlados pela área facial do córtex motor, que são regiões do córtex cerebral responsáveis pelo planeamento, controlo e execução das funções motoras voluntárias.

Superfície lateral do cérebro com a numeração das áreas de Brodmann.

Percepção da altura

[editar | editar código-fonte]

Esta secção analisa uma questão fundamental da neurociência auditiva: percepção da altura. Assume-se um conhecimento básico sobre o sistema auditivo, nesse sentido, aconselha-se que os leitores leiam primeiro as secções acima sobre ‘Anatomia do Sistema Auditivo’ e ‘Processamento do Sinal Auditivo’.

O Altura é uma percepção subjectiva, evocada por sons que têm uma natureza aproximadamente periódica. Para vários sons que ocorrem naturalmente, a periodicidade de um som é o principal determinante da altura. No entanto, a relação entre um estímulo acústico e a altura é bastante abstrata: em particular, a altura é bastante resistente a alterações noutros parâmetros acústicos, tais como o volume ou timbre espectral, sendo que ambos podem alterar significativamente as propriedades físicas de uma onda acústica. Isto é particularmente evidente nos casos em que sons que não partilham componentes espectrais podem evocar a mesma altura, por exemplo. Consequentemente, a informação relativa à altura tem que ser extraída de indicações espectrais e/ou temporais representadas através de vários canais de frequência.


A pesquisa sobre a codificação da altura no sistema auditivo está em grande parte focada em identificar os processos neurais que refletem estes processos de extração, ou em encontrar o ‘ponto final’ desse processo: uma representação explícita e robusta da altura como o ouvinte o percepciona. Ambas as abordagens têm tido algum sucesso, com resultados indicando a existência de ‘Neurónios sensíveis a alturas específicas’ nas consideradas ‘áreas da altura’. No entanto, ainda é discutível se a atividade destas áreas está realmente relacionada com a altura ou se elas simplesmente exibem uma representação seletiva dos parâmetros relacionados com a altura. Por um lado, a demonstração da ativação dos neurónios ou áreas neuronais específicas como resposta a vários sons semelhantes que apenas diferem na altura, mesmo que apresentem diferenças substanciais nas suas características físicas, providencia uma evidência correlativa convincente de que estas regiões estão envolvidas na codificação da altura. Por outro lado, é difícil provar com evidências causais que estes neurónios representam a altura, sendo necessário uma combinação de abordagens de gravação in vivo de forma a demonstrar uma correspondência entre estas respostas e a identificação da altura (por exemplo: respostas psicofisiológicas, e não apenas a periodicidade do estímulo), e a manipulação directa da actividade nestas células para demonstrar desequilíbrios previsíveis ou dificuldade na percepção da altura.

Devido à sua natureza abstrata, a altura constitui uma área de pesquisa ativa por resolver. Por essa razão, a discussão incidirá sobre os aspectos mais físicos da percepção da altura, isto é, a frequência de som (para tons puros) e, de forma mais geral, a periodicidade do estímulo. Especificamente, irá ser feita a distinção e definição concreta entre os conceitos de periodicidade e altura. De seguida, será feita uma descrição breve dos principais mecanismos computacionais que podem ser implementados pelo sistema auditivo para extrair informações relacionadas com a altura dos estímulos sonoros. Posteriormente, será delineado a representação e o processamento dos parâmetros da altura na cóclea, na via auditiva ascendente sub-cortical e, por fim, serão apresentadas perspectivas mais controversas em torno do córtex auditivo primário e outros, e serão avaliadas as evidências de ‘neurónios da altura' ou ‘áreas da altura' nestas regiões corticais.

Periodicidade e altura

[editar | editar código-fonte]

A altura é uma propriedade psicofísica emergente. A saliência e ‘altura’ da altura dependem de vários fatores, embora contidos num grupo específico de frequências harmónicas e fundamentais, chamada “Região de existência”. A saliência da altura é em grande parte determinada pela regularidade da repetição de segmentos do som; a ‘altura’ da altura é definida pela taxa de repetição, também conhecida como frequência de modulação. O conjunto de sons capaz de evocar a percepção da altura é diverso e espectralmente heterogéneo. Vários estímulos diferentes - incluindo tons puros, sequências de cliques, ruídos ondulatórios iterativos, sons de amplitude modulada, entre outros - podem evocar uma percepção da altura, enquanto outros sinais acústicos, mesmo que com características físicas muito semelhantes aos anteriores podem não evocar uma resposta à altura. A maioria dos sons que evocam uma resposta à altura e que ocorrem naturalmente são complexos harmónicos - sons que contêm um espectro de frequências que são múltiplos inteiros da frequência fundamental, F0. Uma descoberta importante das pesquisas sobre a altura é o fenómeno da ‘Frequência fundamental ausente’ (ver abaixo): dentro de uma determinada faixa de frequência, toda a energia espectral em F0 pode ser removida de um complexo harmónico, e ainda assim evocar uma resposta a altura correlacionado com F0 num ouvinte humano [2]. Esta descoberta aparenta poder ser generalizada para vários sistemas auditivos não-humanos [3][4].

Altura da Frequência fundamental ausente. Espectrógrafos de áudio para a melodia de 'Mary had a little lamb’. (Esquerda) Melodia tocada com tons puros (frequência fundamental), (centro) melodia tocada com a frequência fundamental e com seis sobre-tons harmónicos (direita) melodia tocada apenas com sobre-tons harmónicos e com a energia espectral na frequência fundamental removida. Como demonstrado nos clipes de áudio correspondentes à esquerda, estas três melodias diferem em timbre, mas a altura permanece inalterada, apesar da ‘Frequência fundamental ausente’ e das melodias de tons puros não terem componentes espectrais em comum.




O fenómeno da ‘Frequência fundamental ausente’ é importante por duas razões. Em primeiro lugar, é uma referência importante para avaliar se neurónios específicos ou regiões do cérebro são especializados no processamento da altura, visto que é expectável que estas unidades demonstrem actividade referente a F0 (e, por conseguinte à altura), independentemente da sua presença no som ou noutros parâmetros acústicos. De forma genérica, um ‘neurónio de resposta a altura’ ou um ‘centro da altura’ deve mostrar uma atividade consistente em resposta a todos os estímulos que evocam uma percepção particular da ‘altura’ da altura. Como será analisado, esta possibilidade tem sido uma fonte de desacordo na identificação de potenciais neurónios ou áreas de resposta a altura. Em segundo lugar, a capacidade de percepcionar uma altura correspondente a F0, mesmo quando este está ausente no estímulo auditivo, fornece uma forte evidência contra o facto de o cérebro ter implementado um mecanismo para ‘utilizar’ F0 para inferir directamente a altura. Em vez disso, a altura deve ser extraída de indicações temporais ou espectrais (ou ambas) [5].

Mecanismos de extração da altura: indicações espectrais e temporais

[editar | editar código-fonte]
Harmónicos resolvidos e não resolvidos. Esquema de um espectro, padrão de excitação e simulação da vibração da membrana basilar (MB) para uma nota complexa com uma F0 de 100 Hz e frequências harmónicas de igual amplitude. Como pode ser visto no padrão de excitação e nas vibrações MB, harmónicos de ordem maior são “não resolvidos”, isto é, não há separação efectiva dos harmónicos individuais. (Descrição adaptada do autor original. Disponível em : http://www.europeanmedical.info/auditory-nerves/resolved-and-unresolved-harmonics-341-defining-resolvability.html)

Estas duas indicações (espectrais e temporais) são as bases de duas classes principais de modelos de extração da altura[5]. O primeiro destes são os métodos no domínio temporal, que utilizam indicações temporais para avaliar se um som é composto por segmentos repetidos e, em caso afirmativo, a taxa de repetição. Um método geralmente proposto para aplicar esta técnica é a autocorrelação. Uma função de autocorrelação envolve essencialmente encontrar os atrasos de tempo entre dois pontos de amostragem que darão a correlação máxima: por exemplo, uma onda de som com uma frequência de 100Hz (ou período, T=10 milissegundos) teria uma correlação máxima se as amostras forem tiradas em intervalos de 10 milissegundos. Para uma onda de 200Hz, o atraso que gera uma correlação máxima seria de 5 milissegundos, mas também a 10 milissegundos, 15 milissegundos, e assim por diante. Assim, se esta função for realizada em todas as frequências que compõem um complexo harmónico com F0=100Hz (tendo assim sobre-tons harmónicos a 200Hz, 300Hz, 400Hz, e assim por diante), e os intervalos de tempo resultantes que dão uma correlação máxima forem somados, eles iriam ‘votar’ coletivamente em 10 milissegundos - a periodicidade do som. A segunda classe de estratégias de extracção da altura são os métodos no domínio da frequência, nos quais a altura é extraída através da análise do espectro de frequências de um som para calcular F0. Por exemplo, o processo de ‘Corresponência de modelos padrão’ - como ‘o filtro de harmónicos’ - propõem que o espectro de frequência de um som seja simplesmente comparado com modelos harmónicos padrão - sendo que a melhor correspondência representa o F0 correcto [6].

Existem limitações em ambas as classes de explicações. Os métodos no domínio da frequência exigem que as frequências harmónicas sejam resolvidas - ou seja, cada harmónico deve ser representado como uma banda de frequência distinta (ver a figura à direita). No entanto, harmónicos de ordem superior, que não são resolvidos devido à maior largura de banda na representação fisiológica de frequências mais elevadas (consequência da organização tonotópica logarítmica da membrana basilar) conseguem evocar uma altura correspondente a F0. Os modelos temporais não têm este problema, uma vez que a função de autocorrelação deve produzir a mesma periodicidade, independentemente da função ser executada em um ou mais canais de frequência. Contudo, é difícil atribuir os limites inferiores das frequências evocadoras da altura à autocorrelação: estudos psicofísicos demonstram que é possível percepcionar a altura de complexos harmónicos com frequências fundamentais ausentes tão baixas quanto 30Hz; o que corresponde a um atraso de amostragem superior a 33 milissegundos - muito maior do que o atraso de ~10 milissegundos geralmente observado na sinalização neural [5].

Harmónicos da fase sinusoidal (esquerda) e da fase alternada (direita). Estes complexos têm a mesma F0 (125 Hz) e os mesmos números harmónicos, mas a altura do complexo à direita é uma oitava maior do que a altura do complexo à esquerda. Ambos os complexos foram filtrados ​​entre 3900 e 5400 Hz. (Descrição do autor original. Disponível em: http://www.europeanmedical.info/auditory-nerves/resolved-and-unresolved-harmonics-341-defining-resolvability.html)

Uma forma para determinar qual destas duas estratégias é utilizada pelo sistema auditivo é o uso de harmónicos de fase alternada: apresentando harmónicos ímpares com uma fase sinusoidal e harmónicos pares com fase cosseno. Visto que tal não afecta o conteúdo espectral do estímulo, não haverá nenhuma mudança na percepção da altura se o ouvinte depender principalmente de indicações espectrais. Por outro lado, a taxa de repetição do envelope temporal irá duplicar. Assim, se forem utilizadas indicações de envelope temporal, a altura percepcionada pelo ouvinte para harmónicos de fase alternada será uma oitava acima (ou seja, o dobro da frequência) da altura percepcionada para todos os harmónicos cosseno com a mesma composição espectral. Estudos psicofísicos têm investigado a sensibilidade da percepção da altura a mudanças de fase para diferentes F0 e intervalos de harmónicos, apresentando evidências de que, quer os seres humanos [7] quer outros primatas [8], adoptam uma estratégia dupla: sinais espectrais são utilizados para harmónicos resolvidos de ordem mais baixa, enquanto que indicações de envelopes temporais são usadas para harmónicos não resolvidos de ordem superior.

Extração da altura na via auditiva ascendente

[editar | editar código-fonte]

As fracções de Weber para discriminação da altura foram reportadas como sendo inferiores a 1% em seres humanos [9]. Dada esta elevada sensibilidade a alterações na altura, e a demonstração de que ambas as indicações espectrais e temporais são utilizadas para a extracção da altura, é possível prever que o sistema auditivo representa tanto a composição espectral como a estrutura fina temporal dos estímulos acústicos de uma forma muito precisa, até estas representações serem eventualmente transmitidas explicitamente para neurónios que respondem a alturas específicas ou a estímulos periódicos.

Experiências eletrofisiológicas identificaram respostas neuronais no sistema auditivo ascendente que são consistentes com esta noção. A partir do nível da cóclea, os movimentos da membrana basilar (MB) mapeados tonotopicamente em resposta a estímulos auditivos estabelecem uma selectividade espacial para a composição da frequência ao longo do eixo da MB. Estas representações são reforçadas por uma fixação de fase das fibras do nervo auditivo (FNA) para os componentes de frequência aos quais ela responde. Este mecanismo para representação temporal da composição da frequência é ainda melhorado de várias formas, tais como a inibição lateral na sinapse da célula ciliada / gânglio espiral [10], suportando a noção de que esta representação precisa é essencial para a codificação da altura.

Assim, nesta fase, os padrões dos picos temporais de fase fixa das FNA contêm provavelmente uma representação implícita da periodicidade. Esta hipótese foi testada por Cariani e Delgutte[11]. Ao analisar a distribuição dos intervalos inter-picos de todas as ordens (IIP) nas FNA de gatos, foi mostrado que o IIP mais comum era a periodicidade do estímulo, e o rácio de Pico-Média destas distribuições aumentava para estímulos complexos que evocavam percepções da altura mais salientes. Com base nestes resultados, os autores propuseram a “hipótese do intervalo predominante”, na qual um grupo com o código dos IIP de todas as ordens ‘vota’ na periodicidade - embora, esta descoberta seja uma consequência inevitável das respostas de fase fixa das FNA. Além disso, existem evidências de que a selectividade espacial para os componentes de frequência também é crítica. Ao cruzar um estímulo de baixa frequência com um transportador de alta frequência, Oxenham et al transpuseram a estrutura fina temporal da sinusóide de baixa frequência para as regiões de maior frequência ao longo da MB.[12]. Isto levou a uma deficiência nas capacidades de discriminação da altura. Assim, tanto a codificação espacial e temporal representam informações relacionadas com altura nas FNA.


O nervo auditivo transporta informação para o núcleo coclear (NC). Neste local, várias tipos de células representam informação relacionada com a altura de diferentes formas. Por exemplo, várias células peludas aparentam ter diferenças mínimas na capacidade de excitar fibras do nervo auditivo - a informação pode ser transportada para regiões cerebrais de ordem superior sem sofrer modificações significativas[5]. Um exemplo particularmente interessante é dado pelas células de corte contínuo no núcleo coclear ventral. De acordo com Winter e os seus colegas, os intervalos dos picos de primeira ordem destas células correspondem à periodicidade em resposta a estímulos de ruído ondulatório iterativo (ROI), bem como a complexos harmónicos de fase cosseno e aleatória, que são invariantes ao nível do som[13]. Embora seja necessária uma caracterização mais detalhada das respostas celulares a estímulos que induzem respostas a diferentes alturas, existe alguma evidência de que a extração da altura do som tem início ao nível do NC.

No colículo inferior (CI), existe alguma evidência que a taxa de resposta média dos neurónios é igual à periodicidade do estímulo[14]. Estudos posteriores que compararam as respostas de neurónios do CI a complexos harmónicos com a mesma fase e de fase alternada sugerem que estas células sejam capazes de responder à periodicidade do nível de energia global (ou seja, o envelope), em vez da frequência de modulação verdadeira. Ainda assim, não é evidente se tal se aplica apenas para harmónicos não resolvidos (como seria previsto por experiências psicofísicas) ou também para harmónicos resolvidos[5]. Ainda existem bastantes incertezas em relação à representação da periodicidade no CI.

Codificação da altura do som no córtex auditivo

[editar | editar código-fonte]

Assim, existe a tendência para realçar as representações de F0 ao longo do sistema auditivo ascendente, embora a natureza precisa deste se mantenha pouco clara. Por outro lado, nos pontos sub-corticais da via auditiva ascendente, não existe evidência para uma representação explícita que consistentemente codifique informação relativa à altura percepcionada. Provavelmente, tais representações ocorrem em regiões auditivas ‘superiores’, a partir do córtex auditivo primário.

De facto, estudos relativos a lesões auditivas demonstraram a importância do córtex auditivo para a percepção da altura. Obviamente, a incapacidade na detecção da altura do som no seguimento de lesões no córtex auditivo pode simplesmente refletir uma função passiva de transmissão para o córtex: por onde a informação subcortical tem de passar para afetar o comportamento. Ainda assim, estudos como os desenvolvidos por Whitfield demonstraram que, provavelmente, tal não será o que se verifica na realidade: enquanto gatos aos quais fora removido o córtex auditivo (por ablação) podiam ser re-treinados para reconhecer tons complexos formados por três frequências distintas, os animais perderam seletivamente a habilidade de generalizar estes tons para outros sons complexos com a mesma altura[15]. Por outras palavras, enquanto a composição harmónica podia influenciar o comportamento, relações harmónicas (tais como sugestões relativas à altura do som) não tinham esta capacidade. Por exemplo, o animal lesionado conseguia responder corretamente a um tom puro de 100Hz, mas não a um tom complexo composto pelos seus sobre-tons harmónicos (a 200Hz, 300Hz, e assim sucessivamente). Esta observação sugere que o córtex auditivo tem um papel fundamental na extração de informação relativa à altura do som.

Estudos primários com Magnetoencefalografia (MEG) sugeriram que A1 continha um mapa da altura. Esta conclusão baseou-se nas observações de que um tom puro e o seu complexo harmónico com a frequência fundamental ausente (FFA) produzia uma excitação resultante de estímulo externo (chamada N100m) no mesmo local, enquanto que as componentes das frequências do harmónico com FFA apresentadas individualmente produziam excitações em locais distintos[16]. Ainda assim, estas noções foram encobertas por resultados experimentais que recorreram a técnicas com maior resolução espacial: Potencial de campo local (PCL) e Registo de Multi-Unidades (RMU) demonstraram que o mapeamento de A1 era tonotópico - isto é, baseado na melhor frequência (MF) dos neurónios, em vez da melhor ‘altura’[17]. Ainda assim, estas técnicas demonstram a emergência de mecanismos de codificação distintos para a extração de sugestões temporais e espaciais: a representação de fase fixa da taxa de repetição do envelope temporal era registada nas regiões de MF superiores do mapa tonotópico, enquanto a estrutura harmónica da sequência de cliques era representada em regiões de MF inferiores[18]. Assim, as sugestões para a extração da altura do som podem ser potenciadas a este nível.

Ilustração esquemática de neurónios com multi-picos. A linha ponteada azul mostra a curva do tom genérica para uma frequência com um neurónio específico de uma frequência ‘mono-pico’ com a melhor frequência (MF) a aproximadamente 500Hz, como ilustrado pela resposta máxima do neurónio para frequências em torno deste valor. A linha vermelha mostra uma resposta esquemática de um neurónio que responde a várias frequências (‘multi-pico’) identificado por Kadia e Wang (2003). Além da MF a 300Hz, este neurónio também é estimulado por tons a 600Hz e 900Hz - ou seja, frequências em relação harmónica à MF principal. Embora não seja ilustrado aqui, as respostas deste tipo de neurónios a harmónicos complexos (neste caso, compostos pelas frequências 300, 600 e 900Hz) têm usualmente um efeito aditivo, gerando respostas mais intensas do que para um tom puro à frequência correspondente a MF (neste caso, 300 Hz), isoladamente. Ver referência [18]

Um exemplo de um substrato neuronal que poderá facilitar um reforço deste tipo foi descrito por Kadia e Wang, em relação ao córtex auditivo primário de Saguis [19]. Cerca de 20% dos neurónios nesta região podiam ser classificados como unidades ‘multi-pico’: neurónios que têm múltiplas áreas de resposta à frequência, geralmente em relação harmónica (ver figura à direita). Além disso, a excitação de dois destes picos espectrais apresentou um efeito sinergético nas respostas dos neurónios. Tal efeito iria assim facilitar a extração de tons relacionados harmonicamente no estímulo acústico, permitindo a estes neurónios actuar como ‘modelos harmónicos’ para a extração de sugestões espectrais. Adicionalmente, estes autores observaram que, na maioria dos neurónios ‘mono-pico’ (isto é, neurónios com um único pico espectral na região da MF), um tom secundário podia ter um efeito modulatório, facilitando ou inibindo, a resposta do neurônio à sua MF. De novo, estas frequências modulatórias estavam geralmente relacionadas harmonicamente com a MF. Estes mecanismos facilitadores podem assim acomodar a extração de certos componentes harmónicos e rejeitar outros por modulação inibitória, permitindo a distinção entre outros complexos harmónicos e não harmónicos (tais como ruído de banda larga).

'Regiões de altura’ potenciais no plano supra-temporal no ser humano. (A) Visão lateral do hemisfério esquerdo, com o Giro superior temporal (GST) indicado a vermelho. (B–D) Visão superior do plano supra-temporal esquerdo, após remoção de grande parte do córtex parietal. PP, GH, e PT estão indicados a azul, amarelo e verde, respetivamente. Os Sulcos major (major sulci) estão indicados a preto (FTS refere-se ao primeiro sulco transverso; SI ao sulco intermédio ou sulcus intermediate; HS ao Sulco de Heschl; HS1 ao Primeiro sulco de Heschl; HS2 ao segundo sulco de Heschl). As figuras incluem hemisférios com um GH, uma separação incompleta de GH e dois GH em (B-D), respetivamente.

Contudo, dado que a tendência para reforçar F0 foi demonstrada ao longo de todo o sistema auditivo sub-cortical, poderia esperar-se que se estaria perto de uma representação mais explícita da altura no córtex. Experiências com recurso a neuroimagiologia exploraram esta ideia, considerando uma qualidade emergente da altura: um método subtractivo consegue identificar áreas no cérebro que mostram respostas BOLD em relação a estímulos que produzem respostas à altura, mas não a outro som com propriedades espectrais muito semelhantes, mas que não provoca uma percepção à altura. Estas estratégias foram utilizadas por Patterson, Griffiths e colegas: ao subtrair o sinal BOLD adquirido durante a apresentação de ruído de banda-larga ao sinal adquirido durante a apresentação do ROI, foi possível identificar uma ativação seletiva do giro Heschl (GH) lateral (e, em parte, medial) em resposta à última classe de sons que produzem uma resposta a altura[20]. Além disso, ao variar a taxa de repetição do ROI ao longo do tempo foi possível criar uma melodia que produziu uma ativação adicional no giro superior temporal (GST) e plano polar (planum polare, PP), sugerindo um processamento hierárquico da altura do som ao longo do córtex auditivo. Do mesmo modo, os registos de MEG por Krumbholz et al. mostraram que, à medida que a taxa do estímulo de ROI aumenta, um estímulo N100m novo era detectado na região do GH à medida que a taxa de repetição atravessa o limiar inferior para a percepção da altura, e a magnitude desta ‘resposta à altura’ aumentava com a saliência da altura[21].

Ainda assim, existe alguma controvérsia relativamente à localização precisa da área seletiva da altura do som. Como referiram Hall e Plack, o uso exclusivo de estímulos de ROI para identificar áreas corticais sensíveis à altura é insuficiente para captar a vasta gama de estímulos que podem induzir uma resposta à altura: a ativação do GH pode ser específica a estímulos de banda-larga repetitivos[22]. De facto, com base nos sinais BOLD observados em resposta a vários estímulos que induzem resposta à altura, Hall e Plack sugeriram que o plano temporal (planum temporale, PT) é mais relevante para o processamento da altura.

Embora se observe um desacordo sobre a área neural exata especializada na codificação da altura, este tipo de evidência sugere que regiões entre a zona anterolateral e A1 possam ser especializadas para a percepção da altura. Um suporte adicional para esta noção é dado pela identificação de neurónios que respondem a alturas específicas na borda anterolateral de A1 no córtex auditivo do sagui. Estes neurónios respondiam selectivamente a tons puros e harmónicos com F0 ausente com periodicidades semelhantes[23]. Muitos destes neurónios também eram sensíveis à periodicidade de outros estímulos que produziam resposta à altura, tais como sequências de cliques ou ROI. Estas observações constituem uma forte evidência para o facto de estes neurónios não apresentarem uma resposta a qualquer componente particular de um sinal acústico, mas representam especificamente informação relacionada com a altura do som.

Codificação da Periodicidade ou codificação da altura?

[editar | editar código-fonte]

Existe uma evidência crescente que sugere que existem neurónios e áreas neurais especializadas em extrair F0, provavelmente, em zonas antero-laterais a regiões de MF inferiores de A1. Contudo, existe alguma dificuldade em designar estes neurónios ou áreas como ‘seletivas à altura’. Enquanto o estímulo F0 é indiscutivelmente um elemento determinante da altura do som, não é necessariamente equivalente à altura percepcionada pelo ouvinte.

Ainda assim, existem algumas evidências que sugerem que estas regiões são efetivamente responsáveis por codificar a altura e não apenas F0. Por exemplo, investigações mais detalhadas das unidades selectivas da altura do som em Saguis realizadas por Bendor e os seus colegas demonstraram que a atividade nestes neurónios corresponde fielmente às respostas psicofísicas dos animais[8]. Estes autores testaram as habilidades dos animais para detectar um complexo harmónico de fase alternada entre a apresentação de harmónicos com a mesma fase à mesma frequência F0, a fim de distinguir em que situações os animais recorriam às sugestões dos envelopes temporais para a percepção da altura, em vez de sugestões espectrais. De acordo com experiências psicofísicas em humanos, os saguis usavam primariamente sugestões de envelopes temporais de ordem superior, harmónicos não resolvidos de frequência F0 baixa, enquanto sugestões espectrais eram usadas para extrair a altura de harmónicos de ordem inferior de complexos de F0 elevada. Registos destes neurónios selectivos a altura mostraram que o ajuste de F0 ocorria uma oitava abaixo para harmónicos de fase alternada, em comparação com harmónicos com a mesma fase em neurónios ajustados para frequências F0 baixas. Estes padrões de resposta neuronais são consistentes com os resultados psicofísicos, sugerindo que quer as sugestões temporais e espectrais são integradas nestes neurónios para influenciar a percepção da altura.

Ainda assim, de novo, este estudo não conseguiu distinguir definitivamente se estes neurónios que respondem a alturas específicas conseguem representar a altura explicitamente ou simplesmente integram informação sobre F0 que será posteriormente descodificada para percepcionar a altura. Uma abordagem mais direta para analisar este tópico foi apresentada por Bizley et al, que analisaram como medições do córtex auditivo PCL e RMU em furões podiam ser usados independentemente para estimar o estímulo F0 e a percepção da altura[24]. Enquanto os furões eram envolvidos numa tarefa de discriminação da altura (para indicar se um som de uma vogal artificial era superior ou inferior em altura a uma referência num paradigma de 2-escolhas forçadas), uma análise da Característica de Operação de Receptor (COR) foi usada para estimar a discriminabilidade da atividade neural em prever a alteração de F0 ou a escolha efetiva resultante (como representação da altura percepcionada). Descobriram que as respostas neurais ao longo do córtex auditivo eram informativas em relação a ambos. Inicialmente, a atividade permitia distinguir melhor F0 do que a escolha do animal, mas a informação relativa à escolha do animal aumentava consistentemente ao longo do intervalo pós-estímulo, tornando-se eventualmente mais discriminável do que a direção da alteração de F0[24].

Comparando as diferenças em COR entre as áreas corticais estudadas, mostrou-se que campos posteriores de atividade permitiam discriminar melhor a escolha dos furões. Este resultado pode ser interpretado de duas formas. Visto que a atividade relacionada com a escolha era superior nos campos posteriores (que se encontram na borda inferior MF de A1), em comparação com os campos primários, tal pode ser entendido como uma evidência adicional para a seletividade para a altura perto da borda MF inferior de A1. Por outro lado, o facto de informação relacionada com a altura também ser observada nos campos auditivos primários pode sugerir que informação suficiente relacionada com a altura esteja já estabelecida neste nível, ou que um código distribuído ao longo de várias áreas auditivas codifiquem a altura. De facto, enquanto neurónios individuais distribuídos ao longo do córtex auditivo são geralmente sensíveis a vários parâmetros acústicos (e, portanto, não respondem especificamente à altura), informação teórica ou análises neurométricas (usando dados neurais para inferir informação relacionada com o estímulo sonoro) indicam que a informação da altura pode ser representada de forma robusta através de codificação de populações, ou até por neurónios individuais através de multiplexação temporal (isto é, representando várias características do som em diferentes janelas temporais)[25][26]. Assim, na ausência de estimulação ou desativação destas potenciais áreas ou neurónios específicos para altura do som para demonstrar que tais intervenções produzem desequilíbrios previsíveis ou enfraquecimentos na altura, pode supor-se que a altura seja representada temporalmente e espacialmente através de códigos distribuídos ao longo do córtex, em vez de recorrer a representações locais especializadas.

Assim, quer registos electrofisiológicos quer estudos de neuro-imagiologia sugerem que exista um código neural explícito para a altura que se encontra perto da borda MF inferior de A1. Definitivamente, as respostas seletivas e consistentes a uma larga gama de estímulos que induzem uma resposta à altura sugerem que estas potenciais áreas e neurónios específicos para a altura não estão simplesmente a reflectir qualquer característica física do sinal acústico que está disponível de imediato. Além disso, existe evidência que estes potenciais neurónios que respondem à altura são capazes de extrair informação de sugestões espectrais e temporais da mesma forma que os animais. Contudo, por virtude de uma relação abstrata entre a altura e o sinal acústico, esta correlação entre um estímulo e uma resposta neural só pode ser interpretada como evidência de que o sistema auditivo tem a capacidade de formar representações melhoradas de parâmetros relacionados com a altura. Sem uma evidência causal mais direta para estes potenciais neurónios que respondem especificamente à altura e áreas neurais que determinam a percepção à altura, não é possível concluir se os animais recorrem efetivamente a códigos localizados explicitamente para altura, ou se as representações distribuídas e robustas da altura ao longo do córtex auditivo definem a codificação final da altura no sistema auditivo.

  1. NeurOreille and authors (2010). Viagem ao mundo da audição.
  2. Schouten, J. F. (1938). The perception of subjective tones. Proceedings of the Koninklijke Nederlandse Akademie van Wetenschappen, 41, 1086-1093.
  3. Cynx, J. & Shapiro, M. Perception of missing fundamental by a species of songbird (Sturnus vulgaris). J Comp Psychol 100, 356–360 (1986).
  4. Heffner, H., & Whitfield, I. C. (1976). Perception of the missing fundamental by cats. The Journal of the Acoustical Society of America, 59(4), 915-919.
  5. 5,0 5,1 5,2 5,3 5,4 Schnupp, J., Nelken, I. & King, A. Auditory neuroscience: Making sense of sound. (MIT press, 2011).
  6. Gerlach, S., Bitzer, J., Goetze, S. & Doclo, S. Joint estimation of pitch and direction of arrival: improving robustness and accuracy for multi-speaker scenarios. EURASIP Journal on Audio, Speech, and Music Processing 2014, 1 (2014).
  7. Carlyon RP, Shackleton TM (1994). "Comparing the fundamental frequencies of resolved and unresolved harmonics: Evidence for two pitch mechanisms?" Journal of the Acoustical Society of America 95:3541-3554
  8. 8,0 8,1 Bendor D, Osmanski MS, Wang X (2012). "Dual-pitch processing mechanisms in primate auditory cortex," Journal of Neuroscience 32:16149-61.
  9. Tramo, M. J., Shah, G. D., & Braida, L. D. (2002). Functional role of auditory cortex in frequency processing and pitch perception. Journal of Neurophysiology, 87(1), 122-139.
  10. Rask-Andersen, H., Tylstedt, S., Kinnefors, A., & Illing, R. B. (2000). Synapses on human spiral ganglion cells: a transmission electron microscopy and immunohistochemical study. Hearing research, 141(1), 1-11.
  11. Cariani, P. A., & Delgutte, B. (1996). Neural correlates of the pitch of complex tones. I. Pitch and pitch salience. Journal of Neurophysiology, 76(3), 1698-1716.
  12. Oxenham, A. J., Bernstein, J. G., & Penagos, H. (2004). Correct tonotopic representation is necessary for complex pitch perception. Proceedings of the National Academy of Sciences of the United States of America, 101(5), 1421-1425.
  13. Winter, I. M., Wiegrebe, L., & Patterson, R. D. (2001). The temporal representation of the delay of iterated rippled noise in the ventral cochlear nucleus of the guinea-pig. The Journal of physiology, 537(2), 553-566.
  14. Schreiner, C. E. & Langner, G. Periodicity coding in the inferior colliculus of the cat. II. Topographical organization. Journal of neurophysiology 60, 1823–1840 (1988).
  15. Whitfield IC (1980). "Auditory cortex and the pitch of complex tones." J Acoust Soc Am. 67(2):644-7.
  16. Pantev, C., Hoke, M., Lutkenhoner, B., & Lehnertz, K. (1989). Tonotopic organization of the auditory cortex: pitch versus frequency representation.Science, 246(4929), 486-488.
  17. Fishman YI, Reser DH, Arezzo JC, Steinschneider M (1998). "Pitch vs. spectral encoding of harmonic complex tones in primary auditory cortex of the awake monkey," Brain Res 786:18-30.
  18. Steinschneider M, Reser DH, Fishman YI, Schroeder CE, Arezzo JC (1998) Click train encoding in primary auditory cortex of the awake monkey: evidence for two mechanisms subserving pitch perception. J Acoust Soc Am 104:2935–2955.
  19. Kadia, S. C., & Wang, X. (2003). Spectral integration in A1 of awake primates: neurons with single-and multipeaked tuning characteristics. Journal of neurophysiology, 89(3), 1603-1622.
  20. Patterson RD, Uppenkamp S, Johnsrude IS, Griffiths TD. (2002) "The processing of temporal pitch and melody information in auditory cortex," Neuron 36:767-776.
  21. Krumbholz, K., Patterson, R. D., Seither-Preisler, A., Lammertmann, C., & Lütkenhöner, B. (2003). Neuromagnetic evidence for a pitch processing center in Heschl’s gyrus. Cerebral Cortex, 13(7), 765-772.
  22. Hall DA, Plack CJ (2009). "Pitch processing sites in the human auditory brain," Cereb Cortex 19(3):576-85.
  23. Bendor D, Wang X (2005). "The neuronal representation of pitch in primate auditory cortex," Nature 436(7054):1161-5.
  24. 24,0 24,1 Bizley JK, Walker KMM, Nodal FR, King AJ, Schnupp JWH (2012). "Auditory Cortex Represents Both Pitch Judgments and the Corresponding Acoustic Cues," Current Biology 23:620-625.
  25. Walker KMM, Bizley JK, King AJ, and Schnupp JWH. (2011).Multiplexed and robust representations of sound features in auditory cortex. Journal of Neurosci 31(41): 14565-76
  26. Bizley JK, Walker KM, King AJ, and Schnupp JW. (2010). "Neural ensemble codes for stimulus periodicity in auditory cortex." J Neurosci 30(14): 5078-91.